0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Архитектура AMD Hammer

Взгляд в будущее: процессоры AMD Hammer и технология x86-64


Введение

Некоторое время тому назад мы узнали о том, что AMD готовит к выпуску новое процессорное ядро, называемое тогда еще K8 (K7 — Athlon). Тогда вообще мало кто чего знал об этом ядре. Со временем стали выясняться подробности, одна из которых была просто-таки шокирующей — K8 оказался 64-битным процессором. Удивление это вызывало потому, что единственным на то время 64-битным процессором, о котором имелись сведения, был Intel Itanium — монстр, построенный из огромного количества транзисторов, обладающий не-x86 архитектурой и стоящий бешеных денег. Возник вопрос — неужели AMD готовит нечто подобное? Как выяснилось со временем — совсем нет. Процессор K8, позже названный Hammer, в общем-то, похож на существующий Athlon XP, но в то же время отличается от него весьма значительно. Всплыло и название архитектуры, которую применила AMD в Hammer — «x86-64», то есть 64-битная x86 (по аналогии с x86-32). В данной статье мы попробуем разобраться, что такое x86-64, Hammer и чем он отличается от Athlon, от Pentium 4 и Itanium.

Но для начала зададимся вопросом — а зачем вообще нужны 64-битные процессоры? Ответ прост — современные приложения порой стали ставить перед вычислительной техникой чрезвычайно ресурсоемкие задачи. В частности, оперативная память в 4 Гбайт уже перестает быть чем-то недостижимо огромным. Почему именно 4 Гбайта? Очень просто — 32-битный процессор и адресовать память может только 32 разрядами, то есть максимальный объем памяти в современных x86 системах составляет 2 32 = 4 297 967 296 байт = 4 Гбайта. Тут надо заметить, что Xeon’ы могут эмулировать 36-битную адресацию, то есть адресовать до 64 Гбайт, однако такие ухищрения не лучшим образом сказываются на производительности, к тому же максимальная память, которую может использовать один поток приложения составляет все те же 4 Гбайта. В частности для того, чтобы преодолеть это ограничение, люди и стали задумываться о построении 64-битных процессоров.

Основные принципы x86-64 архитектуры

x86-64 — 64-битная архитектура, разработанная AMD для своих процессоров семейства Hammer. В отличие от 64-битной архитектуры IA64, примененной в процессорах Intel Itanium, x86-64 базируется на существующей архитектуре x86-32. Следовательно, процессор, построенный на основе x86-64, может безо всяких проблем исполнять существующие 32-битные приложения, которых написано на текущий момент, как вы понимаете, просто немеряно (и в них, кстати, зачастую вложены очень большие деньги). Причем, эти приложения могут выполняться без каких бы то ни было потерь в производительности в отличие от того же Intel Itanium, где x86-32 систему команд приходится эмулировать. Таким образом, для того, чтобы начать эксплуатировать Hammer-системы, не придется ждать, когда производители программного обеспечения соблаговолят перекомпилировать свои продукты для новой платформы. Наоборот, новый процессор AMD имеет все преимущества своих предшественников, однако добавляет к ним некоторые дополнительные возможности, которые можно будет задействовать впоследствии.

Данная стратегия выбрана AMD не случайно — в отличие от Intel, который может чуть ли не силой навязывать переход на нечто новое (вспомним Rambus или многообразие Socket’ов, одновременно поддерживаемых этой компанией), AMD сохраняет совместимость со старыми продуктами (вспомним опять же, срок жизни Socket A). Примерно такой же подход применен AMD и при разработке своей 64-битной архитектуры.

Как же реализуется 64-битность в Hammer? Очень просто: в этом процессоре к имеющейся системе регистров будет добавлено несколько новых регистров, а существующие — расширены:

Как видите, привычные регистры общего назначения (GPR) дополнены еще 8 регистрами R8-R15, используемыми в 64-битном режиме (то есть для их задействования потребуется перекомпиляция программ), а существующие EAX, EBX и т.д. расширены с 32 до 64 бит. Также, 8 новых регистров добавлено в блок SSE, что обеспечит поддержку SSE2. Увеличение количества регистров призвано повысить производительность ресурсоемких приложений, например, в программах научных расчетов (кстати, это вообще сильное место процессоров AMD, начиная с K7).

Расширение существующих регистров показано на вот этом рисунке:

Как видите, расширение EAX до RAX — то же самое, что расширение AX до EAX — процесс, который мы имели возможность наблюдать 15 лет назад, когда был выпущен процессор i386. Как вы помните, i386 замечательно справлялся с 16-битными приложениями, написанными для i286 — предыдущего поколения микропроцессоров Intel. Примерно так же Hammer будет справляться с 32-битным кодом: просто в этом случае процессор будет работать, что называется «не в полную силу».

Для реализации одновременной работы как с 32-битным, так и с 64-битным кодом и регистрами x86-64 предполагает поддержку процессором 2-х режимов: Long Mode, «длинного» режима с двумя подрежимами — 64-битным и Compatibility mode (режим совместимости) и Legacy Mode (наследственного режима). Что они собой представляют, можно понять из таблицы:

AMD Hammer Architecture — Engineering bibliographies — in Harvard style

Popular

These are the sources and citations used to research AMD Hammer Architecture. This bibliography was generated on Cite This For Me on Tuesday, December 8, 2015

AMD64 Architecture Programmer’s Manual

In-text: (AMD64 Architecture Programmer’s Manual, 2015)

Your Bibliography: AMD Support. 2015. AMD64 Architecture Programmer’S Manual. [online] Available at: [Accessed 8 December 2015].

Overview of the AMD64 Architecture

In-text: (Overview of the AMD64 Architecture, 2005)

Your Bibliography: AMD. 2005. Overview Of The AMD64 Architecture. [online] Available at: [Accessed 8 December 2015].

Intel® 64 and IA-32 Architectures Optimization Reference Manual

In-text: (Intel® 64 and IA-32 Architectures Optimization Reference Manual, 2015)

Your Bibliography: Intel. 2015. Intel® 64 And IA-32 Architectures Optimization Reference Manual. [online] Available at: [Accessed 8 December 2015].

Keltcher, C.

The AMD Hammer Processor Core

In-text: (Keltcher, 2002)

Your Bibliography: Keltcher, C., 2002. The AMD Hammer Processor Core. [online] Wayne State University. Available at: [Accessed 8 December 2015].

McGrath, K. and Christie, D.

The AMD x86-64 Architecture Extending the x86 to 64 bits

In-text: (McGrath and Christie, 2015)

Читать еще:  Cambridge Soundworks DTT2500

Your Bibliography: McGrath, K. and Christie, D., 2015. The AMD X86-64 Architecture Extending The X86 To 64 Bits. [online] Hot Chips. Available at: [Accessed 8 December 2015].

Shimpi, A.

AMD’s Hammer Architecture — Making Sense of it All

In-text: (Shimpi, 2001)

Your Bibliography: Shimpi, A., 2001. AMD’s Hammer Architecture — Making Sense Of It All. [online] Anandtech.com. Available at: [Accessed 8 December 2015].

Stokes, J.

Inside AMD’s Hammer: the 64-bit architecture behind the Opteron and Athlon 64

In-text: (Stokes, 2005)

Your Bibliography: Stokes, J., 2005. Inside AMD’s Hammer: The 64-Bit Architecture Behind The Opteron And Athlon 64. [online] Ars Technica. Available at: [Accessed 8 December 2015].

X86-64

In-text: (X86-64, 2015)

Your Bibliography: Wikipedia. 2015. X86-64. [online] Available at: [Accessed 8 December 2015].

Popular

Save Time and Improve Your Marks with Cite This For Me

10,587 students joined last month!

  • ✔ Save your bibliographies for longer
  • ✔ Quick and accurate citation program
  • ✔ Save time when referencing
  • ✔ Make your student life easy and fun
  • ✔ Pay only once with our Forever plan
  • ✔ Use plagiarism checker
  • ✔ Create and edit multiple bibliographies

Наши коментарии к первым тестам процессора AMD Hammer (Opteron)

На проходящей в сейчас Тайване выставке Computex 2002, кроме всего прочего, демонстрируются прототипы процессоров и материнских плат. Все производители чипсетов (разумеется, кроме Intel) показывали свои модели для K8: ALi 1687, Nvidia CK8, SiS 755, VIA K8HTA. Также о поддержке процессоров AMD Hammer в своих интегрированных чипсетах Radeon IGP официально объявила ATI. Почти каждый крупный производитель материнских плат имел на своем стенде прототипы плат для Hammer’а.

Репортерам из авторитетного немецкого издания Tecchannel.de удалось протестировать работающую систему, хотя им дали всего один час времени (и на том спасибо, ведь это было против желания официального руководства AMD).

В тесте использовалась материнская плата AMD Solo 2 на чипсете AMD 8000. Текущие версии процессора заблокированы на частоте 800 МГц и оснащены только 256 килобайт кэша второго уровня. (Подробней об архитектуре — в наших предыдущих материалах).

Операционная система Windows XP Professional путалась с определением названия и частоты процессора.

Тогда как System info выдавала:

Заметьте, что признанная утилита распознавания процессора WCPUID не выдает характеристик системной шины. Причина кроется в том, что Hammer использует нестандартную архитектуру Front Side Bus, у него она реализована через HyperTransport.

Также обратите внимание на присутствие поддержки инструкций Intel SSE2.

Для объективного сравнения производительности новой архитектуры, приводятся результаты «downclocked» до 800 МГц Athlon MP на шине 266 (133 DDR) МГц и Pentium 4 Willamette на шине 400 (100 QP) МГц. К сожалению, не было возможности исследовать производительность в 64-х битной среде, так что все приведенные результаты основаны на стандартом 32-х разрядном ПО.

Общей чертой систем было: Win XP Pro, Geforce 3 (Detonator driver XP 28.32) и 256 МБайт памяти.

Для начала, Quake 3. Хотя его можно назвать уже несколько устаревшим, но из-за его сильной зависимости от пропускной способности, по его результатам можно определить вклад интегрированного в Hammer контроллера памяти. Как видно на графике, архитектура К8 на 40 процентов превзошла Athlon MP (ядро Palomino). Более того, ранний прототип ClawHammer умудрился вырваться вперед Pentium 4, работающего на вдвое большей частоте в его «любимом» тесте.

(*) BIOS материнской платы AMD Solo 2 не позволил установить более агрессивные настройки таймингов памяти (Athlon’у MP это дает четыре процента прироста fps).

Далее был проведен синтетический тест памяти (подробности смотрите здесь). Главное, что можно уяснить из тестов, то, что пропускная способность 166 Мгц DDR памяти (теоретическая – 2700 МБайт/сек) на интегрированном контроллере памяти ClawHammer’а сравнялась с традиционным лидером — PC800 RDRAM на P4/i850 (теоретическая – 3200 МБайт/сек).

Несмотря на то, что репортерам удалось провести только эти два теста, они говорят о многом:
1. Платформа была реально стабильна, не разу не дав сбоя во время интенсивного тестирования.
2. Как и было обещано, архитектура полностью совместима с 32-битным программным обеспечением.
3. Более того, в 32-х битной ОС с серийными, не оптимизированными драйверами видеокарты; консервативными настройками памяти; прототип ClawHammer с вдвое меньшим размером кэша (по отношению с обещанными 512 КБ) обошел Athlon MP на 41% (при равной частоте)!
4. Тестируемый процессор охлаждался кулером с алюминиевым радиатором и относительно тихим вентилятором. Несмотря на такой слабый теплоотвод, на ощупь радиатор оставался теплым. Предположительно, то, что процессор остается «прохладным», выдавая 183 fps в Quake 3, в большей степени обязано низкому энергопотреблению ядра и 0,13 мкм SOI техпроцессу (и конечно, низкой частоте).

Представители AMD никак не прокомментировали эти результаты, хотя некоторые их раннее высказанные коментарии можно вспомнить:
• «У AMD нет проблем с переходом на новый 0,13 мкм SOI процесс, если бы они были, то этого не стали бы скрывать, как не скрывали проблемы во время перехода на К6»;
• «Процессор находится в стадии ранней настройки, предоставить Вам наши тесты его производительности, значит, раздать целую кипу бумаг с результатами и диаграммами…» (со слов Richard Heye, вице-президента по платформам и инфраструктурному инжинирингу AMD).

Итак, такие результаты очень и очень сильно впечатляют.

Архитектурно, K8 – это эволюция Athlon’а. Но для потребителей, тот факт, что в нем будут удалены все слабые (не столь сильные) стороны Athlon XP: упаковка обретет heat spreader, появиться поддержка SSE2, существенно улучшиться работа с памятью – имеет все шансы произвести революцию на рынке.

И пока все происходящее говорит о том, что в конце года the world will change.

AMD64

AMD64 (также x86-64/Intel64/EM64T/x64) — 64-битная архитектура микропроцессора и соответствующий набор инструкций, разработанные компанией AMD. Это расширение архитектуры x86 с полной обратной совместимостью. Набор инструкций x86-64 в настоящее время поддерживается процессорами AMD Athlon 64, Athlon 64 FX, Athlon 64 X2, Phenom, Turion 64, Sempron. Этот набор инструкций был лицензирован основным конкурентом AMD — компанией EM64T (Intel 64) (ранее известные как EM64T и IA-32e) в поздних моделях процессоров Pentium 4, а также в Pentium D, Pentium Extreme Edition, Celeron D, Core 2 Duo и Microsoft и Sun Microsystems используют для обозначения этого набора инструкций термин x64, однако, каталог с файлами для архитектуры в дистрибьютивах Microsoft называется amd64 (ср. i386 для архитектуры x86).

Читать еще:  Лучшие медиа-проигрыватели. Часть 1

Содержание

Как правильно называть

Существует несколько вариантов названий этой технологии, которые, порой, приводят к путанице и могут ввести пользователя в заблуждение.

  • x86-64. Первоначальный вариант. Именно под этим названием фирмой AMD была опубликована первая предварительная спецификация.
  • AA-64. Так архитектуру окрестил популярный неофициальный справочник IA-64, и по-прежнему так её называющий, как AMD Architecture 64.
  • Hammer Architecture. Иногда встречалось название по первым разрабатываемым ядрам процессоров, получившим названия Clawhammer (гвоздодёр) и Sledgehammer (кувалда) иногда называемых просто Hammer (молоток).
  • AMD64. После выпуска первых Hammer’ов в названии архитектуры появилось название фирмы-разработчика Advanced Micro Devices. Сейчас является официальным для реализации AMD.
  • Yamhill Tehnology. Первое название
  • EM64T. Первое официальное название реализации Intel. Расшифровывалось как Extended Memory 64 Technology.
  • IA-32e. Иногда встречалось совместно с EM64T, чаще для обозначения длинного режима, который в документации Intel называется «режимом IA-32e».
  • Intel 64. Текущее официальное название архитектуры Intel. Постепенно Intel отказывается от наименований IA-32, IA-32e и EM64T в пользу этого названия, которое теперь является единственным официальным для этой архитектуры.
  • x64 Официальное название версий операционных систем Windows и Solaris, также используемое как название архитектуры фирмами Sun Microsystems.

На сегодняшний день наиболее распространёнными являются AMD64, x86-64 и x64. Порой упоминание AMD вводит пользователей в заблуждение, вплоть до того, что они отказываются скачивать дистрибутивы родных версий ОС, мотивируя это тем, что на их Intel-процессоре версия для AMD не пойдёт. На самом деле распространители ПО используют название amd64 лишь потому, что именно AMD была пионером в разработке этой технологии. Бывает, что пользователи путают архитектуру Intel 64 с IA-64, ошибочно скачивая ПО для этой архитектуры, и с удивлением обнаруживают, что программа не запускается. Во избежание подобных ошибок, всегда следует помнить, что Intel 64 и . Представители Intel 64 — это Pentium 4 (последние модели), ряд моделей Celeron D, семейство Core 2 и некоторые модели Intel Atom. Представители IA-64 — это семейства Itanium 2.

Режимы работы

Процессоры архитектуры поддерживают два режима работы: Long mode («длинный» режим) и Legacy mode («наследственный», режим совместимости с x86).

Long Mode

«Длинный» режим — «родной» для процессоров AMD64. Этот режим позволяет воспользоваться всеми дополнительными возможностями, предоставляемыми архитектурой AMD64. Для использования этого режима необходима 64-битная операционная система, например, Windows XP Professional x64 Edition,Windows Vista x64 или 64-битные варианты GNU/Linux, Solaris (смешаная 32/64 сборка с разными ядрами для 32- и 64-битных процессоров), Mac OS X (смешанная 32/64 сборка с 32-битным ядром, начиная с версии 10.4.7). Этот режим позволяет выполнять 64-битные программы; также (для обратной совместимости) предоставляется поддержка выполнения 32-битного кода, например, 32-битных приложений, хотя 32-битные программы не смогут использовать 64-битные системные библиотеки, и наоборот. Чтобы справиться с этой проблемой, большинство 64-разрядных операционных систем предоставляют два набора необходимых системных файлов: один — для родных 64-битных приложений, и другой — для 32-битных программ. (Этой же методикой пользовались ранние 32-битные системы — например, Windows 95 — для выполнения 16-битных программ). В «длинном» режиме упразднен ряд «рудиментов» архитектуры 8086, сегментированная модель памяти (однако, осталась возможность использования сегментов FS и GS, что полезно для быстрого нахождения важных данных потока при переключении задач), аппаратная мультизадачность, а также ряд команд, как реализующих упраздненные возможности, так и работающие с BCD-числами, которые в новых программах практически не использовались. Среди особенностей «длинного» режима, следует отметить тот факт, что он активируется установкой флага CR0.PG, который используется для включения страничного MMU (при условии что такое переключение разрешено (EFER.LME=1), в противном случае просто произойдет включение MMU в «наследственном» режиме). Таким образом, невозможно исполнение 64-битного кода с запрещенным страничным преобразованием. Это создает определенные трудности в программировании, поскольку при переключении из «длинного» в «наследственный» режим и обратно (например, для вызова функций DOS, монитором виртуальной машины, и т. д.) требуется двойной сброс MMU, для чего код переключения должен находиться в тождественно отображённой странице.

Legacy Mode

Данный «наследственный» режим позволяет процессору AMD64 выполнять инструкции, рассчитанные для процессоров x86, и предоставляет полную совместимость с 32/16-битным кодом и операционными системами. В этом режиме процессор ведёт себя точно так же, как x86-процессор, например Pentium 4, и дополнительные функции, предоставляемые архитектурой AMD64 (например, дополнительные регистры) недоступны. В этом режиме 64-битные программы и операционные системы работать не будут (если, конечно, не используется виртуализация).

Особенности архитектуры

Разработанный компанией AMD набор инструкций x86-64 (позднее переименованный в AMD64) — расширение архитектуры Intel IA-32 (x86-32). Основной отличительной особенностью AMD64 является поддержка 16-ти 64-битных регистров общего назначения (против 8-и 32-битных в x86-32), 64-битных арифметических и логических операций над целыми числами и 64-битных виртуальных адресов. Для адресации новых регистров для команд введены так называемые «префиксы расширения регистра», для которых был выбран диапзон кодов 40h-4Fh, использующихся для команд INC и DEC в 32- и 16-битных режимах. Команды INC и DEC в 64-битном режиме должны кодироваться в более общей, двухбайтовой форме.

Архитектура x86_64 имеет:

  • 16 целочисленных 64-битных регистра общего назначения (RAX, RBX, RCX, RDX, RBP, RSI, RDI, RSP, R8 — R15),
  • 8 80-битных регистров с плавающей точкой (ST0 — ST7),
  • 8 64-битных регистров (MM0 — MM7, имеют общее пространство с регистрами ST0 — ST7),
  • 16 128-битных регистров
  • 64-битный указатель RIP и 64-битный регистр флагов RFLAGS.

Смерть и возрождение сегментной модели организации памяти

Разрабатывая архитектуру x86-64, инженеры корпорации AMD решили навсегда покончить с главным «рудиментом» архитектуры x86 — сегментной моделью памяти, которая передавалась по наследству ещё со времён 8086/80286. Однако, как потом оказалось, они очень погорячились. Архитектура стала абсолютно невиртуализируемой. При разработке новой версии своего продукта для виртуализации программисты компании VMWare столкнулись с непреодолимыми трудностями при реализации 64-битной виртуальной машины. Поскольку, для отделения кода монитора от кода «гостя» программой использовался механизм сегментации, эта задача стала практически неразрешимой. Осознав свою ошибку, AMD вернула ограниченный вариант сегментной организации памяти начиная с ревизии D архитектуры AMD64, что позволило запускать 64-битные ОС в виртуальных машинах. VMWare предоставляет вместе со своими продуктами специальную утилиту. Также следует отметить, что первоначально попавшие «под нож» команды LAHF и SAHF, которые также активно используются ПО виртуализации, затем также были возвращены в систему команд. С распространением средств аппаратной виртуализации (Intel VT, AMD-V) потребность в сегментации вновь постепенно отпадет, однако VMWare по-прежнему активно её использует, и поддержки AMD-V даже на сегодняшний день в её продуктах нет.

Архитектура процессора Hammer (сейчас «AMD64 Platform»)

Архитектура процессора Hammer (сейчас «AMD64 Platform») Основные особенности встроенный контроллер динамической памяти; усовершенствованное ядро микропроцессора; технология HyperTransportTM.

Читать еще:  Движимые паром. История паровых машин

Блок-схема процессора AMD Hammer

Набор регистров процессора AMD Hammer добавлено 8 регистров общего назначения (GPR) R8-R15, используемых в 64-битном режиме; расширены до 64 бит регистры EAX, EBX и т. д.; добавлено 8 новых регистров в блок SSE (XMM8-XMM15).

Контроллер и туннельное устройство шины HyperTransport Переключатель в цепи устройств, объединенных шиной HyperTransport TM TM

Технология HyperTransport высокоскоростная шина обмена данных между устройствами, со скоростью передачи данных до 12,8ГБ/с; масштабируемая архитектура, упрощая возможность соединения устройств; совместима с существующими шинами передачи данных, существующими и проектируемыми операционными системами, и программно совместима с шиной PCI; обладает возможностью взаимодействия с современными шинами ввода/вывода, такими как AGP, PCI, PCI-X, IEEE-1394, USB 2.0, PL-3, SPI-4.2, и Gigabit Ethernet, а также с шинами следующего поколения, включая AGP 8x, Infiniband, PCI-X 2.0, PCI Express, SPI-5, и 10 Gigabit Ethernet. устройства, построенные с использованием технологии HyperTransportTM, спроектированы для работы на частотах от 200 до 800 МГц и используют технологию передачи данных по обоим фронтам синхросигнала, передавая по два бита информации за каждый такт с эффективной скоростью 1600МБ/с в каждом направлении. средняя скорость передачи данных может достигать 6,4ГБ/с при 16-разрядной шине HyperTransportTM и 12,8ГБ/с при 32-разрядной шине. TM

1.Контроллер шины (host); является источником данных и сигналов для других устройств – мостов, туннелей и конечных узлов. Обычно встраивается в процессор (в северный мост). 2.Туннель шины (tunnel); устройство с двумя контактами, входным и выходным, с функциональным устройством между ними. Туннель является основным соединительным блоком устройств HyperTransportTM. Команды, не адресованные туннельному устройству, транслируются через него далее по цепи. 3.Конечный узел (end device); образует конечную точку цепи HyperTransportTM. В шине HyperTransportTM конечные устройства не являются обязательными, так как в их качестве могут быть использованы туннельные устройства, что позволяет увеличить гибкость системы. 4.Концентратор (hub); микросхема южного моста, управляющая устройствами IDE и менее скоростными портами, включая последовательные и параллельные порты, USB, IEEE-1394 и т.д. С помощью моста к цепи устройств можно добавлять новые ветви, образуя древовидную структуру. Ветви могут иметь различную ширину входных и выходных каналов. 5.Переключатель (switch); управляет потоками ввода/вывода и организует внутреннее соединение подключенных к шине HyperTransportTM устройств. Контроллер непосредственно взаимодействует с переключателем, который обслуживает множество независимых подчиненных устройств, включая туннельные устройства, мосты и конечные устройства цепи, в порядке очередности. Для исходящих потоков данных переключатель является ведущим узлом этой цепи; переключатель может соединяться с несколькими контроллерами и логически разделять структуру на подмножества, доступные для различных контроллеров. Переключатель поддерживает “горячее” подключение устройств. 6.Мост (bridge). Состав шины HyperTransportTM

Пример применения шины HyperTransportTM Состав чипсета AMD-8000 AMD-8151; графический AGP туннель, поддерживающий шины AGP 3.0; AMD-8131; PCI-X туннель, поддерживающий шину PCI- X в системах на Hammer; AMD-8111; туннель ввода-вывода, поддерживающий USB порты, IDE-устройства, и шину PCI. Процессор Hammer имеет до трех встроенных контроллеров шины HyperTransportTM шириной 16 бит и пропускной способностью 3,2 Гбайт/с в каждую сторону.

AMD Hammer

Perhaps emboldened by having attained technological leadership in the PC processor stakes with its seventh-generation Athlon chip, AMD announced its own vision of the path to 64-bit code and memory addressing support in October 1999 – and it was a lot different from Intel’s IA-64 architecture.

While IA-64 is a completely new architecture, AMD has elected to extend the existing x86 architecture to include 64-bit computing, adopting an approach that will provide an easy way for users to continue to use their existing 32-bit applications and to adopt 64-bit applications as needed. Fundamentally, the AMD x86-64 design – initially known by the codename Sledgehammer and branded as Hammer when the full architectural specification was released in mid-2000 – extends x86 to include a 64-bit mode that has both a 64-bit address space and a 64-bit data space – future 64-bit processors being able to detect which mode is needed and compute accordingly. The instruction set will be extended or operations such as instruction and data prefetching, with the only major architectural change expected to involve the x87 FPU.

AMD argues that its more conservation transition to 64-bit computing has a number of advantages over Intel’s IA-64 route:

  • full native support for both 64-bit and 32-bit applications
  • lower power consumption and therefore higher frequencies
  • the potential for the fabrication multiple x86-64 processors on a single chip
  • no reliance on complex new compiler technology
  • less cost.

Its combination of support for both existing 32-bit x86 software with a true 64-bit x86-64 system architecture earns the AMD64 the right to claim to be the first eighth-generation x86 desktop processor architecture. The goal of delivering next-generation performance to the customer of today is achieved by striking a balance between next-generation microarchitectural per clock cycle performance and the ability to further scale the architecture in frequency in a given process technology.

The changes to the Hammer’s base pipeline, as compared with the previous processor generation, are the clearest example of this design philosophy. The pipeline’s front-end instruction fetch and decode logic have been refined to deliver a greater degree of instruction packing from the decoders to the execution pipe schedulers. Accommodating this change requires a redefinition of the pipe stages in order to maintain a high degree of frequency scalability, resulting in two additional pipe stages when compared to the seventh generation microarchitecture. The end product is a 12-stage integer operation pipeline and a 17-stage floating point operation pipeline.

In the autumn of 2000 AMD released its SimNow! simulator – an application specifically designed to give BIOS vendors, tools developers, operating system manufacturers and application providers the ability to evaluate their x86-64 technology based software code prior to the release of its Hammer processors.

When AMD first announced their plans to extend their existing x86 architecture to include 64-bit computing, they were forecasting that this would happen before the end of 2001. In the event, problems with the adoption of SOI technology meant that it wasn’t until the spring of 2003 that we saw AMD’s K8 architecture evolve into the server-based Opteron line of CPUs. A few months later, the company was finally ready to launch 64-bit chips into the desktop and mobile markets.

Ссылка на основную публикацию
Статьи c упоминанием слов:

Adblock
detector