0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

CRUSOE компании Transmeta

Transmeta Crusoe. Первый взгляд

Ну вот и наступил тот день, когда оказались сняты покровы секретности, окружающие одну из самых таинственных компаний последних пяти лет, Transmeta, а также и их детище — процессор под кодовым названием Crusoe. Как известно, недостаток информации — лучшая пища для слухов, которых хватало за это время, но теперь мы, наконец, можем забыть про них и узнать, как же реально обстоит дело.

Одно из ранних и общепринятых предположений полностью подтвердилось: Crusoe действительно не является конкурентом процессоров для настольных компьютеров от AMD и Intel — он самую малость опоздал с этим, но зато его возможности по энергосбережению возможно делают его идеальным выбором для производителей портативных продуктов — от ноутбуков до HPC. Но к этому моменту мы вернемся чуть позже, когда речь пойдет о конкретных деталях чипов. А сейчас посмотрим на более фундаментальные вещи, и первое, на что стоит обратить внимание в данном случае — это технология Code Morphing, позволяющая «на лету» преобразовывать x86 код во внутреннюю систему команд процессора.

Кстати, если зашла речь о системе команд, то Crusoe относится к разряду VLIW процессоров. То есть, в отличие от привычных каждому пользователю PC чипов, работающих с CISC инструкциями, он в своей работе опирается на VLIW (very long instruction word), будучи в этом более близок к таким продуктам, как Merced или Elbrus 2000. (Последнее, пожалуй, особенно справедливо, если учесть, что глава Transmeta, Dave Dietzel, в свое время немало времени провел в Москве, контактируя с будущими создателями E2K).

Так вот, вернемся к VLIW. Поскольку эта архитектура несовместима напрямую с x86, а отказываться от такого преимущества, каким является накопленный парк x86 программного обеспечения создателям Crusoe совсем не хотелось, и был разработан промежуточный, частично аппаратный, частично программный, невидимый для программ слой — Code Morphing, который во время выполнения программы, незаметно для нее преобразует ее x86 инструкции в инструкции VLIW.

Плюсы и минусы такого подхода, по сравнению с традиционным, очевидны. Это:

  1. Возможность достаточно радикально менять структуру процессора, подгоняя его к тем или иным требованиям — все равно все изменения его архитектуры для программ можно замаскировать на уровне Code Morphing.
  2. Возможность вносить те или иные изменения в уже выпущенные процессоры, опять же на уровне преобразования кода.
  3. Очень удобная вещь для работы с различными новыми наборами инструкций — SSE, 3DNow!, и т.д. Была бы лицензия, а сделать — не проблема.
  4. Как ни крути, а эмуляция остается эмуляцией, со всеми вытекающими последствиями в плане производительности. В качестве примера можно посмотреть на душераздирающие результаты эмуляции x86 программ на PowerPC. Но Transmeta неплохо поработала в этом направлении.

Как это все работает?

Для начала надо сказать пару слов о логической структуре процессора. Ядро Crusoe состоит из пяти модулей четырех различных типов: два блока для операций с целыми числами, один для операций числами с плавающей запятой, один — для операций с памятью, и один — модуль переходов. Соответственно, и каждая VLIW инструкция («молекула», по терминологии Transmeta, длиной 64 или 128 бит) может состоять из четырех RISC-подобных операций этих типов («атомов»). Все атомы выполняются параллельно, каждый соответствующим модулем, молекулы идут друг за другом, в строгом соответствии с очередью, в отличие от большинства сегодняшних суперскалярных x86 процессоров, где используется механизм внеочередного выполнения команд (out-of-order), это заметно упрощает внутреннюю структуру процессора, позволяя отказаться от некоторых громоздких функциональных модулей (например, декодера инструкций, коих в x86 наборе не так уж и мало). Для иллюстрации можно сравнить площадь мобильного 0.18 мкм Coppermine с суммарным объемом кэша 288 Кбайт с площадью TM5400 с суммарным кэшем 384 Кбайт — 106 квадратных милиметров против 73. Что, естественно, напрямую сказывается и на разнице в тепловыделении и энергопотреблении процессоров.

Но вернемся вновь к принципу работы процессора. На вышеописанный уровень «молекулы», по возможности максимально плотно упакованные «атомами», попадают с уровня Code Morphing, где в них превращаются исходные инструкции (на данный момент речь идет только о x86, но в перспективе ничто не мешает сделать версию транслятора и для другого набора команд). Вся окружающая среда с которой сталкивается процессор, начиная от BIOS и заканчивая операционной системой и программами, контактирует только с Code Morphing, не имея прямого доступа к самому ядру процессора. Очень удобно, учитывая, что даже уже у двух первых объявленных процессоров Transmeta это самое ядро — разное.

Одним из методов увеличения производительности такого нетрадиционного способа работы, является очень логичная система кэширования. Каждая x86 инструкция, будучи оттранслированной один раз, сохраняется в специальном кэше, располагающемся в системной памяти, и в следующий раз, при необходимости ее выполнения, этап трансляции можно пропустить, сразу достав из кэша необходимую цепочку молекул. Вдобавок, как обещает Transmeta, Code Morphing со временем еще и обучается: по мере выполнения программ, оптимизируя их для более быстрого выполнения, обращает внимание на наиболее часто выполняемые участки кода, анализирует переходы в теле программы, и т.д.

Первые процессоры Transmeta максимально ориентированы на рынок мобильных чипов (что, впрочем, не мешает компании уже поговаривать о серверном процессоре этой же архитектуры!), соответственно одним из наиболее важных параметров процессора здесь является его энергопотребление. И если с младшим из сегодняшних чипов Transmeta, TM3120, с его 92 Кбайт кэша, особых проблем нет, то в TM5400 компания встроила механизм LongRun, функционально подобный технологии SpeedStep от Intel — возможность изменения тактовой частоты и напряжения на ядре процессора на лету. Причем, куда более гибко, чем это возможно в случае с двумя фиксированными значениями у SpeedStep.

Если уж зашла речь о конкретных чипах, то давайте займемся этим вопросом более внимательно. Итак, на сегодняшний день объявлены два первых CPU, созданных по представленной Transmeta технологии. Первый, TM3120, нацелен на рынок HPC, второй, TM5400 куда больше подходит для рынка субноутбуков. Итак, по порядку:

TM3120. Младший процессор в семействе, с тактовой частотой 333, 366, и 400 МГц. Обладает всего лишь 96 Кбайт разделенного кэша L1 (64 Кбайт под инструкции, 32 Кбайт — под данные). Процессор рассчитан на напряжение 1.5 В.

Содержит стандартные для серии PC-on-a-chip элементы: 66-133 МГц SDRAM контроллер с 3.3 В интерфейсом, рассчитанный на применение со стандартными для мобильных приложений модулями SO-DIMM. Частота памяти получается путем применения определенного делителя (от 1/2 до 1/15) к тактовой частоте процессора. Контроллер шины PCI также обладает стандартным 33 МГц PCI 2.1 совместимым интерфейсом, обеспечивая полноценную работу со всеми сегодняшними продуктами, могущими его использовать. Из поддержки периферии надо упомянуть контроллер флэш-памяти — если уж продукт ориентирован на рынок самых маленьких компьютеров, то без этого там никуда.

Как любой нормальный процессор, предназначенный для работы с Windows (а в список проверенных ОС входят Microsoft Windows 95, Windows 98, Windows NT и Linux), TM3120 должен соответствовать системе управления энергопотреблением ACPI, что он успешно и делает, потребляя в системном состоянии Deep Sleep всего лишь 0.015 Вт. Разумеется, при выполнении мощных вычислений энергопотребление вырастает на несколько порядков. Например, при проигрывании DVD оно доходит до 2.9 Вт, что тоже, впрочем, чертовски хорошо, если сравнивать, скажем, с мобильными процессорами Intel и AMD.

Что касается старшего варианта, TM5400, то все вышесказанное в основном относится и к нему, но с рядом поправок. Во-первых, до 500-700 МГц выросла скорость. Во вторых, что не менее важно, значительно увеличился и объем кэша — наряду с 128 Кбайтами (64+64) L1, появился и L2 — причем сразу 256 Кбайт. Здесь, в зависимости от частоты, напряжение ядра плавает — от 1.2 до 1.6 В. Энергопотребление, впрочем, даже в случае проигрывания DVD доходит всего лишь до 1.8 Вт — в первую очередь сказывается LongRun.

Что касается PC-on-a-chip возможностей, то здесь всего одно пополнение, но такое, которое просто нельзя не заметить — к SDRAM контроллеру прибавился его DDR SDRAM собрат. Все что было сказано выше о скорости SDRAM, относится и к DDR.

Первый из чипов уже производится IBM по 0.22 мкм техпроцессу и стоит от $65 до $89, в зависимости от тактовой частоты. Второй должен пойти в производство только где-то в середине года, будет производиться уже с применением 0.18 мкм технологии, и стоить от $119 до $329.

Все это замечательно, но как Crusoe ведет себя в реальной жизни? Вполне неплохо для начала. Уже была продемонстрирована работа на компьютере на базе Crusoe заявленных операционных систем, без особых проблем работали реальные приложения — Power Point, Quake…

Что касается производительности, то Transmeta поступила весьма разумно, решив предложить для этого собственный тест — Mobile Platform Benchmark. Впрочем, надо признать, весьма логичный, во главу угла ставящий соотношение производительность/энергопотребление. (Ну а то, что здесь выигрывает Crusoe — это, разумеется, проблемы конкурентов). По тестам, произведенным на нем самой Transmeta, TM5400, с варьировавшейся в течение теста (LongRun был включен) от 266 до 533 МГц скоростью, на ряде задач шел вровень с мобильным Pentium III 500, на ряде отставал. Причем во всех задачах его энергопотребление было в несколько раз ниже. Здесь можно привести еще один показатель, правда, опять со слов самой компании — 667 Мгц TM5400 по производительности примерно равен 500 МГц Pentium III.

Пора, наверное, подвести итоги. Судя по заявленным показателям, можно сказать, что ждать стоило и технология в большинстве своих деталей как минимум интересна с теоретической точки зрения. Будет ли она столь же интересна крупным производителям ноутбуков? Вряд ли, по крайней мере, поначалу. К тому же, Transmeta чуть-чуть опоздала на рынок в плане тактовой частоты — в середине года мобильные процессоры Intel должны обгонять Crusoe по этой характеристике, а правило «покупают мегагерцы» еще никто не отменял. В общем, многое в обозримом будущем зависит от того, насколько успешно компании удастся убедить производителей ноутбуков в своей надежности и от того, какие перспективы роста заложены в архитектуре Crusoe. Проще говоря — будет ли Transmeta хорошим стайером, или же сдохнет после стометровки? Скоро узнаем.

Читать еще:  Frostpunk — тяжелая доля. Из первых рук

Жизнь и удивительный кристалл Transmeta Crusoe

В середине Января Transmeta (www.transmeta.com), самая загадочная компания Кремниевой долины, наконец-то анонсировала свой первый продукт, появление которого ожидали с большим нетерпением, — микросхемы серии Crusoe. Название дано в честь известного литературного героя Даниэля Дефо — Робинзона Крузо, и ассоциируется оно, конечно, с необитаемым островом, пальмами, человеком, одетым в звериную шкуру. Причем тут микросхема! Прямо Полиграф Полиграфович какой-то! Впрочем, не будем торопиться с выводами, но слова про “необитаемый остров” все же запомним.

Так почему же компания загадочная? Да потому, что последнюю пару лет получить достоверную информацию о ее деятельности было весьма затруднительно, о ней ходило множество всяких слухов. Кроме того, руководство Transmeta принципиально практически не общалось с представителями средств массовой информации. Все выполняемые на фирме работы были окутаны завесой секретности. На Web-узле Transmeta красовалась, например, лаконичная надпись: “Web-страницы здесь еще нет”. Говорят, что таким образом сотрудники компании демонстрировали свое чувство юмора перед теми неудачливыми хакерами, которые пытались отыскать на сайте хоть какую-нибудь закрытую информацию. А ведь, как теперь выясняется, за время подготовки проекта компанией было подписано более 2000 соглашений с различными фирмами и организациями. Но вернемся немного назад.

Новые микросхемы Crusoe: ТМ3120 и ТМ5400

Итак, компания Transmeta была основана в 1995 г. в Санта-Кларе (шт. Калифорния). Среди ее учредителей значится такой небезызвестный в компьютерном бизнесе человек, как Поль Аллен, сооснователь корпорации Microsoft. Впрочем, в настоящее время на руководящих постах в Transmeta трудятся не менее известные персоны. Президент и исполнительный директор компании Дэвид Дитзель был в свое время одним из разработчиков первых микропроцессоров в лаборатории Bell Labs (AT&T), а затем директором лаборатории SPARC-процессов в корпорации Sun Microsystems. Финский инженер Линус Торвальдс, создатель операционной системы Linux, также сейчас в Transmeta. Для тех, кто неравнодушен к компьютерным играм фирмы ID Software, о многом говорит имя нынешнего сотрудника компании Дейва Тейлора.

Завеса секретности чуть приоткрылась, когда в сентябре прошлого года Transmeta получила два патента (датированных еще 1998 г.), из которых ясно следовало, что компания работает над новой микросхемой, эмулирующей кристалл Intel. По информации, полученной от независимых консультантов, связанных с патентной деятельностью, Transmeta в состоянии создать микросхему и предложить ее по более привлекательной цене, нежели Intel. При этом она может избежать не только судебного преследования за нарушение прав интеллектуальной собственности, но и позволить себе не платить лицензионных отчислений. Просто хрустальная мечта многих производителей клонов микропроцессоров.

О чем же говорится в патентах? Таинственность нагнетается уже одним из названий: “Memory Controller for Microprocessor for Detecting a Failure of Speculation on the Physical Nature Of Component Being Addressed”. Переводить на русский язык его бессмысленно, так как ясности это пока все равно не прибавит. Тем, кто занимался изобретательской деятельностью в советские времена, хорошо известно, что основную смысловую нагрузку в описании изобретения несет его формула, в которой, если она “грамотно” составлена, часто без обеда просто не разобраться.

Как сообщает один из независимых экспертов, в патенте № 5832205 предлагается микросхема, способная транслировать команды микропроцессора Intel в 128-разрядный формат, указанный как VLIW (Very Long Instruction Word). Известно, что в традиционной процессорной архитектуре с помощью VLIW можно прочесть группу инструкций и выполнить их одновременно. Обычно команды имеют фиксированную длину и в одном слове объединяются от четырех до шестнадцати кодов операций. Это позволяет вычислять текущий компьютерный код не только быстрее, но зачастую и эффективней. В отличие от RISC-архитектуры, где вся тяжесть по распараллеливанию операций ложится на аппаратные средства, во VLIW-архитектуре основной упор делается на программное обеспечение.

ПО, называемое в патенте морфингом кода (Code Morphing), помогает аппаратной части микросхемы транслировать инструкции “на лету” и запоминать их, чтобы при вторичном использовании не прибегать к относительно медленному процессу трансляции. Это ПО также управляет процессом “сшивания” команд во VLIW.

Кроме того, данный патент описывает технику сохранения процессорной информации во временных регистрах, откуда она может быть легко восстановлена, если в процессе работы кристалла случится непредвиденная ошибка (вот откуда столь странное, на первый взгляд, название этого документа).

“Моторы” для мультимедиа-ПК

Пожалуй, нет ни одного издания, не упомянувшего о представлении первого продукта Transmeta. Не зря же Поль Аллен является не только основателем компании, но и инвестором крупного электронного издательства CNET. Как это теперь принято, анонсирование продукта шло через Интернет. В течение двухчасового Web-кастинга можно было получить довольно много интересной информации.

Создатели Crusoe, в частности, заявили, что новые микросхемы позволяют теперь конструировать дешевые портативные компьютеры, которые смогут работать весь день без подзарядки аккумуляторов.

Собственно, анонсировано было два кристалла: TM3120 и TM5400. Первый из них тактируется частотами 333, 366 и 400 МГц и предназначен для рынка карманных устройств и мобильных Интернет-приставок стоимостью не выше 500 — 1000 долл., которые работают под управлением Mobile Linux, версии ОС, разработанной Transmeta. Кристалл TM3120, площадь которого равна 77 кв. мм, создается с соблюдением технологических норм 0,22 мкм. Объем кэш-памяти первого уровня не превышает 96 Кб. Стоимость этого типа микросхем оценивается в 65 — 89 долл. за штуку. Для их изготовления было заключено соответствующее соглашение с корпорацией IBM, имеющей необходимые производственные мощности.

В отличие от микросхемы TM3120, оптимизированной для 32-разрядных приложений, ТМ5400 больше ориентирована на 16-разрядные Windows-программы. Скорость работы кристалла может изменяться с дискретностью 33 МГц от 500 до 700 МГц. Он предназначен в основном для микроноутбуков весом около одного килограмма. Кроме первичной кэш-памяти объемом 128 Кб имеется также встроенная вторичная кэш-память емкостью 256 Кб. Одним из несомненных преимуществ TM5400 является возможность поддержки напрямую, минуя набор микросхем, одного из наиболее перспективных типов памяти — DDR SDRAM.

Кристалл имеет меньшую площадь (73 кв. мм), чем его предшественник, поскольку он будет выпускаться с соблюдением проектных норм 0,18 мкм. Его ориентировочная стоимость в настоящее время — 119 — 329 долл., в зависимости от тактовой частоты самого кристалла.

Начало массового производства новых микросхем запланировано на середину 2000 г.

Кстати, для демонстрации возможностей ТМ5400 на протяжении всей Интернет-трансляции Линус Торвальдс и Дейв Тейлор “резались” в Quake III на Linux- и Windows-машинах. По понятным причинам победил Тейлор, хотя исход игры никакого отношения к самим ОС, пожалуй, не имеет.

Микросхемы Crusoe не обременены аппаратными излишествами, например устройствами для переименований регистров, переназначения буферов и организации арифметического стека. Это позволяет уменьшить не только размеры кристалла, но и число транзисторов. Кроме того, при работе это устройство выделяет существенно меньше тепла, чем, например, обычные микропроцессоры Pentium III или Celeron. Напомним, что типичный Celeron потребляет от 4 до 10 Вт, в то время как ТМ3120 — всего около 1 Вт.

Такой параметр, как энергопотребление, очень важен для мобильных устройств. Чем больше мощности потребляет кристалл, тем быстрее разряжаются аккумуляторы и, соответственно, меньше времени остается на автономный серфинг в Интернет.

По оценкам сотрудников Transmeta, Crusoe сможет удвоить время работы от аккумуляторов. Немалую роль в этом должна сыграть новая технология энергосбережения, названная LongRun. В частности, в компании было проведено сравнение потребляемой мощности кристаллов Pentium III и Crusoe во время декодирования информации с DVD-диска. Поначалу Crusoe расходовал примерно треть мощности, необходимой Pentium III, однако буквально через десять секунд его потребление составило всего одну десятую от необходимого микропроцессору Intel. В Transmeta объясняют это “разумностью” нового кристалла, который якобы понимает, сколько и когда надо затратить энергии. Так как Crusoe может автоматически настраивать тактовую частоту с декрементом 33 МГц, он через какое-то определенное время находит ее минимум, достаточный для DVD-декодирования. Немаловажным фактором является и то, что для Crusoe не требуется охлаждающего вентилятора, который не только расходует много энергии, но и создает помехи.

Заметим также, что в режиме “глубокого сна” (deep sleep) новый микропроцессор потребляет всего 20 мВт. По мнению специалистов, это позволяет устройству впадать практически в “зимнюю спячку”, когда того требуют условия эксплуатации.

Первые области применения

Среди многих компаний, которые намерены использовать микросхемы Crusoe в своих изделиях, стоит особо отметить корпорацию NEC (www.nec.com), ведущего производителя портативных компьютеров.

Как подтвердили официальные лица Diamond Multimedia, подразделения корпорации S3 (www.s3.com), продукция Transmeta в самое ближайшее время найдет применение в новом миниатюрном устройстве для связи с Интернетом — Web-pad, управляемом с помощью пера. В новом бездисковом устройстве предустановлена ОС Mobile Linux, а как основной Интернет-браузер в нем собираются использовать Netscape Navigator. Подключение к Сети будет главным образом беспроводным или посредством соединения с домашней сетевой станцией, в качестве которой может выступить и ПК.

Стоит отметить, что созданием подобного рода миниатюрных Web-устройств и кристаллов для них заняты сейчас такие тяжеловесы компьютерной индустрии, как Intel, MIPS, National Semiconductor, Hitachi, Palm Computing. Вспоминая слова про “необитаемый остров”, можно отметить, что пока микросхема Crusoe действительно является Робинзоном в этой области. И еще многие вопросы для компании по-прежнему остаются нерешенными.

Одна из основных проблем, с которой придется столкнуться Tramnsmeta, — это производство. Так, по мнению бывших специалистов Cyrix, работающих теперь в корпорации VIA Technologies, именно при массовом выпуске кристаллов компанию ожидают многочисленные “подводные камни”, и самый опасный из них — цена. Стоит, видимо, напомнить, что корпорация Cyrix, как и Transmeta, также использовала в свое время производственные мощности IBM.

Читать еще:  Huawei WATCH GT 2e: новый стиль знакомых часов

Transmeta Crusoe — Transmeta Crusoe

Крузо представляет собой семейство x86 совместимых с RIHD микропроцессоров , разработанных Transmeta и введенными в 2000 году Крузо был известен способом ее достижения совместимости x86. Вместо архитектуры набора команд осуществляется на аппаратном уровне , или в переводе на специализированном оборудовании, Крузо запускает программное обеспечение уровня абстракции, или виртуальную машину , известную как Code Morphing Software (CMS). CMS переводит машинный код инструкцию , полученную от программ в родную инструкцию для микропроцессора. Таким образом, Крузо может эмулировать другие набора команд архитектуры (МС).

Это используется , чтобы микропроцессоры для эмуляции Intel набора команд x86 . Теоретически это возможно , для CMS быть изменен , чтобы подражать другим ИСАС. Transmeta Crusoe продемонстрировал выполнение Java байткод , переводя байткоды в инструкции в своем родном наборе команд. Добавление уровня абстракции между потоком команд x86 и аппаратными средствами означает , что архитектура аппаратных средств может быть изменена без нарушения совместимости, просто путем изменений CMS. Например, Transmeta Efficeon — второе поколение Transmeta дизайн — имеет 256-битовый широкий VLIW ядро по сравнению с 128-битным ядром Крузо.

Крузо выполняет в программном обеспечении некоторой функциональности , традиционно реализуется на аппаратном уровне (например , инструкция повторного заказ), что приводит к более простым аппаратным средствам с меньшим количеством транзисторов . Относительная простота аппаратных средств означает , что Крузо потребляет меньше энергии (и , следовательно , создает меньше тепла) по сравнению с другими x86-совместимых микропроцессоров , работающих на той же частоте.

700 МГц Крузо запускал программу x86 на скорости 500 МГц Pentium III процессора x86, хотя процессор Крузо был меньше и дешевле, чем соответствующий процессор Intel.

содержание

Описание

Крузо был доступен в двух ядрах: в TM3200 для встроенных приложений и TM5400 для маломощных персональных компьютеров. Оба были основаны на той же архитектуре, но различаются по тактовой частоте и поддержка периферийных устройств.

TM3200 работает на тактовых частотах 333-400 МГц. Он имеет кэш 64 Кбайт инструкций, кэш данных 32 КБ и без кэша L2. TM3200 имеет интегрированный контроллер памяти поддерживает только SDRAM и PCI интерфейс. Он измеряет 77 mm² и использует источник питания 1,5 В, рассеивая менее 1,5 Вт мощности (типичного).

TM5400 работает при тактовых частотах 500-800 МГц. В отличие от TM3200, то TM5400 имеет технологию снижения мощности LongRun. Он имеет кэш 64 Кбайт инструкций, кэш данных 64 КБ и 256 КБ унифицированный кэш L2. Встроенный контроллер памяти поддерживает как SDRAM и DDR SDRAM. Он также имеет интерфейс PCI. Он измеряет 73 mm² и использует источник питания V 1.10 V 1.6f, рассеивая 0,5-1,5 Вт, как правило, и максимум 6 Вт

В Transmeta была компанией по производству полупроводниковой мощностей, то есть, они не имеют средств , чтобы изготовить их конструкцию, как были изготовлены IBM Microelectronics, полупроводникового бизнес International Business Machines (IBM). IBM сфабриковал Крузо в процессе 0,18 мкм КМОП с пятью уровнями меди межсоединения .

Крузо является VLIW микропроцессор , который выполняет инструкции пучки, называемые молекулы с помощью Transmeta. Каждая молекула содержит несколько команд, называются атомами . Code Morphing Software преобразует x86 инструкцию в родную инструкцию. Родные инструкции 32 бит. Инструкции , которые отвечают набор условий могут быть выполнены одновременно , и объединены с образованием 64- или 128-битовой в молекуле , содержащую два или четыре атома , соответственно. В том случае, если не хватает инструкции по заполнению молекулы, программные вставки NOPS как дополнения , чтобы заполнить пустые слоты. Это необходимо во всех архитектурах VLIW и подвергается критике за то , что неэффективно, поэтому существуют молекулы двух отдельных длин.

Transmeta Crusoe, процессор нового поколения обеспечивает переменные режимы работы. Из-за динамического ядра они изменяются напряжения и частоты динамически в соответствии с динамической нагрузкой. Частотный диапазон и динамическое напряжение обеспечивает 300 МГц-1,20 В, 400 МГц-1,23 В, 500 МГц-1,35 В, 600 МГц-1,53 В, 700 МГц-1,75 В, 800 МГц-2,00 В, 900 МГц-2,35, 1000 МГц — 2,80 В. Они могут варьироваться в эти диапазоны в зависимости от нагрузки. Для оптимальной или минимальной нагрузки соответствующих частоты и напряжения изменятся.

CRUSOE компании Transmeta

1. Засекреченная разработка

Больше 2 лет представители компании Transmeta c загадочным видом пугали весь компьютерный мир сообщениями о своем секретном процессоре Crusoe. Практически никаких подробностей о нем до сих пор не разглашалось. Сайт компании содержал лишь одну надпись:

Известно было лишь то, что секретный процессор будет чем-то «совершенно новым». Можно было бы скептически относиться к этим сообщениям, если бы не были известны факты о самой компании.

Компания Transmeta основана около 5 лет назад в Силиконовой Долине. Ее президент Дэвид Дитцел раньше работал на такие крупные компании, как AT&T Bell Labs и Sun Microsystems Inc. Активное участие в разработке процессора принимает Линус Торвалдс, создатель Linux. На Transmeta работает группа опытных инженеров из MIPS. О серьезности намерений компании можно судить по тому, что в финансировании разработки участвуют один из создателей Microsoft Пол Аллен, известнейший финансист Джордж Сорос и Банк Бостона.

Следует отметить, что несколько лет назад, когда Дэвид Дитцел еще был одним из ведущих разработчиков Sun, он активно сотрудничал с Борисом Бабаяном, который сейчас разрабатывает процессор «Эльбрус-2000» (E2K) и имел доступ ко многим техническим материалам по E2K. Вероятно, под впечатлением от E2K у Дитцела и родилась идея создать свой процессор.

На протяжении пяти лет, в глубокой тайне, компанией Transmeta велась работа над своим шедевром. За эти годы были зарегистрированы множество патентов, связанных с разработкой процессора. Например, один из них защищает технологию исправления ошибок в компьютерных системах.

Как уже было отмечено выше, до 19 Января 2000 года о новом процессоре было известно немногое. По заявлению инженеров Transmeta это должен быть процессор с очень низким потреблением энергии и имеющий VLIW-архитектуру. Эта постRISC архитектура также будет применяться в процессорах Itanium и E2K. Кроме того, для Crusoe реализована патентованная технология бинарной компиляции «Сode Morphing», позволяющая процессору эмулировать любой набор инструкций. Теоретически, этот процессор может работать под управлением таких разных операционных систем, как Windows 9x, Linux, Windows CE или Palm OS. Подобный подход позволяет реализовать полную эмуляцию x86- совместимого процессора без нарушения патентов Intel.

Интересен тот факт, что в 1996-1997 годах Московский центр Sparc-технологий разработал по заказу Transmeta оптимизированную и высокоточную программную реализацию трансцендентных математических функций, которые аппаратно реализованы на архитектурной платформе IA-32 (Intel x86/87). Фактически, МЦСТ помог своим конкурентам.

В российском процессоре E2K тоже должна быть реализована технология двоичной компиляции (кстати, также запатентованная). Как заявил Борис Бабаян, схожесть двух технологий обусловлена тесным общением с ним Дэвида Дитцела во время совместной работы в Sun Microsystems. Однако, по словам Бабаяна, вариант, реализованный для процессора E2K более совершенный.

Проведем краткий экскурс в архитектуру VLIW. Это сокращение от словосочетания Very Long Instruction Word (очень длинное командное слово). VLIW базируется на множественезависимых функциональныхустройств процессора. В таких машинах вместо того, чтобы пытаться параллельно выдавать в эти устройства независимые команды, несколько операций упаковываются в одну очень длинную команду. При этом ответственность за выбор параллельно выдаваемых для выполнения операций полностью ложится на компилятор, а аппаратные средства, необходимые для реализации суперскалярной обработки, просто отсутствуют. Это весьма прагматичный подход. В результате, процессор не тратит время на анализ потока команд для выявления параллельных команд.

Лозунг архитектуры VLIW — упрощение управляющей логики как средство повышения частоты. Как говорит Дитцел: «Люди всегда хотят добавить функциональности. Поэтому, главная забота руководителя разработчиков — не усложнять процессор».

Наибольшой минус VLIW состоит в том, что быстродействие программ очень сильно зависит от компилятора. Но кто сомневается в профессионализме Линуса Торвалдса, пусть первый бросит в меня камень. Торвалдс очень хороший программист и способен написать для Crusoe очень эффективный компилятор.

Подобный баланс между аппаратной и программной частями проекта Crusoe позволяет сделать очень простой и компактный кристалл, работающий на высокой частоте. Компактный кристалл требует при работе мало энергии и имеет низкую себестоимость. Действительно, по заявлению инженеров Transmeta, их процессор будет расходовать менее 1 ватта и идеально подходит для мобильных компьютеров. Все эти замечательные свойства Crusoe, позволяют Торвалдсу заявить, что его детище может составить серьезную конкуренцию Intel.

Transmeta Crusoe

Crusoe — семейство x86-совместимых микропроцессоров, созданных компанией Transmeta в конце 1990-x годов. Процессор был продемонстрирован публике в январе 2000 года, реальное производство началось позже в том же году.

Для исполнения команд х86 используется программная эмуляция в виде виртуальной машины — технология, названная морфингом программного а. Сам процессор построен по VLIW-архитектуре и исполняет всегда единственную программу, написанную в его нативных ах: транслятор команд х86, который переводит эти команды в VLIW-инструкции [1] [2] [3] .

Теоретически процессор может быть переориентирован на эмуляцию любой другой архитектуры, но такое развитие маловероятно, так как аппаратура, очевидно, была оптимизирована для обработки именно х86.

Программная трансляция позволяет гибко изменять внутреннее устройство процессора, не нарушая его совместимости с целевой платформой. Например, Efficeon, следующее поколение семейства, имеет 256-разрядную организацию взамен 128-разрядной у оригинального Crusoe.

Программная эмуляция берёт на себя многие функции, традиционно реализуемые аппаратно, например, внеочередное выполнение команд, благодаря чему аппаратная часть становится компактнее из-за меньшего количества транзисторов, а значит, потребляет меньше энергии и производит меньше тепла, чем у аналогичных процессоров.

Название позаимствовано у вымышленного героя-путешественника Робинзона Крузо.

Содержание

Описание [ | ]

Изначально Crusoe был доступен в двух вариантах: TM3200 для встраиваемых систем и TM5400 для персональных компьютеров с малым энергопотреблением. Оба были доступны в виде одной архитектуры, но с разными частотами и поддержкой периферии.

TM3200 работал на частотах от 333, 366 и 400 МГц. Он имел кэш инструкций в 64 кБ, кэш данных в 32 кБ и обходился без кэша второго уровня. TM3200 имел встроенный контроллер памяти поддерживающий только SDRAM, и интерфейс PCI. Занимал 77 мм², требовал питание 1,5 В, и имел типичное энергопотребление менее чем 1,5 Вт.

Читать еще:  Обзор лучших музыкальных телефонов осени 2008 года

TM5400 работал на частотах от 500 до 700 МГц. В отличие от TM3200, TM5400 поддерживал технологию уменьшения энергопотребления LongRun. Он имел кэш инструкций и кэш данных по 64 кБ, и кэш второго уровня 256 кБ. Встроенный контроллер памяти поддерживал SDRAM и DDR SDRAM. Также имел интерфейс PCI. Занимал 73 мм², использовал питание 1,1-1,6 В, и имел типичное энергопотребление от 0,5 Вт до 1,5 Вт при максимальном 6 Вт.

Модели процессоров [ | ]

TM3200 [ | ]

Первоначально назывался TM3120

  • Кэш-память первого уровня L1: 32 + 64 кБ (данные + инструкции)
  • Поддержка инструкций MMX
  • Архитектура: VLIW с техникой морфинга программного а
  • Интегрированный в процессор Northbridge («северный мост»)
  • Упаковка:
    • 474 Pin CBGA
  • Дата выпуска: Январь 2000 г.
  • Технология изготовления: 220 нм (на заводе IBM)
  • Размер ядра: 77 мм²
  • Частота: 333, 366 и 400 МГц

Transmeta Crusoe — вивисекция

Как вы, возможно, уже слышали, после пяти лет напряженого и многозначительного молчания компания Teansmeta разразилась долгожданным релизом своего первого процессора под названием Crusoe. Сразу же пошли слухи, что это никак не меньше, чем революция в области разработки процессоров. Что же за зверь — Crusoe, и чем он принципиально отличается от двух провалов последних лет — WinChip и Rise?

Начнем с того, что Crusoe — это не совсем процессор. Точнее, это не только процессор. В старые времена такую штуку было принято называть аппаратно-программным комплексом. Сам процессор представляет собой относительно простое устройство с VLIW (very long instruction word) архитектурой и собственной системой команд. Это устройство дополняется программной оболочкой, переводящей команды работающего приложения в команды процессора и оптимизирующей полученнный код (рис. 1).

Согласитесь, что похоже на Itanic ибн Merced (только там трансляция команд тоже производилась в «железе»). Минус этого подхода очевиден и существенен — потеря быстродействия, ибо транслятору тоже надо выделить время для выполнения. Плюсов много и они не так очевидны. Во-первых, меняя программную часть (у Transmeta она называется Code Morphing Software) процессора, можно приспосабливать его для разных систем команд приложений. То есть практически, получать доступ к софту, разработанному для любых микропроцессорных платформ. Пока Transmeta хвалится совместимостью только с x86, но идея с другими архитектурами явно носится в воздухе. Во-вторых, изменения в программную и аппаратную части могут вноситься независимо друг от друга — операционная система и приложения вообще не видят «железную» часть процессора, они общаются только с Code Morphing Software. В-третьих, переложив проблемы оптимизации на программную часть, разработчики весьма существенно сократили количество вспомогательной логики на кристалле — на три четверти сократили количество транзисторов по сравнению с аналогичными моделями (Transmeta обычно производит сравнение с мобильным Pentium III на ядре Coppermine). А отсюда следуют три вещи: высокий процент выхода годных микросхем, низкая себестоимость и низкое энергопотребление. И еще один плюс — наличие программной компоненты позволяет очень быстро менять функциональные возможности процессора — время обновления моделей в случае необходимости можно сократить на порядок по сравнению с чисто аппаратными решениями. Опять же, есть возможность исправлять возможные ошибки «на лету», а не ждать, когда пойдет в производство следующая серия микросхем.

Теперь перейдем к конкретным моделям — процессоров было выпущено два — TM3120 (рис.2) и TM5400 (рис.3).

Первый предназначен для всяческих карманных устройств и модных интернет-девайсов нового поколения. Второй — для ноутбуков. Надо заметить, что Transmeta постоянно напоминает, что ее процессоры предназначаются именно для мобильных устройств, и самое главное в них — не быстродействие (так что пока никакой конкуренции со старшими моделями от Intel и AMD), а соотношение быстродействия и энергопотребления. Впрочем, гибкий подход к разделению обязанностей между «железом» и софтом позволяет делать процессоры любого класса — Transmeta в пресс-релизе намекает, что если очень захотим, то сделаем процессор для серверов или десктопов, или рабочих станций. Но вернемся к нашим баранам. TM3120 нынче уже серийно производится на заводах IBM по 0.22-микронной технологии. Рабочая частота — 333, 366 или 400 МГц, напряжение питания 1.5 вольта, 96 Кб кэша первого уровня (64 Кб кэша команд, 32 Кб кэша данных), встроенные контроллеры памяти SDRAM (рабочие частоты 66 — 133 МГц, задаются делением частоты процессора на числа от 2 до 15, работа с модулями SO-DIMM), шины PCI (PCI 2.1, 33 MHz, 3.3V) и Flash ROM — то есть весь Northbridge и интерфейс с Southbridge на криcталле. При этом площадь кристалла — 77 мм2 (площадь мобильного PIII — 106 мм2). Еще один хит — энергопотребление, но о нем позже. Ориентировочная цена TM3120 — $65-89. Второй процессор — TM5400 — пока существует только в виде прототипов, серийное производство (0.18-микронный процесс) начнется во второй половине года. Частота до 700 МГц, питание от 1.2 до 1.6 вольт (частота и напряжение питания автоматически подстраиваются под интенсивность воплняемой задачи, чтобы обеспечить максимально эффективное энергопотребление — сия технология называется LongRun). На процессоре расположено 128 Кб кэша первого уровня (по 64 Кб на команды и данные) и 256 Кб кэша второго уровня. Кроме SDRAM- и PCI-контроллеров, на кристалл интегрирован еще DDR SDRAM-контроллер (частоты 100-166 МГц) — последний писк моды в области памяти. Площадь кристалла — 73 мм2, цена — от $119 до $329. Оба процессора выпускаются в 474-ножечном BGA-корпусе. Это, так сказать, были краткие тактико-технические характеристики, а теперь перейдем к архитектуре.

Ядра обоих процессоров состоят из 5 функциональных блоков — 2 для целочисленных операций (ALU), один для операций с плавающей точкой (FPU), один для работы с памятью (Store/Load) и один для обработки операций ветвления (Branching). Целочисленные модули имеют 7 ступенчатый конвейер, FPU — 10 ступенчатый. Еще в процессоре имеется 64 регистра — часть из них используется для эмуляции регистров x86 архитектуры, часть — для служебных нужд. Отдельные команды носят гордое название атомов и при передаче процессору объединяются в 64- (2 атома) или 128- (4 атома) битные VLIW-команды процессора — молекулы. Каждый атом передается в свое устройство и выполняется параллельно. Процессор может выполнять до 4 операций за один такт. Молекулы выполняются строго последовательно, за сборкой-разборкой исходного кода следит Code Morphing Software, а не процессорная логика. Собственно говоря, софт вообще не видит процессор как таковой.

Все команды, включая операционную систему (сейчас поддерживаются все вресии Linux, а также Windows 95, 98, 2000 и NT) и системный BIOS, проходят через Code Morphing Software (разработаннный, между прочим, не без участия небезызвестного Линуса Торвальдса) и видят только его. Сам Code Morphing хранится в микросхеме Flash ROM (вот зачем нужен котроллер Flash на процессоре) объемом 1 Мб. При включении питания в память первым загружается Code Morphing (он занимает 8-16 Мб памяти, недоступной остальному программному обеспечению), а затем уже все остальное. Кроме трансляции команд x86, Code Morphing занимается еще оптимизацией полученного VLIW-кода (очень похоже на интеллектуальные компиляторы для Merced). Оттранслированные молекулы заносятся в специальный трансляционный кэш (под него тоже выделяется область памяти, недоступная приложениям), откуда и извлекаются, если Code Morphing встречает аналогичную цепочку команд. Учтите, что Code Morphing транслирует команды не поодиночке, а группами, так что речь идет именно о цепочке команд и соответствующей трансляции. Плюс, со временем Code Morphing Software обучается. То есть, если одна и та же последовательность команд выполняется несколько раз, он начинает ее оптимизировать для более быстрого выполнения. С этой целью хранящимся в кэше трансляциям приписывается код, отслеживающий частоту выполнения отдельных цепочек и вероятное направление ветвления. Кроме того, у Code Morphing Software существует несколько режимов трансляции кода — от последовательной интерпретации команд до полной оптимизированной трансляции (в этом случае программа в начале запуска глубоко задумается, но затем будет работать быстрее). Существует еще множество больших и маленьких хитростей, связанных с Code Morphing, но это уже — тема для отдельного, сугубо технического, разговора.

А теперь о самом основном в этих двух процессорах (Transmeta постоянно намекает, что будут и другие, причем разделение обязанностей между «железной» и «софтверной» частью будет проводиться в зависимости от области применения) — об энергосбережении. Поскольку TM3120 и TM5400 направлены на мобильные устройства, то это — их основное достоинство. Transmeta утверждает, что WebPad на TM3120 будет работать на одной батарее почти сутки, а ноутбук на TM5400 — около 8 часов. Как это получается? Максимальная потребляемая мощность процессоров — около 2 ватт (при больших нагрузках, вроде проигрывания DVD). В режиме стандартных приложений (почта, работа с текстами) — мощность будет где-то порядка полватта. В режиме Deep Sleep — 0.015 ватт. Сравните с AMD K7, потребляющим в рабочем режиме около 30 ватт или с мобильным PIII 500 — 6-16 ватт, в зависимости от задачи. Снижено энергопотребление, во-первых, за счет сокращения числа транзисторов. Во-вторых, технология LongRun позволяет динамически менять рабочую частоту и напряжение питания в зависимости от загрузки процессора (даже как-то не хочется сравнивать со Speed Step от Intel с его фиксированными частотами). При этом TM5400 на частоте 700 МГц обеспечивает такое же пиковое быстродействие, как мобильный Coppermine PIII 500. По соотношению скорости выполнения задачи к расходуемой мощности TM5400 превосходит PIII 500 в среднем раза в 4.5 (в зависимости от задачи). При этом Crusoe может работать без активного охлаждения (ну-ка, представьте себе, сколько проживет нынешний Pentium без вентилятора). На сайте Transmeta есть красивая цветная (потому и не печатаем) картинка с распределением температур по процессору, выполняющему декодирование DVD. Так вот, максимальная температура Crusoe — 48 градусов, PIII 500 — 108 градусов. Почувствуйте разницу.

Ссылка на основную публикацию
Статьи c упоминанием слов:
Adblock
detector