div.main {margin-left: 20pt; margin-right: 20pt}
Intel Developer Forum Conference
2001
В настоящее время Intel уже далеко не самый популярный производитель
процессоров в глазах hardware community. Прошли уже те дни, когда процессоры
AMD K6-X не выдерживали конкуренции с Pentium II и Celeron и большинство
пользователей предпочитали процессоры от Intel. Прошедший в этом году весенний
Intel Developer Forum имел совершенно иную природу, нежели предыдущие. В этом
небольшом отчете вы найдете информацию о планах производителей на DDR SDRAM,
RDRAM, чипсете с пропускной способностью памяти 6.4GB/s, а также о многом
другом.
В прошлом году на IDF были продемонстрированы первые
образцы Pentium4, имевшего кодовое название "Willamette". Публике был
представлен сэмпл процессора, работающий на частоте 1.5 GHz, и все были
поражены фактом, что АЛУ (арифметико-логические устройства) нового процессора
работают на частоте 3 GHz. Спустя уже год после первого показа Pentium4,
несмотря на все свои преимущества, описанные на бумаге, в современных играх и
приложениях он не проявляет себя с лучшей стороны. Старшие модели Pentium III
и Athlon, частота которых на 25% ниже, чем у Pentium4, обходят его во многих
тестах и приложениях. Однако оказалось, что не все так просто. Не секрет —
использование памяти RDRAM на системах с Pentium III не дает значительного
увеличения производительности. Pentium4 действительно имеет преимущества от
использования RDRAM, и становится понятно, почему Intel стала продвигать
память Rambus так рано, во времена Pentium III, на котором нельзя было оценить
преимуществ новой памяти. С Pentium4 все совершенно иначе — его 400 MHz
системная шина обеспечивает пропускную способность, близкую к таковой у шины
памяти, поэтому использование RDRAM имеет преимущества. На этом IDF
разнообразной рекламной ботвы было гораздо меньше, это был, пожалуй,
единственный случай, когда можно было оценить реальную производительность
текущих продуктов, а также узнать о планах на будущее. Как уже неоднократно
говорилось во множестве обзоров Pentium4, все его преимущества могут
проявиться только в строго определенных условиях. Одно из этих самых важных
условий — оптимизация приложений под SSE2. Исторически сложилось так, что
новый софт и игры требовали больших ресурсов, чем могло обеспечить в то время
железо. Если приложения завтрашнего дня потребуют значительных ресурсов,
Pentium4 должен справиться с ними, так? Имея на вооружении системную шину с
пропускной способностью 3.2 GB/s (пиковая теоретическая) и шиной памяти с
подобной пропускной способностью, Pentium4 должен проявить себя в подобных
приложениях с лучшей стороны.
Проблема оптимизации под SSE2 находится в
руках девелоперов. Intel опубликовала свои последние компиляторы и занимается
всяческим тюнингом софта, чтобы помочь разработчикам включить оптимизацию под
SSE2 там, где это только возможно. Поскольку AMD решила включить поддержку
SSE2 в свой линейке процессоров x86-64, то вопрос об использовании SSE2
отпадает сам собой. Но все это произойдет где-то, когда-то... До того, как
это произойдет, Intel, само собой, увеличивает скорость процессора. Во второй
половине этого года Pentium4 должны перевести на более тонкий процесс
производства. Было подтверждено, что 0.13-микронный Pentium4 (кодовое
название "Northwood") дебютирует на частоте, превышающей 2GHz, хотя возможны
версии с более низкой частотой. Новое ядро будет иметь примерно вдвое (!)
меньшую площадь по сравнению с настоящими Pentium4, ядро которого имеет
площадь 217 mm2. За счет уменьшения ядра Intel cможет увеличить размер кэша
Pentium4 до 512 Кб, но эта информация не была подтверждена. 2.1-2.5 GHz
Pentium4 должны обеспечивать потрясающую производительность, что окончательно
дифференцирует их с Pentium III, производительность которого в современных
приложениях бывает на уровне P4. Так что если вы решили перейти на Pentium4,
подождите 0.13-микронную модель. Все же на один вопрос не был получен ответ
— будет ли новый Pentium4 точной копией старого, за исключением тонкого
техпроцесса, или же его архитектура претерпела некоторые изменения? Будет
уместным сравнить Pentium4 с Pentium Pro. Как вы помните, в конце 1995 года,
когда появился Pentium Pro, его 16-битная производительность была низкой,
ниже, чем у обычных Pentium. Но Intel заявила, что будущее за 32-битными
приложениями (и не солгала). Но когда появилась следующая инкарнация
архитектуры P6, в ней были некоторые изменения, благодаря которым Pentium II в
16-разрядных приложениях оказался быстрее, чем Pentium Pro. Настоящей
проверкой веры Intel в архитектуру Pentium4 будет "Northwood" — либо старая
архитектура, либо несколько доработанная. Intel продолжает держаться за
RDRAM, которая действительно демонстрирует свои преимущества при использовании
ее вместе с Pentium4. Сравним цены на данный тип памяти с ценами на DDR
SDRAM: На графике изображены цены на RDRAM и DDR SDRAM на протяжении двух
месяцев. Цены на PC133 не приводятся, потому как, несмотря на заверения
производителей, ни один из типов памяти даже близко не стоит с PC133 в плане
цены. К концу прошлого года цена DDR SDRAM стала стремительно возрастать,
Intel была этому несказанно рада, ведь можно было сказать, что RDRAM стала
дешевле DDR, но не тут-то было: цены на DDR постепенно снизились, и сейчас
модули этих типов памяти стоят примерно одинаково, однако их сложно назвать
конкурентными по сравнению с PC133.
Intel заявила о том, что линейка их
настольных процессоров будет рассчитана на работу с RDRAM, а PC133 SRDAM будет
использоваться на системах low-end класса и системах начального уровня. Как и
предполагалось, планы Intel насчет DDR SDRAM не изменились — Intel
рассматривает этот тип памяти как возможное решение для серверов, но не для
настольных систем. Intel считает, что если цены на RDRAM будут снижаться, то в
решении с DDR памятью не будет смысла — такая система на базе чипсета i850
будет медленнее варианта с DDR SDRAM. Intel серьезно заинтересована в
снижении цен на RDRAM и активно работает над этим с производителями памяти. В
2002 году появится новая форма RDRAM, известная как 4i. 4i означает 4
независимых (independent) банка, составляющие модуль RDRAM. Текущие модули
RDRAM представляют собой 2x16d. Литера d означает "dependent", т.е. зависимые
банки, а 16 — их число. С переходом на 4i Rambus надеется уменьшить размер
ядра, что в конечном счете снизит стоимость модуля. Естественно, для 4i
понадобится новый RDRAM чипсет. Видимо, продажи PC800 увеличились, иначе
сложно объяснить тот факт, что возможно появление памяти с увеличенной
частотой — PC1066. Если Intel в следующем году увеличит частоту системной шины
Pentium4, PC1066 окажется очень высокопроизводительным решением. Intel
представила и свою системную плату, представляющую собой DDR решение для
Pentium4 (чипсет "Brookdale"), платы на котором должны были появиться в конце
этого года, как следовало из Intel Roadmap, но теперь появление плат
перенесено на 2002 год. Решение на чипсете "Brookdale" с SDR памятью все же
появится в конце этого года. Хотя можно представить, какой удар по
производительности нанесет использование медленной памяти, пропускная
способность которой составляет 1/3 RDRAM. Это может стать причиной наличия у
"Northwood" 512 Кб кэша L2. Для того сегмента рынка, на который нацелен SDR
"Brookdale" (системы на P4 начального уровня), решение очень неплохое при
наличии 512 Кб кэша L2 у процессора.
Уже при закрытии IDF был сделан
еще один интересный анонс. Как вы, наверно, знаете, серверная версия Pentium4
имеет кодовое название "Foster". Оригинальный Pentium4 представляет собой
uni-processor CPU, это значит, что этот процессор не будет работать на
многопроцессорных системных платах — Intel решила, что только "Foster" будет
использоваться на серверном рынке. "Foster" можно назвать Pentium4 Xeon, как и
Pentium III Xeon, получивший свое название от прародителя — Pentium III.
Однако стало известно, Intel не придумала ничего умнее, как назвать Foster
просто Intel Xeon. Вероятно, подобный шаг связан отчасти с тем, чтобы
подчеркнуть отличие Foster'а от Pentium4. Конечно же, Xeon будет иметь намного
больший объем кэша, нежели Pentium4, основываться на той же архитектуре
NetBurst, но, пожалуй, на этом сходство этих процессоров и
заканчивается. Есть предположение, что Intel Xeon будет иметь некоторые
фичи, которые в Intel называют технологией Jackson. Предполагается, что
технология Jackson приносит процессорному ядру Simultaneous Multithreaded
(SMT) функциональность. Если говорить кратко, ограничение одного процессора
состоит в том, что на аппаратном уровне он может одновременно выполнять только
один поток. Преимущества SMT состоят в том, что процессор сможет выполнять
несколько потоков одновременно. Теоретическое число инструкций, которые может
выполнять процессор за такт (IPC) в сравнении с фактическим IPC процессора, в
реальности составляет довольно большое отношение, поскольку процессор далеко
не всегда "занят" и определенная его вычислительная мощность пропадает
зря. При возможности выполнять несколько потоков на одном процессоре,
значительно увеличится его эффективность — это и есть основное преимущество
технологии SMT (Jackson). Хотя Intel отказывается комментировать это,
технология SMT, скорее всего, найдет применение в Intel Xeon.
6 апреля
2000 года Intel сделала очень интересное приобретение — Kuck & Associates
Inc. (KAI). Чем же занималась KAI до этого? Вот, что говорят представители
Intel: "KAI — ведущий поставщик высокопроизводительных компиляторов и
программных средств, используемых при разработке многопоточных приложений.
Приобретение компании сделано с целью расширить и ускорить разработку
многопроцессорных решений". KAI имела ведущую роль в разработке OpenMP —
стандарта разработки многопоточных приложений. С внедрением данного стандарта
в компиляторы, Intel сможет продвигать код, который будет эффективным не
только на многопроцессорных решениях, но и на Simultaneous Multithreaded
процессорах. Intel Xeon будет запущен во второй половине этого года в
двухпроцессорных системах. Мультипроцессорные системы на базе этого процессора
появятся ближе к концу года. Начальная частота процессора составит 1.4
GHz. Intel Xeon будет первым процессором для серверов/рабочих станций,
который будет иметь форм-фактор microPGA. Интерфейс процессора известен как
mPGA600. Хотя процессор и будет иметь больше пинов, нежели Pentium4 (600
вместо 423), контакты будут занимать меньшую площадь, поскольку они
расположены ближе друг к другу (отсюда и название — microPinGirdArray).
microPGA форм-фактор будет ранее использован в процессоре с ядром Northwood,
0.13-микронном Pentium4 с интерфейсом mPGA478. В этом квартале начнутся
поставки версии Pentium III Xeon c частотой 900 MHz и "увеличенным объемом
кэша". Под "увеличенным объемом" имеется в виду 2 Mb on-die кэша
L2.
Кстати, интересная диаграмма: Как вы видите, большая часть
серверного рынка — это одно- и двухпроцессорные системы. Однако прибыль
значительно увеличивается, когда речь идет о 4-х или 8-процессорных серверах,
так что Intel очень заинтересована в этих рынках. Насколько популярна Intel на
серверном рынке? Лидирующие позиции Intel держит на рынке одно- и
двухпроцессорных серверов — 84%. Однако очень скоро на этот рынок также придет
AMD, которая вполне может значительно уменьшить долю систем с процессорами
Intel, при условии, что чипсет AMD 760MP окажется удачным решением. Не
менее внушительные позиции у Intel на рынке 4-way серверов. Это связано с
сегментацией линеек продуктов Intel — Pentium Pro и последовавший вслед за ним
Pentium II Xeon около трех лет назад. Разработка P2 Xeon была не проблемой для
Intel — это всего лишь Pentium II с увеличенным объемом кэша и несколькими
server-oriented фичами. Как бы там ни было, а Intel занимает значительную
часть 4-way серверного рынка. Новый Intel Xeon определенно будет развивать
успех Intel на этом рынке, хотя бы потому, что определенное время не будет
конкурента в лице AMD. Что интересно — на рынке 8-way серверов доля решений
Intel даже меньше 50% — здесь доминирует Sun. На этом рынке у Intel Xeon нет
практически никаких шансов — это территория Itanium (IA-64), так что теперь
все зависит от успеха последнего. Рынок 8-way серверов приносит самые большие
прибыли, поэтому Intel очень заинтересована в нем.
Как уже говорилось,
решения Intel с DDR памятью будут предназначены прежде всего для серверов, в
то же время Intel пока не имеет DDR чипсета. А как же Intel Xeon, который
будет запущен в следующем квартале? Intel особенно не беспокоится по этому
поводу, так как не собирается быть основным поставщиком чипсетов для Xeon,
сама Intel будет выпускать для Xeon чипсет i860 (многопроцессорная версия
i850) с RDRAM. Еще один чипсет для Xeon представит ServerWorks, известная
своим чипсетом ServerSet III HEsl, который использует два канала 64-битной
interleaved PC133 SDRAM для обеспечения пропускной способности DDR SDRAM при
цене PC133 SDRAM. Основная проблема заключалась в том, что 133 MHz системная
шина Pentium III не способна обеспечить подобную пропускную способность, а вот
100 MHz quad-pumped FSB Pentium4 — в самый раз. Поскольку Intel Xeon
использует ту же FSB, что и оригинальный Pentium4, и учитывая то, насколько
требователен P4 к пропускной способности памяти, представьте себе, какую
пропускную способность потребуют два или четыре Xeon'а. И это при SMT, когда
потребуется доступ к большому объему данных одновременно — здесь не поможет
даже 4-way interleaving SDRAM контроллер. Но все же решение нашли. Как
известно, quad-pumped системная шина Pentium4 работает на частоте 100 MHz.
"Quad-pumped" означает, что ее пропуская способность эквивалентна 400 MHz
шине. Как утверждают производители системных плат, очень сложно создать
решение, у которого частоты DDR памяти и FSB являются асинхронными. Отсюда
следует, что с Pentium4 можно использовать только PC1600 DDR SDRAM (или, как
ее любят называть в Intel, DDR200), частота которой 100 MHz. Пропускная
способность PC1600 равна 1.6GB/s — как у одного канала PC800 RDRAM. Вот тут-то
ServerWorks и применила опыт своих былых разработок.
Чипсет ServerWorks
Grand Champion HE поддерживает до 4 процессоров Intel Xeon, а также использует
4-way interleaved DDR200 шину памяти. Следовательно, пропускная способность
памяти при использовании этого чипсета равна: (частота памяти 100
MHz)*2(потому как DDR)*64-битный доступ=1.6GB/s для памяти PC1600/DDR200. И
еще умножим эту цифирку на 4 (4-way interleave) и получим 6.4 GB/s! Не
хило... Чтобы обеспечить эту немаленькую пропускную способность памяти,
чипсет Grand Champion HE использует северный мост приблизительно с 1000 пинов,
а также еще 5 чипов, которые вместе составляют подсистему контроллера
памяти. Также чипсет поддерживает до трех шин PCI-X (количество шин
пропорционально количеству контроллеров PCI-X, имеющихся на плате), а также
имеет южный мост, поддерживающий ATA-100, но в настоящее время работает только
с ATA-66. Все же есть и недостатки. Самый главный заключается в том, что
при увеличении частоты DDR памяти ее пропускная способность на этом чипсете
останется прежней — ведь частота памяти должна быть 100 MHz, как и у системной
шины. Была упомянута поддержка DDR400, а толку-то? Хотя, есть еще как минимум
год, пока появится подобная память. Как стало известно, ServerWorks Grand
Champion HE начнет поставляться во втором квартале этого года, но есть
предположение, что поставки могут начаться раньше.
Представителям
ServerWorks был задан вопрос, что они думают о появлении AMD на серверном
рынке и возможно ли сотрудничество компании с AMD. Ответ был довольно
интересным, в нем можно выделить несколько ключевых пунктов: 1. AMD
нуждается в FSB с большей пропускной способностью. Даже при частоте 266 MHz
шина EV6 не способна обеспечить сравнимую с FSB P4/Xeon пропускную
способность. Интересное заявление, на которое есть веский контраргумент: EV6 —
это протокол point-to-point, т.е. каждый процессор получает выделенный путь к
северному мосту, что в конечном счете обеспечит большую суммарную пропускную
способность при использовании нескольких процессоров. 2. Где же ты — PCI-X?
Пропускной способности даже 64-битной PCI не достаточно для Gigabit Ethernet и
high-end RAID массивов. 3. AMD должна инвестировать разработку новых
технологий. Намек поняли — очевидно, парни из ServerWorks хотели сказать, что
AMD не инвестирует те технологии, разработкой которых занимается ServerWorks.
А как же AMD 760MP — это ведь только первый шаг. Интересные аргументы...
Ну, что же, перейдем к последней теме, затронутой в этом обзоре. На двух
прошедших IDF основное внимание уделялось Pentium4 и процессору с архитектурой
IA-64 — Itanium. Сейчас речь пойдет о преемнике Itanium — McKinley. Небольшое
дополнение, касающееся Itanium, — этот процессор будет выпущен во втором
квартале этого года. Начальная частота составит 733 MHz, чип будет снабжен
off-die L3 кэшем. McKinley же, который наверняка будет иметь название,
производное от Itanium, появится в конце этого года, поставки начнутся в 2002
году. McKinley будет иметь довольно серьезные отличия от Itanium, включая
новую FSB, пропускная способность которой будет втрое выше, чем у системной
шины Itanium, кэш L3, в отличие от Itanium, будет расположен в ядре. Тот
факт, что чип будет иметь on-die кэш L3, позволяет предположить, что McKinley
будет производиться по 0.13 мкм процессу, благодаря чему по сравнению с
Itanium площадь ядра уменьшится на 50%. Тонкий процесс позволит увеличить
частоту чипа, что сделает McKinley одним из претендентов на рынок 8-way
серверов.
Недавно Intel получила первоначальные степпинги McKinley,
произведенные на ее фабриках, и продемонстрировала несколько систем с
McKinley, работающих под управлением 64-битной Windows XP, 64-битной Linux и
HP Unix. Кстати, вот пара фотографий McKinley, который интегрирован в
картридж и имеет источник питания. Картридж не занимает много места,
поэтому McKinley может использоваться в 1U стойках. Ниже приведена фотография
1U корпуса с McKinley. Проблему охлаждения решает очень большой бловер с
частотой вращения 2800RPM, расположенный в передней части корпуса. Когда
появились первые платы на i820, модули RDRAM стоили огромных денег — около
$1000 за 128 Mb модуль. Чтобы исправить ситуацию, Intel разработала чип MTH —
Memory Translator Hub, который располагался между Memory Controller Hub i820 и
банками памяти, чтобы транслировать 16-битные 400 MHz сигналы RDRAM в
64-битные 133 MHz PC133 SDRAM сигналы. Естественно, это приводило к падению
производительности — порядка 10-20% по сравнению с PC800 RDRAM без
MTH.
Для i840, поскольку это двухканальный RDRAM дизайн, Intel
разработала новый чип, названный SDRAM Memory Repeater Hub (MRH-S), который
выполнял те же функции, что MTH. Из-за проблем, возникающих при работе, MTH и
MRH-S были отозваны. Кое-что интересное привлекло внимание на презентации
McKinley. Поскольку McKinley предназначен для серверов, заявление о том, что
DDR SRDRAM будет предназначаться только для серверов, подтверждается. McKinley
будет использовать чипсет i870, и следующая диаграмма заставляет нахмурить
брови и задуматься: У меня что-то со зрением или между чипсетом i870 и DDR
SDRAM действительно расположен чип MRH-D? Да-да, это DDR SDRAM Memory Repeater
Hub, который похож на MRH-S, который, в свою очередь, представляет собой
вариант MTH, который все ненавидят. А ведь эта гадость может сильно снижать
производительность McKinley... И, наконец, совершенно дурацкий вопрос: а
что, i870 не имеет родного контроллера DDR SDRAM? Или Intel планирует в
дальнейшем на серверном рынке использовать RDRAM?
К счастью, стало известно, что в десктоп DDR чипсетах этой гадости (MRH-D)
не будет. На диаграмме, расположенной ниже, представлена схема десктоп DDR
чипсета, имеющего кодовое название Plumas. Ну, вот, собственно, и все.
Многое осталось "за кадром", но в данном обзоре представлена самая интересная
информация, касающаяся чипсетов и процессоров на прошедшем
IDF.
Подготовил Пирожков Дмитрий По материалам 3Dnews и
AnandTech
|