Тарифы Услуги Сим-карты

Сравнение процессоров pentium 4. Процессоры Intel Pentium4 LGA775

integrated heat spreader ) кристаллом, установленную на плату-переходник (англ. interposer ) с 423 штырьковыми контактами (размеры корпуса - 53,3×53,3 мм) . Между контактами на обратной стороне платы-переходника установлены SMD -элементы.

Поздние процессоры на ядре Willamette, процессоры Pentium 4 на ядре Northwood, часть процессоров Pentium 4 Extreme Edition на ядре Gallatin и ранние процессоры на ядре Prescott с по 2005 год выпускались в корпусе типа FC-mPGA2 , представлявшем собой подложку из органического материала с закрытым теплораспределительной крышкой кристаллом с лицевой стороны и 478 штырьковыми контактами, а также SMD-элементами, с обратной (размеры корпуса - 35×35 мм).

Часть процессоров Pentium 4 Extreme Edition на ядре Gallatin, поздние процессоры на ядре Prescott, процессоры на ядрах Prescott-2M и Cedar Mill c весны по осень 2007 года выпускались в корпусе типа FC-LGA4 , представлявшем собой подложку из органического материала с закрытым теплораспределительной крышкой кристаллом с лицевой стороны и 775 контактными площадками с обратной (размеры корпуса - 37,5×37,5 мм). Как и в двух предыдущих типах корпусов, между контактами установлены SMD-элементы.

Часть мобильных процессоров на ядре Northwood выпускалась в корпусе типа FC-mPGA . Основным отличием этого типа корпуса от FC-mPGA2 является отсутствие теплораспределительной крышки.

Маркировка процессоров, имеющих теплораспределительную крышку, нанесена на её поверхность, а у остальных процессоров маркировка нанесена на две наклейки, расположенные на подложке с двух сторон от кристалла.

Особенности архитектуры

Конвейер процессора на ядре Northwood

Конвейер состоит из 20 стадий:

  • TC, NI (1, 2) - поиск микроопераций, на которые указывает последняя выполненная инструкция.
  • TR, F (3, 4) - выборка микроопераций.
  • D (5) - перемещение микроопераций.
  • AR (6-8) - резервирование ресурсов процессора, переименование регистров.
  • Q (9) - постановка микроопераций в очереди.
  • S (10-12) - изменение порядка исполнения.
  • D (13-14) - подготовка к исполнению, выборка операндов.
  • R (15-16) - чтение операндов из регистрового файла.
  • E (17) - исполнение.
  • F (18) - вычисление флагов.
  • BC, D (19, 20) - проверка корректности результата.

Архитектура NetBurst (рабочее наименование - P68 ), лежащая в основе процессоров Pentium 4, разрабатывалась компанией Intel, в первую очередь, с целью достижения высоких тактовых частот процессоров. NetBurst не является развитием архитектуры , использовавшейся в процессорах Pentium III , а представляет собой принципиально новую по сравнению с предшественниками архитектуру. Характерными особенностями архитектуры NetBurst являются гиперконвейеризация и применение кэша последовательностей микроопераций вместо традиционного кэша инструкций. АЛУ процессоров архитектуры NetBurst также имеет существенные отличия от АЛУ процессоров других архитектур.

Основными недостатками длинного конвейера являются уменьшение удельной производительности по сравнению с коротким конвейером (за один такт выполняется меньшее количество инструкций), а также серьёзные потери производительности при некорректном выполнении инструкций (например, при неверно предсказанном условном переходе или кэш-промахе).

Для минимизации влияния неверно предсказанных переходов, в процессорах архитектуры NetBurst используются увеличенный по сравнению с предшественниками буфер предсказания ветвлений (англ. branch target buffer ) и новый алгоритм предсказания ветвлений, что позволило достичь высокой точности предсказания (около 94 %) в процессорах на ядре Willamette. В последующих ядрах механизм предсказания ветвлений подвергался модернизациям, повышавшим точность предсказания.

Кэш последовательностей микроопераций (англ. Execution Trace Cache )

Процессоры архитектуры NetBurst, как и большинство современных x86 -совместимых процессоров, являются CISC -процессорами с RISC -ядром: перед исполнением сложные инструкции x86 преобразуются в более простой набор внутренних инструкций (микроопераций), что позволяет повысить скорость обработки команд. Однако, вследствие того, что инструкции x86 имеют переменную длину и не имеют фиксированного формата, их декодирование связано с существенными временными затратами.

В связи с этим, при разработке архитектуры NetBurst было принято решение отказаться от традиционной кэш-памяти инструкций первого уровня, хранящей команды x86, в пользу кэша последовательностей микроопераций, хранящего последовательности микроопераций в соответствии с предполагаемым порядком их исполнения. Такая организация кэш-памяти позволила также снизить временные затраты на выполнение условных переходов и на выборку инструкций.

АЛУ и механизм ускоренного выполнения целочисленных операций (англ. Rapid Execution Engine )

Так как основной целью разработки архитектуры NetBurst было повышение производительности за счёт достижения высоких тактовых частот, возникла необходимость увеличения темпа выполнения основных целочисленных операций. Для достижения этой цели АЛУ процессоров архитектуры NetBurst разделено на несколько блоков: «медленное АЛУ», способное выполнять большое количество целочисленных операций, и два «быстрых АЛУ», выполняющих только простейшие целочисленные операции (например, сложение). Выполнение операций на «быстрых АЛУ» происходит последовательно в три этапа: сначала вычисляются младшие разряды результата, затем старшие, после чего могут быть получены флаги.

«Быстрые АЛУ», обслуживающие их планировщики, а также регистровый файл синхронизируются по половине такта процессора, таким образом, эффективная частота их работы вдвое превышает частоту ядра. Эти блоки образуют механизм ускоренного выполнения целочисленных операций.

В процессорах на ядрах Willamette и Northwood «быстрые АЛУ» способны выполнять лишь те операции, которые обрабатывают операнды в направлении от младших разрядов к старшим. При этом результат вычисления младших разрядов может быть получен через половину такта. Таким образом, эффективная задержка составляет половину такта. В процессорах на ядрах Willamette и Northwood отсутствуют блоки целочисленного умножения и сдвига, а данные операции выполняются другими блоками (в частности, блоком инструкций MMX).

В процессорах на ядрах Prescott и Cedar Mill присутствует блок целочисленного умножения, а «быстрые АЛУ» способны выполнять операции сдвига. Эффективная задержка операций, исполняемых «быстрыми АЛУ», возросла по сравнению с процессорами на ядре Northwood и составляет один такт.

Система повторного исполнения микроопераций (англ. Replay System )

Основной задачей планировщиков микроопераций является определение готовности микроопераций к исполнению и передача их на конвейер. Вследствие большого числа стадий конвейера, планировщики вынуждены отправлять микрооперации на исполнительные блоки до того, как завершится выполнение предыдущих микроопераций. Это обеспечивает оптимальную загрузку исполнительных блоков процессора и позволяет избежать потери производительности в том случае, если данные, необходимые для выполнения микрооперации, находятся в кэш-памяти первого уровня, регистровом файле, или могут быть переданы минуя регистровый файл.

При определении готовности новых микроопераций к передаче на исполнительные блоки, планировщику необходимо определить время выполнения тех предыдущих микроопераций, результатом которых являются данные, необходимые для выполнения новых микроопераций. В том случае, если время выполнения заранее не определено, планировщик для его определения использует наименьшее время её выполнения.

Если оценка времени, необходимого для получения данных, оказалась верной, микрооперация выполняется успешно. В том случае, если данные не были получены вовремя, проверка корректности результата заканчивается неудачей. При этом микрооперация, результат выполнения которой оказался некорректен, ставится в специальную очередь (англ. replay queue ), а затем вновь направляется планировщиком на исполнение.

Несмотря на то, что повторное исполнение микроопераций приводит к значительным потерям производительности, применение данного механизма позволяет в случае ошибочного исполнения микроопераций избежать останова и сброса конвейера, который приводил бы к более серьёзным потерям.

Модели

Процессор с кодовым именем Willamette впервые появился в официальных планах компании Intel в октябре 1998 года , хотя его разработка и началась вскоре после завершения работ над процессором Pentium Pro , вышедшим в конце 1995 года , а название «Willamette» упоминалось в анонсах 1996 года . Необходимость в проектировании нового процессора архитектуры IA-32 появилась в связи со сложностями, возникшими при разработке 64-битного процессора Merced , которому в соответствии с планами компании Intel была отведена роль преемника процессоров архитектуры : разработка, осуществлявшаяся с 1994 года , сильно затянулась, а производительность Merced при выполнении инструкций x86 оказалась неудовлетворительной по сравнению с процессорами, для замены которых он предназначался .

Предполагалось, что Willamette выйдет во второй половине 1998 года , однако, в результате многочисленных задержек анонс был перенесён на конец 2000 года . В феврале 2000 года на форуме разработчиков Intel (IDF Spring 2000) был продемонстрирован компьютер, основой которого служил инженерный образец процессора Willamette, получившего наименование «Pentium 4», работающий на частоте 1,5 ГГц .

Первые серийные процессоры Pentium 4 на ядре , анонсированные 20 ноября 2000 года, производились по 180 нм технологии. Дальнейшим развитием семейства Pentium 4 стали процессоры на ядре , производившиеся по 130 нм технологии. 2 февраля 2004 года были представлены первые процессоры на ядре (90 нм), а последним ядром, использовавшимся в процессорах Pentium 4 стало ядро (65 нм). На базе ядер Northwood и Prescott выпускались также мобильные процессоры Pentium 4 и Pentium 4-M, представлявшие собой Pentium 4 с пониженным энергопотреблением. На базе всех ядер, перечисленных выше, выпускались также процессоры Celeron , предназначенные для бюджетных компьютеров, представлявшие собой Pentium 4 с уменьшенным объёмом кэш-памяти второго уровня и пониженной частотой системной шины .

Ниже представлены даты анонса различных моделей процессоров Pentium 4, а также их стоимость на момент анонса.

Мобильные процессоры Pentium 4
Процессор Pentium 4-M Mobile Pentium 4
Тактовая частота, ГГц 1,6 1,7 1,4 1,5 1,8 1,9 2 2,2 2,4 2,5 2,6 2,4 2,666 2,8 3,066 3,2 3,333
Анонсирован 4 марта 23 апреля 24 июня 16 сентября 14 января 16 апреля 11 июня 23 сентября 28 сентября
2002 года 2003 года 2004 года
Цена, $ 392 496 198 268 637 431 637 562 562 562 562 185 220 275 417 653 262

Pentium 4

Willamette

Pentium 4 1800 на ядре Willamette (FC-mPGA2)

Ещё до выхода первых Pentium 4 предполагалось, что и процессоры на ядре Willamette, и разъём Socket 423 будут присутствовать на рынке лишь до середины 2001 года, после чего будут заменены на процессоры на ядре Northwood и разъём Socket 478 . Однако, в связи с проблемами при внедрении 130 нм технологии, лучшим по сравнению с ожидавшимся процентом выхода годных кристаллов процессоров на ядре Willamette, а также необходимостью продажи уже выпущенных процессоров, анонс процессоров на ядре Northwood был отложен до 2002 года, а 27 августа 2001 года были представлены процессоры Pentium 4 в корпусе типа FC-mPGA2 (Socket 478), в основе которых по-прежнему лежало ядро Willamette .

Процессоры Pentium 4 на ядре Willamette работали на тактовой частоте 1,3-2 ГГц с частотой системной шины 400 МГц, напряжение ядра составляло 1,7-1,75 В в зависимости от модели, а максимальное тепловыделение - 100 Вт на частоте 2 ГГц .

Northwood

Intel Pentium 4 1800 на ядре Northwood

14 ноября 2002 года был представлен процессор Pentium 4 3066 МГц, поддерживающий технологию виртуальной многоядерности - Hyper-threading . Этот процессор оказался единственным процессором на ядре Northwood с частотой системной шины 533 МГц, обладавшим поддержкой технологии Hyper-threading. В дальнейшем эту технологию поддерживали все процессоры с частотой системной шины 800 МГц (2,4-3,4 ГГц) .

Характерной особенностью процессоров Pentium 4 на ядре Northwood была невозможность продолжительной работы при повышенном напряжении ядра (повышение напряжения ядра при разгоне является распространённым приёмом, позволяющим повысить стабильность работы на повышенных частотах ). Повышение напряжения ядра до 1,7 В приводило к быстрому выходу процессора из строя, несмотря на то, что температура кристалла при этом оставалась невысокой. Это явление, названное «синдромом внезапной смерти Northwood» (англ. sudden Northwood death syndrome ), серьёзно ограничивало разгон Pentium 4 на ядре Northwood .

Prescott

Pentium 4 2800E на ядре Prescott (Socket 478)

Pentium 4 3400 на ядре Prescott (LGA 775)

Процессоры Pentium 4 на ядре Prescott получили поддержку нового дополнительного набора команд - SSE3 , а также поддержку технологии EM64T (в ранних процессорах поддержка 64-битных расширений была отключена). Кроме того, была оптимизирована технология Hyper-threading (в частности, в набор SSE3 вошли инструкции, предназначенные для синхронизации потоков) .

В результате изменений, внесённых в архитектуру NetBurst, производительность процессоров на ядре Prescott изменилась по сравнению с процессорами на ядре Northwood, имеющими равную частоту, следующим образом: в однопоточных приложениях, использующих инструкции x87 , MMX , SSE и SSE2 , процессоры на ядре Prescott оказывались медленнее, чем предшественники, а в приложениях, использующих многопоточность или чувствительных к объёму кэш-памяти второго уровня, опережали их .

Cedar Mill

Pentium 4 641 на ядре Cedar Mill

Процессоры Pentium 4 на ядре Cedar Mill выпускались до 8 августа 2007 года , когда компания Intel объявила о снятии с производства всех процессоров архитектуры NetBurst.

Отменённые процессоры

Предполагалось, что в конце 2004 - начале 2005 годов на смену ядру Prescott в настольных процессорах Pentium 4 придёт новое ядро Tejas. Процессоры на ядре Tejas должны были выпускаться по 90 нм технологии, работать на частоте от 4,4 ГГц с частотой системной шины 1066 МГц, иметь увеличенный до 24 Кбайт кэш первого уровня и улучшенную поддержку технологии Hyper-threading . В конце 2005 года процессоры на ядре Tejas должны были быть переведены на 65 нм технологию производства и достичь частоты 9,2 ГГц . В перспективе тактовая частота процессоров архитектуры NetBurst должна была превысить отметку в 10 ГГц, однако сроки анонса Tejas постоянно переносились, процессоры на ядре Prescott не смогли достичь частоты 4 ГГц из-за проблем с тепловыделением, в связи с чем в начале 2004 года появилась информация об отмене выпуска процессоров на ядре Tejas , а 7 мая 2004 года компания Intel официально объявила о прекращении работы как над ядром Tejas, так и над перспективными разработками, основанными на архитектуре NetBurst .

Pentium 4 Extreme Edition

Первые процессоры Pentium 4 Extreme Edition (Pentium 4 «EE» или «XE»), предназначенные для энтузиастов , были представлены компанией Intel 3 ноября 2003 года. В их основе лежало ядро Gallatin, использовавшееся в серверных процессорах Xeon и представлявшее собой ядро Northwood ревизии M0 с кэш-памятью третьего уровня объёмом 2 Мбайт . Площадь кристалла таких процессоров составляла 237 мм².

Процессоры Pentium 4 EE на ядре Gallatin работали на частоте 3,2-3,466 ГГц, имели частоту системной шины 1066 МГц для модели, работающей на 3,466 ГГц, и 800 МГц для остальных моделей (3,2 и 3,4 ГГц). Напряжение ядра составляло 1,4-1,55 В, а максимальное тепловыделение - 125,59 Вт на частоте 3,466 ГГц. Изначально процессоры Pentium 4 EE ядре Gallatin выпускались в корпусе типа FC-mPGA2 (Socket 478), а затем - в корпусе типа FC-LGA4 (LGA775).

21 февраля 2005 года компанией Intel был представлен процессор Pentium 4 EE на ядре Prescott 2M. Он выпускался в корпусе типа FC-LGA4, предназначался для установки в системные платы с разъёмом LGA775 и работал на частоте 3,733 ГГц. Частота системной шины составляла 1066 МГц, напряжение питания - 1,4 В, максимальное тепловыделение - 148,16 Вт.

Дальнейшим развитием семейства Extreme Edition стали двухъядерные процессоры Pentium XE .

Pentium 4-M и Mobile Pentium 4

Мобильные процессоры Pentium 4-M представляли собой Pentium 4 на ядре Northwood, имеющие пониженное напряжение питания и тепловыделение, а также поддерживающие энергосберегающую технологию Intel SpeedStep . Максимально допустимая температура корпуса была повышена по сравнению с процессорами для настольных компьютеров и составляла 100 °C (у настольных процессоров на ядре Northwood - от 68 до 75 °C), что было связано с условиями работы в ноутбуке (небольшое воздушное пространство и размеры радиатора, менее сильный воздушный поток).

Все процессоры Pentium 4-M работали с частотой системной шины 400 МГц. Напряжение ядра процессоров Pentium 4-M составляло 1,3 В, максимальное тепловыделение - 48,78 Вт на частоте 2,666 ГГц, типичное - 35 Вт, в режиме пониженного энергопотребления - 13,69 Вт. Процессоры Pentium 4-M работали на частотах от 1,4 до 2,666 ГГц.

Процессоры Mobile Pentium 4 представляли собой Pentium 4 на ядрах Northwood или Prescott и работали на более высоких по сравнению с Pentium 4-M тактовых частотах - от 2,4 до 3,466 ГГц. Некоторые процессоры Mobile Pentium 4 поддерживали технологию Hyper-threading.

Все процессоры Mobile Pentium 4 работали с частотой системной шины 533 МГц. Напряжение ядра составляло 1,325-1,55 В, максимальное тепловыделение - 112 Вт на частоте 3,466 ГГц, типичное - от 59,8 до 88 Вт, в режиме пониженного энергопотребления - от 34,06 до 53,68 Вт.

Положение на рынке

Процессоры Pentium 4 Extreme Edition являлись «имиджевыми » процессорами, а оптовая цена на эти процессоры в момент анонса всегда составляла 999 $ .

Несмотря на то, что в течение года после анонса Pentium 4 основу продаж компании Intel по-прежнему составляли процессоры Pentium III (это было связано с крайне высокой стоимостью систем на базе Pentium 4 в сочетании с памятью типа RDRAM , альтернативы которой не было до выхода набора микросхем Intel 845 осенью 2001 года ), впоследствии благодаря агрессивной рекламной и маркетинговой политике компании Intel (в том числе, предоставление скидок производителям компьютеров и торговым сетям за использование и продажу исключительно продукции Intel, а также выплаты за отказ от использования продукции конкурентов ) в сочетании с неудачной маркетинговой политикой основного конкурента - компании AMD, процессоры Pentium 4 стали популярны среди пользователей . Этому также способствовала более высокая тактовая частота процессоров Pentium 4 (в частности, из-за высокой тактовой частоты процессоров конкурента, а также популярности «мифа о мегагерцах » , компания AMD была вынуждена ввести рейтинг производительности процессоров Athlon XP, нередко вводивший неопытных пользователей в заблуждение ). Тем не менее, компании AMD удалось серьёзно потеснить Intel на рынке микропроцессоров благодаря удачным продуктам - ранним Athlon XP и Athlon 64, превосходившим процессоры Pentium 4 в производительности и имеющим меньшую стоимость. Так, с 2000 по 2001 год компании AMD удалось увеличить свою долю на рынке процессоров архитектуры x86 с 18 % до 22 % (доля Intel при этом сократилась с 82,2 % до 78,7 %), а после решения проблем, возникших у AMD в 2002 году, когда её доля на рынке сократилась до 14 %, с 2003 по 2006 - до 26 % (доля Intel - около 73 %) .

Сравнение с конкурентами

Параллельно с процессорами семейства Pentium 4 существовали следующие x86-процессоры:

  • Intel Pentium III-S (Tualatin). Предназначались для рабочих станций и серверов. Несмотря на меньшую тактовую частоту, по производительности превосходили процессоры Pentium 4 на ядре Willamette в большинстве задач. Кроме того, в отличие от Pentium 4, процессоры Pentium III-S могли работать в двухпроцессорной конфигурации. Также компанией Intel выпускались процессоры Pentium III на ядре Tualatin, отличавшиеся от Pentium III-S меньшим объёмом кэш-памяти второго уровня. Оба этих процессора не получили широкого распространения: они были представлены позже, чем Pentium 4, являвшиеся в то время флагманскими процессорами компании Intel, и стоили значительно дороже, чем Pentium 4, имеющие сравнимую производительность .
  • Intel Celeron (Tualatin). Представляли собой Pentium III с уменьшенной частотой системной шины, предназначались для недорогих систем и в целом уступали процессорам Pentium 4 за счёт меньшей тактовой частоты (старшая модель Celeron работала на частоте 1,4 ГГц, в то время, как младшая модель Pentium 4 - на 1,3 ГГц) и небольшой пропускной способности памяти (в системах на процессорах Celeron обычно использовалась память PC133 SDRAM , а процессоры Pentium 4 чаще всего работали с памятью типа RDRAM или DDR SDRAM) и системной шины (100 МГц против 400 МГц) . Производительность разогнанных Celeron была сравнима с производительностью равночастотных Pentium 4 при более низкой цене .
  • Intel Celeron (Willamette-128 и Northwood-128), Celeron D (Prescott-256 и Cedar Mill-512). Представляли собой Pentium 4 с уменьшенными частотой системной шины и размером кэш-памяти второго уровня, предназначались для недорогих систем и всегда уступали процессорам Pentium 4. В некоторых задачах Celeron на ядре Willamette-128 уступали также и предшественникам (Celeron на ядре Tualatin) со значительно более низкими частотами .
  • Intel Pentium M и Celeron M . Являлись дальнейшим развитием процессоров Pentium III. Предназначались для мобильных компьютеров, обладали низким энергопотреблением и тепловыделением. Pentium M опережал как большинство мобильных Pentium 4 M, так и некоторые настольные процессоры Pentium 4, обладая при этом значительно меньшими тактовой частотой и тепловыделением . Процессор Celeron M имел близкую к Pentium M производительность, незначительно отставая от него.
  • Intel Pentium D (Presler, Smithfield). Двухъядерные процессоры, представлявшие собой два ядра Prescott (процессоры на ядре Smithfield) или Cedar Mill (Presler), находящиеся либо на одном кристалле (Smithfield), либо в одном корпусе (Presler). Опережали равночастотные Pentium 4 в большинстве задач. Однако процессоры Pentium 4 имели большую тактовую частоту, чем Pentium D (старшая модель Pentium D на ядре Smithfield работала на частоте 3,2 ГГц, а старшая модель Pentium 4 - на 3,8 ГГц), что позволяло им опережать двухъядерные процессоры в задачах, не оптимизированных под многопоточность .
  • AMD Athlon (Thunderbird). Конкурировали с процессорами Pentium 4 на ядре Willamette. В задачах, использующих дополнительные наборы инструкций SSE и SSE2 , требующих высокой пропускной способности памяти, а также в приложениях, оптимизированных под архитектуру NetBurst (приложения, работающие с потоковыми данными), процессоры Athlon уступали процессорам Pentium 4, однако в офисных и бизнес-приложениях, задачах трёхмерного моделирования, а также в математических расчётах, процессоры Athlon показывали более высокую производительность .
  • AMD Athlon XP . Конкурировали в основном с процессорами Pentium 4 на ядре Northwood. В названиях моделей этих процессоров фигурировала не тактовая частота, а рейтинг, показывающий производительность процессоров Athlon XP относительно Pentium 4. «Равнорейтинговые» Athlon XP уступали процессорам Pentium 4 в приложениях, оптимизированных под архитектуру NetBurst, требовавших наличие поддержки инструкций SSE2 или высокой пропускной способности памяти, однако значительно опережали их в вычислениях с плавающей запятой и неоптимизированных приложениях. Старшие Pentium 4 опережали конкурента в большинстве приложений .
  • AMD Athlon 64 . Конкурировали в основном с процессорами Pentium 4 на ядре Prescott. Опережали их в ряде задач (например, офисные приложения, научные расчёты или игры) за счёт меньших задержек при работе с памятью (за счёт встроенного контроллера памяти) и более эффективного математического сопроцессора, уступали процессорам Pentium 4 в задачах, оптимизированных под архитектуру NetBurst или имеющих поддержку многопоточности (например, кодирование видео) .
  • AMD Athlon 64 FX . Конкурировали с процессорами Pentium 4 Extreme Edition. Как и в случае с Athlon 64 и Pentium 4, Athlon 64 FX опережали конкурентов за счёт архитектурных особенностей, интегрированного контроллера памяти или более эффективного математического сопроцессора, уступая им в задачах, оптимизированных под архитектуру NetBurst или имеющих поддержку многопоточности .
  • AMD Duron (Morgan и Applebred). Были нацелены на рынок недорогих процессоров и конкурировали с процессорами Celeron, в целом уступая процессорам Pentium 4, однако в некоторых приложениях, которые не были оптимизированы под архитектуру NetBurst и не использовали набор инструкций SSE2, могли опережать Pentium 4, имеющие значительно более высокие тактовые частоты .
  • VIA C3 (Nehemiah) и VIA Eden. Предназначались для компьютеров с низким энергопотреблением и ноутбуков (C3 и Eden-N) и для интегрирования в системные платы (Eden), имели низкую производительность и уступали конкурирующим процессорам.
  • VIA C7 . Также, как и процессоры VIA C3, предназначались для компьютеров с низким энергопотреблением и ноутбуков. Серьёзно уступали конкурентам и могли опережать их только в задачах шифрования (за счёт его аппаратной поддержки) .
  • Transmeta Efficeon . Предназначались для ноутбуков, имели низкое энергопотребление и тепловыделение. Уступали в большинстве задач мобильным процессорам AMD и Intel, опережая мобильные процессоры VIA .

Работавшие на высокой частоте процессоры Pentium 4 отличались большим энергопотреблением и, как следствие, тепловыделением. Максимальная тактовая частота серийных процессоров Pentium 4 составила 3,8 ГГц, при этом типичное тепловыделение превысило 100 Вт , а максимальное - 150 Вт . Однако при этом процессоры Pentium 4 были лучше защищены от перегрева, чем конкурирующие процессоры. Работа Thermal Monitor - технологии термозащиты процессоров Pentium 4 (а также последующих процессоров Intel) - основана на механизме модуляции тактового сигнала (англ. clock modulation ), позволяющем регулировать эффективную частоту работы ядра с помощью введения холостых циклов - периодического отключения подачи тактового сигнала на функциональные блоки процессора («пропуск тактов», «троттлинг »). При достижении порогового значения температуры кристалла, зависящего от модели процессора, автоматически включается механизм модуляции тактового сигнала, эффективная частота снижается (при этом определить её снижение можно либо по замедлению работы системы, либо с помощью специального программного обеспечения, так как фактическая частота остаётся неизменной), а рост температуры замедляется. В том случае, если температура всё же достигает максимально допустимой, происходит отключение системы . Кроме того, поздние процессоры Pentium 4 (начиная с ядра Prescott ревизии E0 ), предназначенные для установки в разъём Socket 775, обладали поддержкой технологии Thermal Monitor 2, позволяющей снижать температуру путём снижения фактической тактовой частоты (с помощью понижения множителя) и напряжения ядра .

Наглядным примером эффективности термозащиты процессоров Pentium 4 стал эксперимент, проведённый в 2001 году Томасом Пабстом. Целью этого эксперимента являлось сравнение эффективности термозащиты процессоров Athlon 1,4 ГГц, Athlon MP 1,2 ГГц, Pentium III 1 ГГц и Pentium 4 2 ГГц на ядре Willamette. После снятия кулеров с работающих процессоров, процессоры Athlon MP и Athlon получили необратимые термические повреждения, а система на Pentium III зависла, в то время как система с процессором Pentium 4 лишь замедлила скорость работы . Несмотря на то, что ситуация с полным отказом системы охлаждения (например, в случае разрушения крепления радиатора), смоделированная в экспериментах, маловероятна, а в случае возникновения приводит к более серьёзным последствиям (например, к разрушению плат расширения или системной платы в результате падения на них радиатора) вне зависимости от модели процессора , результаты эксперимента Томаса Пабста отрицательно повлияли на популярность конкурирующих процессоров AMD, а мнение о их ненадёжности было широко распространено даже после выхода процессоров Athlon 64 , имеющих более эффективную по сравнению с предшественником систему защиты от перегрева. К тому же температуры процессоров Intel в данном эксперименте, равные 29 и 37 по Цельсию, вызывают сомнение - ведь это рабочие температуры процессоров Intel при нулевой загрузке ЦПУ, и при наличии штатной системы охлаждения. Разумеется, при снятом радиаторе они ведут себя по другому: нагреваются до критической температуры, срабатывает тепловая защита и компьютер выключается. А если учесть, что тепловыделение Pentium 4 не меньше, чем у Athlon, то вопросов с дымящимся через считанные секунды AMD и работающим несколько секунд после снятия системы охлаждения Intel не убавляется. Просто в эксперименте Томаса Пабста были показаны в гипертрофированном виде имеющие место: достоинства процессоров Intel и недостатки процессоров AMD, относительно тепловой защиты. Возможно, это была рекламная акция в пользу новых процессоров Intel, особенно учитывая отношение потребителей к первым процессорам Pentium 4 из-за их высокой цены и низкой производительности.

Из-за особенностей архитектуры NetBurst, позволявших процессорам работать на высокой частоте, процессоры Pentium 4 пользовались популярностью среди оверклокеров . Так, например, процессоры на ядре Cedar Mill были способны работать на частотах, превышавших 7 ГГц , с использованием экстремального охлаждения (обычно использовался стакан с жидким азотом) , а младшие процессоры на ядре Northwood со штатной частотой системной шины 100 МГц надёжно работали при частоте системной шины 133 МГц и выше .

Технические характеристики

Willamette Northwood Gallatin Prescott Prescott 2M Cedar Mill
Настольный Настольный Мобильный Настольный Мобильный Настольный
Тактовая частота
Частота ядра, ГГц 1,3-2 1,6-3,4 1,4-3,2 3,2-3,466 2,4-3,8 2,8-3,333 2,8-3,8 3-3,6
Частота FSB , МГц 400 400, 533, 800 400, 533 800, 1066 533, 800, 1066 () 800
Характеристики ядра
Набор инструкций IA-32 , MMX , SSE , SSE2 IA-32 , EM64T (некоторые модели), MMX , SSE , SSE2 , SSE3
Разрядность регистров 32/64 бит (целочисленные), 80 бит (вещественночисленные), 64 бит (MMX), 128 бит (SSE)
Глубина конвейера 20 стадий (без учёта декодера инструкций) 31 стадия (без учёта декодера инструкций)
Разрядность ША 36 бит 40 бит
Разрядность ШД 64 бит
Аппаратная предвыборка данных есть
Количество
Архив Платформа

2 февраля официально увидели свет новые процессоры Pentium 4 на ядре Prescott, принципиально отличающиеся от своих предшественников на ядре Northwood. Что реально мы получаем в настоящий момент с выходом Prescott и стоит ли овчинка выделки?

См. остальные части нашего обзора:
Часть 2.
Часть 3. Быстродействие в играх.
Часть 4. Производительность в ряде профессиональных графических приложений.

Второго февраля, наконец, свершилось то, чего вся компьютерная индустрия с нетерпением ожидала по крайней мере последние полгода - Intel «опрескотилась»! Это означает, что официально увидели свет новые процессоры Pentium 4 на ядре Prescott, принципиально отличающиеся от своих предшественников на ядре Northwood по трем важнейшим категориям: прогрессивные множественные изменения в микроархитектуре процессорного ядра, использование более «тонкого» технологического процесса изготовления кристаллов с нормами 90 нанометров, применение усовершенствованных материалов для изготовления кристалла. Всё вместе это обещает открыть новые горизонты дальнейшего наращивания быстродействия процессоров архитектуры Intel NetBurst. Но обещания - обещаниями, а что реально мы получаем в настоящий момент с выходом Prescott и стоит ли овчинка выделки? Это и предстоит нам выяснить.

Давненько корпорация Intel не радовала нас новыми процессорами для настольных ПК. После феерического выхода целого сонма новых продуктов весной этого года - процессоров Pentium 4 на ядре Northwood с частотами от 2,4 до 3,0 ГГц на системной шине 800 МГц и двухканальных DDR400-чипсетов для них серий i875 и i865 (Canterwood и Springdale), см., например, обзоры на www.terralab.ru/system/25198 , www.terralab.ru/system/25235 , а также www.terralab.ru/system/28979 , последовал лишь еще один процессор в июне - Pentium 4 3,2 ГГц (см. www.terralab.ru/system/25250 ). И затем наступило до неприличия длительное затишье, пару раз нарушенное лишь появлением очередных Celeron. По сути дела, корпорация не объявляла новых Pentium 4 для массового рынка более семи (!) месяцев подряд, что в современных условиях является непростительно долгим сроком.

Конечно, в середине осени Intel провозгласила одну новинку - Pentium 4 Extreme Edition 3,2 ГГц с чудовищными для настольных систем размерами кэш-памяти (2 Мбайт третьего уровня), кристалла и количеством транзисторов (см. www.terralab.ru/system/29365 ). Но и цена этого «экстра-геймерского» процессора оказалась не менее чудовищна по понятиям персональных компьютеров - под тысячу долларов США. А если учитывать, что реально в розничных магазинах эти «монстры» появились лишь совсем недавно и их продажи на фоне обычных Pentium 4 до сих пор ничтожно малы, то Extreme Edition вполне можно отнести не к массовому сегменту, а к своеобразному «процессору ради престижа», не делающему никакой погоды на массовом рынке ПК (по самым оптимистическим прогнозам корпорации доля P4EE среди всех «Пентиумов» не будет превышать пяти процентов). В этой связи, нетерпеливое ожидание Prescott, обладающего мегабайтной кэш-памятью второго уровня, еще более усилилось.

Intel готовила индустрию к выходу Prescott задолго до его появления и делала это величественно и громогласно. Первые сведения просочились в прессу пару лет назад, а в феврале прошлого года на Intel Developer Forum в Сан-Хосе корпорация организовала публичное оглашение основных архитектурных особенностей будущего процессора и подробно рассказала о технологиях и материалах, применяемых для его изготовления (см., например, www.terralab.ru/system/23898 ). А спустя полгода продемонстрировала общественности сами процессоры в работе и показала фотографию кристалла Prescott, обнародовав дополнительные подробности - количество транзисторов, размер чипа и пр. (см. www.terralab.ru/system/29227 ).

Первоначально руководители корпорации уклончиво обещали выпустить процессор осенью 2003 года (неофициально ходили слухи то о сентябре, потом о начале декабря)… Но время текло, «уж полночь близилась», а Германа все не было… За это время основной конкурент Intel на рынке процессоров для ПК - корпорация AMD - успела трижды (!) выпустить свои новые процессоры: сперва в конце сентября вышел долгожданный Athlon 64 3200+ (см. www.terralab.ru/system/29375 ), затем в декабре появился первый недорогой настольный Athlon 64 3000+, отличавшийся от 3200+ только уменьшенной вдвое кэш-памятью второго уровня, и, наконец, в начале января появился великолепный Athlon 64 3400+, который мог не только соперничать на равных с самыми мощными настольными процессорами Intel, но даже нередко превосходил их и своего более дорогого собрата Athlon 64 FX-51 (см. www.terralab.ru/system/31549 ). И это при том, что он работал всего с одним каналом обычной памяти DDR400, тогда как все остальные «топ-модели» требовали для реализации своего скоростного потенциала как минимум двухканального DDR400-решения.

Поклонники Intel с надеждой ожидали явно застопорившегося выхода ядра Prescott, надеясь на чудо - увеличенные вдвое кэш-памяти первого и второго уровня вкупе с другими усовершенствованиями ядра (новые инструкции SSE3, улучшенные HyperThreading, механизм предвыборки и предсказание ветвлений) обещали если не прорыв, то, по крайней мере, существенный рост производительности нового ядра по сравнению со старым. Ранние «оценочные» степпинги Prescott «ходили» по лабораториям и OEM-партнерам Intel начиная с осени, однако особых восторгов от тех, кому с ними удалось «пообщаться», слыхивать не доводилось. А пока руководители корпорации уверяли, что процессор «уже готов» и начиная с четвертого квартала 2003 года «уже идут» его коммерческие поставки производителям, из недр Intel доносились слухи о задержках, связанных с необходимостью «дооптимизировать» технологию производства и ядро самих процессоров с целью получения нужного теплового режима старших моделей и приемлемого для массового производства выхода годных кристаллов.

И поскольку дальше затягивать официальное объявление Prescott было уже неприемлемо, процессоры выпустили 2 февраля. Однако удалось ли производителю при этом в полной мере побороть «детские болезни левизны» нового ядра? Судя по тому дефициту старших моделей Prescott (с частотой 3,2 и 3,4 ГГц), который испытывают сейчас даже ведущие тестовые лаборатории - не совсем удалось. Например, модель 3,40Е не видел живьем еще никто из знакомых мне людей (исключая сотрудников Intel J ), а модель 3,20E пробыла у нас в редакции всего три рабочих дня, поскольку ее как жуткий дефицит «рвали на части» другие «поклонники», и в первые дни после выхода я не обнаружил ни одного предложения модели 3,20E в российских магазинах (не уверен, что они были даже в японских). С другой стороны, подобный «ажиотаж» можно попробовать объяснить и другим - процессор настолько великолепен, что его просто «выметают» из-под прилавков толпы поклонников.

Итак, 2 февраля Intel выпустила сразу семь новых Pentium 4. Их перечень и краткие отличительные особенности приведены в таблице 1.

Процессор

Pentium 4
Extreme Edition
3,40 ГГц

Pentium 4
3,40 ГГц

Pentium 4
3,40E ГГц

Pentium 4
3,20E ГГц

Pentium 4
3,00E ГГц

Pentium 4
2,80E ГГц

Pentium 4
2,80A ГГц

Технология производства

Шина FSB, МГц

Технология Hyper-Threading

Кэш-память второго и третьего уровней

512 кбайт, 2 Mбайт L3

512 кбайт L2

Напряжение питания, В

Разъём (Socket)

Оптовая цена, $

* В официальном документе Intel для этого процессора указано ядро Northwood, но мы то с вами знаем, что Northwood с кэш-памятью третьего уровня называется ядром Gallatin, официально применяемом только в серверных процессорах Intel Xeon, хотя степпинг кристалла Pentium 4 Extreme Edition - фактически тот же самый, что у аналогичных Xeon MP, см. www.terralab.ru/system/29365 .

Если Pentium 4 3,40 ГГц (на ядре Northwood) и Pentium 4 Extreme Edition 3,40 ГГц - это по сути те же, что и раньше, процессоры - теперь с чуть более высокой частотой ядра, то наибольший интерес для нас представляет линейка новичков на ядре Prescott. «Прескотты» внешне почти ничем не отличаются от традиционных Pentium 4 - они размещены в том же корпусе для разъема Socket 478 и лишь иное расположение элементов с обратной стороны корпуса (фото 1) напоминает, что перед нами именно они.

Как видим, все новые процессоры используют системную шину 800 МГц и технологию HyperThreading, кроме самого младшего - «гадкого утенка-прескотёнка», «разжалованного» до шины 533 МГц и лишенного HT. Предположительные объяснения появления такой модели: (а) необходимость продать Prescott ранних степпингов, которые не столь высокочастотны и экономичны, как текущие модификации, (б) необходимость иметь «свой Prescott» для низкостоимостных систем на чипсетах, не поддерживающих шину 800 МГц, (в) лазейку для продажи «отходов» производства более высокочастотных моделей (отбраковка старших моделей). Последнее имеет под собой более жесткие обоснования, чем это было ранее для Northwood. Дело в том, что заметно возросшие токи утечки для ядра Prescott и более высокое тепловыделение в рабочем состоянии (более 100 ватт для старших моделей) накладывает более жесткие требования на тестирование ядер для той или иной частоты/модели. Если процессоры на ядре Northwood (и предшественники) имели близкие друг к другу характеристики зависимости рассеиваемой мощности от частоты работы (с неплохой точностью подчинялись известной для структур КМОП формуле мощности от частоты), то для Prescott имеет место (по крайней мере, на данный момент) гораздо больший разброс характеристик кристаллов даже внутри одной партии и кремниевой пластины. В результате, производитель вынужден выпускать каждый конкретный экземпляр кристалла для строго определенной (по частотным и тепловым характеристикам) модели процессора с весьма небольшими допусками (запасом на отклонение в худшую и лучшую сторону). С этим связан и тот факт, что даже младшие модели Prescott будут весьма неохотно разгоняться (первое время?) - даже небольшое повышение частоты будет вызывать у них очень резкое (гораздо больше, чем у Northwood) повышение тока потребления и температуры, что негативно скажется на стабильности и «живучести» процессора. Это, кстати, подтвердил и побывавший в нашей лаборатории экземпляр - Prescott 3,20E с большим трудом удалось разогнать до 3,4 ГГц, причем работал он при этом нестабильно, выделяя гораздо больше тепла, чем на штатной частоте (не в пример аналогичным Northwood и Extreme Edition, которые подобных проблем не имели). Попутно замечу, что с процессорами Prescott стандартный плавкий термоинтерфейс с обратной стороны боксовых кулеров (фото 2) я настоятельно рекомендую заменять хорошей термопастой.

Краткое сравнение кристаллов трех типов процессоров (Extreme Edition, Northwood и Prescott) представлено в таблице 2. Для сравнения там же приведено текущее ядро процессоров AMD Athlon 64.

Таблица 2. Краткое сравнение кристаллов современных высокопроизводительных процессоров для настольных ПК

Процессор

Intel Pentium 4
Prescott

Intel Pentium 4
Northwood

Intel Pentium 4
Extreme Edition

AMD Athlon 64
ClawHammer

Частоты, ГГц

Технология производства

90 нм,
напряженный кремний

Площадь ядра, кв. мм

Число транзисторов, млн.

Длина целочисленного конвейера

Объем кэш-памяти данных первого уровня

Латентность кэш-памяти первого уровня*

Ассоциативность кэш-памяти первого уровня

Объем кэш-памяти инструкций

12 тыс. микроопераций

12 тыс. микроопераций

12 тыс. микроопераций

Скорость доставки инструкций из кэш-памяти

Объем кэш-памяти второго уровня, кбайт

Латентность кэш-памяти второго уровня*

~30 тактов

~18 тактов

~18 тактов

~12 тактов

Ассоциативность кэш-памяти второго уровня

Объем кэш-памяти третьего уровня

Латентность кэш-памяти третьего уровня*

~45 тактов

Расширение набора инструкций

SSE2/SSE/3Dnow!/ x86-64

Технология HyperThreading

улучшенная

стандартная

стандартная

Напряжение питания, В

Допустимая тепловая мощность, TDP, Вт

* измеренная в программе CPU-Z 1.21.

Количество транзисторов у Prescott увеличилось по сравнения с Northwood более, чем вдвое, но площадь кристалла при этом за счет применения нового техпроцесса даже немного уменьшилась. Вместе с тем, оба они заметно уступают по площади и числу транзисторов ядру Gallatin. Если учесть, что ячейка кэш-памяти требует шести транзисторов (плюс примерно один транзистор в расчете на одну ячейку расходуется для «вспомогательных» нужд - магистральные буферы, мультиплексторы и пр.), и это подтверждают оценки из сравнения ядер Northwood и Gallatin, то получается, что добавление 512 кбайт кэш-памяти второго уровня потребовало лишь около 30 миллионов транзисторов, а «остальные» 40 миллионов ушли на другие архитектурные усовершенствования ядра Prescott. И это - огромное количество, ведь ядро Northwood без кэш-памяти второго уровня содержит всего-то около 25 миллионов «затворов»!


Для наглядности приведу фотографии кристаллов Prescott и Northwood, на которых обозначены те или иные блоки процессора (фото 3 и 4). Подробный анализ расположения и состава каждого из этих блоков провели еще весной прошлого года специалисты сайта «Chip Architect» (подробности см. в статьях на www.chip-architect.net/news/2003_03_06_Looking_at_Intels_Prescott.html и www.chip-architect.com/news/2003_04_20_Looking_at_Intels_Prescott_part2.html ). В частности выяснилось, что многие блоки ядра Prescott существенно избыточны и/или содержат скрытые возможности, среди которых не только достаточно очевидные модули для поддержки технологии La Grande (официально Prescott ее пока не поддерживает) и шины для связи с кэш-памятью третьего уровня (самой памяти L3 на кристалле, естественно, нет), но и вероятно, блоки для реализации технологии Vanderpool и 64-битных вычислений (последнее - пока лишь предположение).

Что же касается официально объявленных нововведений ядра Prescott, то о них мы уже писали почти год назад (см. http://www.terralab.ru/system/23898 ) и с тех пор мало, что поменялось (см. таблицу 2 и рисунок 5).

В-третьих, добавлено 13 новых инструкций (Prescott New Instructions или PNI), улучшающих комплексные расчеты по SSE/SSE2/x87-FP-командам и позволяющих ускорить выполнение мультимедийных и игровых приложений (рисунок 6). По аналогии с предшественницами, эти новые инструкции назвали SSE3, они не требуют специальной поддержки со стороны операционной системы (достаточно поддержки обычных SSE) и полностью совместимы с программным обеспечением, написанным ранее для процессоров Intel. По оценкам корпорации, простая перекомпиляция (уже вышел соответствующий компилятор от Intel) приложений под SSE3 способна поднять быстродействие в среднем на 5% (и до десятков процентов в отдельных задачах). Среди уже оптимизированных для SSE3 приложений - будущая версия Unreal II, многие видеокодировщики (MainConcept, xMPEG, Ligos, Real (RV9), On2 (VP5/VP6), Pegasys TMPGEnc 3.0, Adobe Premier, Pinnacle, Sony DVD Source Creator, Ulead (MediaStudio & Video Studio), Intervideo и другие, использующие кодек DivX 5.1.1.

Несмотря на множество улучшений, в новом ядре применено и несколько вынужденных «ухудшений». Эти «ухудшения» возникли не от хорошей жизни - они фактически являются альтернативным подходом при проектировании и призваны на самом деле улучшить те или иные показатели процессора в расчете на долговременную перспективу и рост частоты ядра процессора. Главным и наиболее критичным для быстродействия процессора изменением стало (как мы и писали еще год назад, см. www.terralab.ru/system/23898 ) увеличение длины основного конвейера - с 20 до 31 такта. Именно это, а не применение новой 90-нанометровой технологии, способно в перспективе позволить поднять тактовую частоту ядра процессора до 5 ГГц и выше.

Вместе с тем, как мы прекрасно помним по переходу с 10-стадийного до 20-стадийный конвейер (от Pentium III на Pentium 4), это может существенно ухудшить быстродействие системы в некоторых задачах, где велик процент неудачных предсказаний переходов. Чтобы снова не наступать на те же грабли, корпорация предприняла ряд шагов по существенному улучшению работы блока предсказания ветвлений и предвыборки данных. Этой же цели (уменьшения потерь производительности за счет удлинения конвейера) служит и вдвое увеличенная кэш-память. Вместе с тем, как показали наши тесты, даже всех этих мер порой оказывается недостаточно для того, чтобы в некоторых неоптимизированных для архитектуры Intel NetBurst приложениях полностью скомпенсировать «вредное» влияние длинного конвейера. С другой стороны, на оптимизированных приложениях при таком подходе прирост производительности окажется ощутимым (вспомним, с каким скрипом Pentium 4 Willamette продвигался на рынок именно из-за отсутствия поначалу оптимизированных для него приложений).

Рисунок 9.

Вторым «ухудшением» стала примерно вдвое возросшая латентность обоих кэшей (см. рисунок 9). Фактически это плата за их возросший объем и «задел» на будущий рост частоты ядра. В некоторых «линейных» задачах это может и не повлиять на быстродействие, но в других может оказаться весьма «болезненным». (Напомним, что длинный конвейер и возросшая латентность кэш-памяти призваны преодолеть трудности с согласованием работы блоков, расположенных в разных частях кристалла и оперирующих с некоторыми задержками друг относительно друга).

Cхемотехника у Prescott существенно изменилась по сравнению с предшественниками, и большинство блоков процессора фактически было спроектировано «с нуля» в тесном сотрудничестве с разработчиками технологии производства кремниевых чипов, чтобы оптимизировать подходы проектирования. Более того, при проектировании топологии кристалла Prescott впервые было применен полностью автоматизированный подход к трассировке и размещению элементов (например, с целью оптимизации задержек и более равномерного распределения тепла по кристаллу), в результате чего элементы блоков не обязательно расположены строго внутри геометрических границ этих блоков, блоки как бы взаимопроникают друг в друга (это видно, например, по размытости фотографии кристалла Prescott), а между блоками и элементами процессора много пустого места, которое удобно для исправления мелких схемотехнических ошибок, дальнейшей оптимизации кристалла и пр.

Рисунок 10.

Первоначально процессоры Prescott будут работать на чипсетах Canterwood и Springdale на системной шине 800 МГц с памятью DDR400 (см. рисунок 10), но позднее для них выйдут чипсеты Alterwood и Grantsdale с поддержкой памяти DDR II, шины PCI Express, южного моста ICH6 и, видимо, системной шины 1066 МГц. Подавляющее большинство уже выпущенных системных плат на чипсетах Intel 875/865, а также последних чипсетах SiS, VIA и ATI будут совместимы с Prescott путем простого обновления BIOS (оно необходимо для правильной инициализации большей кэш-памяти), поскольку эти платы уже разрабатывались с учетом будущих повышенных требований по питанию (старшие Prescott требуют максимальный ток питания 91 ампер). Вместе с тем, разгон «Прескотта» осилит уже далеко не каждая плата - только самые лучшие.

Процессоры на ядре Prescott изготавливаются по новой для Intel 90-нанометровой технологии (это первый 90-нанометровый процессор, вышедший на рынок), причем сразу на 300-миллиметровых подложках. При производстве Prescott применяются ряд новых материалов и технологий микроэлектроники, подробности по которым мы уже не раз описывали (см., например, статьи на www.terralab.ru/system/30717 и www.terralab.ru/system/30845 ). Перечень основных технологических новшеств приведен в таблице 3. Наиболее важной и них является технология «напряженного» (strained, то есть растянутого или сжатого) кремния: деформированная в ту или иную сторону кристаллическая решетка такого кремния обеспечивает большую подвижность электронов или дырок соответственно, а значит, и более высокие частоты работы полевых транзисторов. Для борьбы с утечками транзисторов также были применены специальные меры - технологические и схемотехнические.

Таблица 3. Основные отличия интеловских технологий производства с нормами 130 и 90 нм

130 нанометров

90 нанометров

6 слоёв медных межсоединений

7 слоёв медных межсоединений

Диэлектрик SIOF с низкой диэлектрической проницаемостью

Диэлектрик CDO (легированный кремнием оксид) с низкой диэлектрической проницаемостью

Силицид кобальта как контакт затвора

Силицид никеля как контакт затвора

Ячейка памяти SRAM площадью 2 кв. мкм

Ячейка памяти SRAM площадью 1,15 кв. мкм

248-нанометровая литография

193-нанометровая литография

Обычный кремний

Напряженный кремний

Несмотря на уменьшившуюся площадь ядра, применение новых технологии и новых материалов при производстве Prescott несколько повысило себестоимость кристаллов. Вместе с тем, себестоимость Prescott возросла незначительно, поэтому цена на модели Northwood и Prescott с одинаковой частотой будут одинаковыми. Это позволит избежать неудобных ситуаций на рынке.

Три процессора Pentium 4 с частотой 3,4 ГГц станут, по всей видимости, последними моделями для разъема Socket 478. Это связано с тем, что будущие более высокочастотные Pentium 4, даже изготовленные по более тонкой технологии, будут потреблять существенно большее количество энергии, на которое не рассчитаны существующие нынче и, как правило, приспособленные для Prescott 3,4 ГГц материнские платы. Процессоры 3,6 ГГц и выше потребуют новых спецификаций питания, и чтобы избежать путаницы с системными платами, все они будут выпускаться с разъемом Socket T (известный также как LGA 775). Аббревиатура LGA расшифровывается как Land Grid Array - по аналогии с нынешними Pin Grid Array (PGA) для процессоров или Ball Grid Array (BGA) для чипсетов или микросхем памяти. Конструктив LGA много дешевле, чем PGA или BGA и используется, например, компанией IBM.

У нас в лаборатории побывал экземпляр Pentium 4 3,20E ГГц на ядре Prescott. Безусловно, новая микроархитектура требует весьма пристального подхода для практического изучения, поэтому за те три рабочих дня, что новый процессор был в нашем распоряжении, мы лишь частично смогли постичь его потенциал. В будущем мы планируем еще не раз вернуться к детальному практическому изучению свойств нового ядра от Intel (прежде всего - быстродействия в разнообразных задачах), но уже по первым опытам стало возможным составить первое впечатление от новинки, которое мы и предлагаем вам сейчас.

Подробное описание тестовой конфигурации, участников сравнения и подробный анализ полученных данных вы сможете найти в последующих частях этого обзора на сайте www.terralab.ru , а здесь я подведу лишь предварительные краткие выводы на основе проведенных тестов.

Прежде всего, можно отметить, что у Prescott немного возросла скорость работы с системной памятью по сравнению с Northwood. Причем улучшились не только скорость чтения и полоса пропускания памяти, но и латентность, а также сложные операции (Copy, Scale, Add, Triad). Вместе с тем, на относительно старых приложениях, неоптимизированных под NetBurst, мы наблюдаем существенный проигрыш Prescott своему предшественнику (Northwood) - временами до 15%! Более того, в отдельных задачах Prescott 3,2 ГГц работает даже медленнее, чем Northwood 3,06 ГГц на шине 533 МГц! Вот этого я, признаться, не ожидал. Приложений, в которых Prescott заметно быстрее одночастотного с ним «Нортвуда», как оказалось, пока не так уж много (по крайней мере, в процентном соотношении к общему числу программ). Чаще наблюдается ситуация, когда Prescott немного проигрывает Northwood - этим, например, «грешат» многие современные и недавнего прошлого игры, аудиокодеки, простые математические расчеты. А вот видеокодирование и в некоторые профессиональные трехмерные пакеты моделирования чаще благориятствуют «Прескотту», и его преимущество над Northwood доходит, порой, до 10–15 процентов.

Таким образом, изменения в микроархитектуре NetBurst в процессорах с яром Prescott фактически потребовали новой волны оптимизации приложений. Без такой оптимизации новый процессор часто может работать даже медленнее, чем одинаковый с ним по частоте старый, невзирая на вдвое увеличившуюся кэш-память. На одинаковой частоте Prescott не может (в среднем) соперничать пока с Pentium 4 Extreme Edition. Однако у первого есть ресурсы по заметному наращиванию частоты, в то врем как P4EE и Northwood свои ресурсы практически исчерпали. Хотим мы этого или нет, но будущее Pentium 4 однозначно за Prescott. Хотя на первых порах более выгодным, видимо, будет все же приобретение процессоров на прежнем ядре. Особенно если учесть, что «Прескотты» заметно более горячие в работе, чем аналогичные Northwood и даже Extreme Edition.

Итак, Intel опрескотилась!!!

А хорошо это или плохо - судить вам. Читайте в следующих частях этого обзора:
Часть 2. Простые вычисления, работа кэш-памяти и системной памяти и производительность при работе с видео и аудио.
Часть 3.

С одной стороны, время в IT-индустрии летит настолько быстро, что не успеваешь замечать новые продукты и технологии, а с другой… ну-ка, вспомним — сколько лет мы не видели нового ядра от Intel? Не старого с переделками: тут частоту FSB подняли, там виртуальную многопроцессорность с серверного процессора на десктопный перенесли (на самом деле — просто разрешили последнему честно рассказать, что она у него есть), но действительно полностью нового? Если не с нуля разработанного, то хотя бы не латаного, а заново по тем же лекалам сшитого, но с другими рюшечками и по последней моде? А ведь целых два года, оказывается! Даже с хвостиком небольшим. И все это время горячие головы рассуждали на излюбленную тему: а каким же оно будет, новое ядро? Чего только не предсказывали — вплоть до полной анафемы архитектуре NetBurst и воцарения сплошного Banias на декстопной платформе. Правда (как часто бывает), оказалась менее сказочной: новое ядро оказалось честным и последовательным продолжателем Northwood. Разумеется, с некоторыми архитектурными нововведениями, но стремления «до основанья, а затем…» в нем не прослеживается. Поэтому чисто эмоционально Prescott можно оценивать по-разному: кто-то похвалит инжереров Intel за последовательность и целеустремленность, кто-то, наоборот — посетует на отсутствие свежих идей. Однако эмоции — личное дело каждого, мы же обратимся к фактам. Теория

Основные изменения в ядре (Prescott vs. Northwood)

Для начала мы предлагаем вам небольшую табличку, в которой сведены воедино наиболее существенные различия между ядрами Prescott и Northwood во всем что касается «железа» (а точнее — кремния, и прочих «минеральных составляющих»).

Остается только добавить, что новое ядро содержит 125 миллионов транзисторов (куда там бедному Northwood с его 55 миллионами!), и его площадь равна 112 кв. мм (немного меньше площади Northwood — 146/131 кв. мм, в зависимости от ревизии). Произведя несложный арифметический подсчет, видим, что увеличив количество транзисторов в ~2,3 раза, за счет нового техпроцесса инженерам Intel удалось, тем не менее, уменьшить площадь ядра. Правда, не так значительно — «всего» в 1,3 (1,2) раза.

Что же касается технологии «напряженного» (некоторые предпочитают термин «растянутый») кремния — то она, если объяснять на пальцах, довольно проста: с целью увеличения расстояния между атомами кремния, он помещается на подложку, расстояние между атомами у которой больше. В результате, для того чтобы «хорошо усесться», атомам кремния приходится растягиваться по предложенному формату. Выглядит это примерно вот так:

Ну а понять, почему электронам проще проходить через напряженный кремний, вам поможет вот этот простенький рисунок:

Как видите, геометрическая ассоциация в данном случае вполне уместна: путь электрона просто становится короче.

Ну а теперь рассмотрим гораздо более интересные отличия: в логике ядра. Их тоже немало. Однако для начала будет нелишним напомнить об основных особенностях архитектуры NetBurst как таковой. Тем более что не так уж и часто мы это делали в последнее время.

Немного предыстории

Итак, одним из основных отличий ядер, разработанных в рамках архитектуры NetBurst, сама компания Intel считает уникальную особенность, выражающуюся в разделении собственно процесса декодирования x86-кода во внутренние инструкции, исполняемые ядром (uops), и процедуры их выполнения. Между прочим, такой подход породил в свое время немало споров относительно корректности подсчета стадий конвейера у Pentium 4: если подходить к данному процессору с классической точки зрения (эпохи до-NetBurst), то стадии декодера следует включать в общий список. Между тем, официальные данные Intel о длине конвейера процессоров Pentium 4 содержат информацию исключительно о количестве стадий конвейера исполняющего блока, вынося декодер за его рамки. С одной стороны — «крамола!», с другой — это объективно отражает особенность архитектуры, поэтому Intel в своем праве: она же ее и разработала. Спорить, можно, разумеется, до посинения, однако… какая, собственно, разница? Главное — понимать суть подхода. Не нравится вам, что декодер исключен? Ну так прибавьте его стадии к «официальным» — и получите искомую величину конвейера по классической схеме, вместе с декодером.

Таким образом, основная идея NetBurst — асинхронно работающее ядро, в котором декодер инструкций работает независимо от Execution Unit. С точки зрения Intel, существенно бо льшая, чем у конкурентов, частота работы ядра, может быть достигнута только при асинхронной модели т.к. если модель синхронная, то расходы на синхронизацию декодера с исполняющим блоком возрастают пропорционально частоте. Именно поэтому вместо обычного L1 Instructions Cache, где хранится нормальный x86-код, в архитектуре NetBurst применяется Execution Trace Cache, где инструкции хранятся уже в декодированном виде (uops). Trace — это и есть последовательность uops.

Также в историческом экскурсе хотелось бы окончательно развеять мифы, связанные с излишне упрощенной формулировкой, согласно которой ALU у Pentium 4 работает на «удвоенной частоте». Это и так… и не так. Однако для начала взглянем на условную блок-схему процессора Pentium 4 (уже Prescott):

Легко заметить, что ALU состоит из нескольких частей: в нем присутствуют блоки Load / Store, Complex Instructions, и Simple Instructions. Так вот: с удвоенной скоростью (0,5 такта на операцию) обрабатываются лишь те инструкции, что поддерживаются исполняющими блоками Simple Instructions. Блок ALU Complex Instructions, исполняющий команды, отнесенные к сложным — наоборот, может тратить до четырех тактов на исполнение одной инструкции.

Вот, собственно, и все, что хотелось бы напомнить относительно внутреннего устройства процессоров сконструированных на базе архитектуры NetBurst. Ну а теперь перейдем к нововведениям в самом свежем NetBurst-ядре — Prescott.

Увеличение длины конвейера

Вряд ли это изменение можно назвать усовершенствованием — ведь общеизвестно, что чем длиннее конвейер, тем бо льшие накладные расходы вызывает ошибка механизма предсказания ветвлений, и, соответственно, уменьшается средняя скорость выполнения программ. Однако, видимо, другого способа увеличить разгонный потенциал ядра, инженеры Intel найти не смогли. Пришлось прибегнуть к непопулярному, но проверенному. Итог? Конвейер Prescott увеличен на 11 стадий, соответственно, общее их количество равняется 31. Честно говоря, мы намеренно вынесли эту «приятную новость» в самое начало: фактически, описание всех последующих нововведений можно условно назвать «а вот теперь мы вам расскажем, как инженеры Intel боролись с последствиями одного-единственного изменения, чтобы оно окончательно не угробило производительность»:).

Усовершенствования в механизме предсказания ветвлений

В основном, тонкий тюнинг коснулся механизма предсказания переходов при работе с циклами. Так, если ранее по умолчанию обратные переходы считались циклом, то теперь анализируется длина перехода, и исходя из нее механизм пытается предсказать: цикл это, или нет. Также было обнаружено, что для ветвей с определенными типами условных переходов, независимо от их направления и расстояния, использование стандартного механизма предсказания ветвлений чаще всего неактуально — соответственно, теперь в этих случаях он не используется. Однако кроме теоретических изысканий, инженеры Intel не побрезговали и голой эмпирикой т.е. просто-напросто отслеживанием эффективности работы механизма предсказания ветвлений на примере конкретных алгоритмов. С этой целью было исследовано количество ошибок механизма предсказания ветвлений (mispredictions) на примерах из теста SPECint_base2000, после чего по факту были внесены изменения в алгоритм с целью их уменьшения. В документации приводятся следующие данные (количество ошибок на 100 инструкций):

Подтест SPECint_base2000 Northwood (130 nm) Prescott (90 nm)
164.gzip 1.03 1.01
175.vpr 1.32 1.21
176.gcc 0.85 0.70
181.mcf 1.35 1.22
186.crafty 0.72 0.69
197.parser 1.06 0.87
252.eon 0.44 0.39
253.perlbmk 0.62 0.28
254.gap 0.33 0.24
255.vortex 0.08 0.09
256.bzip2 1.19 1.12
300.twolf 1.32 1.23

Ускорение целочисленной арифметики и логики (ALU)

В ALU был добавлен специализированный блок для исполнения инструкций shift и rotate, что позволяет теперь исполнять данные операции на «быстром» (двухскоростном) ALU, в отличие от ядра Northwood, где они исполнялись в блоке ALU Complex Instructions, и требовали бо льшего количества тактов. Кроме того, ускорена операция целочисленного умножения (integer multiply), ранее исполнявшаяся в блоке FPU. В новом ядре для этого выделен отдельный блок.

Также есть информация о присутствии некоторого количества мелких усовершенствований, позволяющих увеличить скорость обработки инструкций FPU (и MMX). Впрочем, ее мы лучше проверим в практической части — при анализе результатов тестов.

Подсистема памяти

Разумеется, одним из основных плюсов нового ядра являются увеличенные размеры L1-кэша данных (в 2 раза т.е. до 16 килобайт) и кэша второго уровня (также в 2 раза т.е. до 1 мегабайта). Однако есть и еще одна интересная особенность: в ядро введена специальная дополнительная логика, обнаруживающая page faults в инструкциях software prefetch. Благодаря этому нововведению, инструкции software prefetch теперь имеют возможность осуществлять не только предвыборку данных, но и предвыборку page table entries т.е., другими словами, prefetch умеет не останавливаться на загруженной странице, но еще и обновлять страницы памяти в DTLB. Разбирающиеся в вопросе наверняка заметят на этом примере, что Intel внимательно следит за отзывами программистов, пусть даже и не кается прилюдно по поводу каждого обнаруженного ими негативного фактора, влияющего на производительность.

Новые инструкции (SSE3)

Кроме всего прочего, в Prescott добавлена поддержка 13 новых инструкций. Назван этот набор, по устоявшейся традиции, SSE3. В их числе присутствуют команды преобразования данных (x87 to integer), работы с комплексной арифметикой, кодирования видео (правда, всего одна), новые команды, предназначенные для обработки графической информации (массивов вершин), а также две инструкции, предназначенные для синхронизации потоков (явно последствия появления Hyper-Threading). Впрочем, о SSE3 мы в скором времени выпустим отдельную статью, поэтому рассматривать возможности данного набора в этом материале воздержимся, чтобы не портить излишней популяризацией серьезную и интересную тему.

Ну а теперь, пожалуй, довольно с нас теории и спецификаций. Попытаемся, как говорилось в одном известном анекдоте, «вместе со всем этим взлететь»:). Тестирование

Конфигурации стендов и ПО

Тестовый стенд

  • Процессоры:
    • AMD Athlon 64 3400+ (2200 МГц), Socket 754
    • Intel Pentium 4 3,2 ГГц «Prescott» (FSB 800/HT), Socket 478
    • Intel Pentium 4 2,8A ГГц «Prescott» (FSB 533/нет HT), Socket 478
    • Intel Pentium 4 3,4 ГГц «Northwood» (FSB 800/HT), Socket 478
    • Intel Pentium 4 3,2 ГГц «Northwood» (FSB 800/HT), Socket 478
  • Материнские платы:
    • ABIT KV8-MAX3 (версия BIOS 17) на чипсете VIA K8T800
    • ASUS P4C800 Deluxe (версия BIOS 1014) на чипсете Intel 875P
    • Albatron PX875P Pro (версия BIOS R1.00) на чипсете Intel 875P
  • Память:
    • 2x512 МБ PC3200 DDR SDRAM DIMM TwinMOS (тайминги 2-2-2-5)
  • Видеокарта: Manli ATI Radeon 9800Pro 256 МБ
  • Жесткий диск: Western Digital WD360 (SATA), 10000 об/мин



Pentium 4 2,8A ГГц «Prescott»
Единственный Prescott с частотой FSB 533 МГц
и без поддержки Hyper-Threading



Pentium 4 3,4 ГГц «Northwood»
Просто еще один Northwood…

Системное ПО и драйверы устройств

  • Windows XP Professional SP1
  • DirectX 9.0b
  • Intel Chipset Installation Utility 5.0.2.1003
  • VIA Hyperion 4.51
  • VIA SATA Driver 2.10a
  • Silicon Image Driver 1.1.0.52
  • ATI Catalyst 3.9
Плата ABIT KV8-MAX3 ASUS P4C800 Deluxe Albatron PX875P Pro
Чипсет VIA K8T800 (K8T800 + VT8237) Intel 875 (RG82004MC + FW82801ЕB) Intel 875 (RG82875 + FW82801ЕB)
Поддержка процессоров Socket 754, AMD Athlon 64 Socket 478, Intel Pentium 4, Intel Celeron
Разъемы памяти 3 DDR 4 DDR 4 DDR
Слоты расширения AGP/ 5 PCI AGP Pro/ 5 PCI AGP/ 5 PCI
Порты ввода/вывода 1 FDD, 2 PS/2 1 FDD, 2 COM, 1 LPT, 2 PS/2 1 FDD, 2 COM, 1 LPT, 2 PS/2
USB 4 USB 2.0 + 2 разъема по 2 USB 2.0 2 USB 2.0 + 3 разъема по 2 USB 2.0
FireWire 1 порт + 2 разъема на 2 порта (планка в комплекте), Texas Instruments TSB43AB23 1 порт + 1 разъем на 1 порт (нет планки в комплекте), VIA VT6307 —
Интегрированный в чипсет ATA-контроллер ATA133 + SATA RAID (0, 1) ATA100 + SATA ATA100 + SATA
Внешний ATA-контроллер Silicon Image Sil3114CT176 (SATA RAID 0, 1, 0+1, Spare) Promise PDC20378 (ATA133+SATA RAID 0, 1, 0+1) —
Звук AC"97-кодек Avance Logic ALC658 AC"97-кодек Analog Devices AD1985 AC"97-кодек Avance Logic ALC655
Сетевой контроллер 3Com Marvell 940-MV00 (Gigabit Ethernet) 3Com Marvell 920-MV00 (Fast Ethernet)
I/O-контроллер Winbond W83627HF-AW Winbond W83627THF-A Winbond W83627THF
BIOS 4 Мбит Award BIOS v6.00PG 4 Мбит AMI BIOS v2.51 3 Мбит Phoenix AwardBIOS v6.00
Форм-фактор, размеры ATX, 30,5x24,5 см ATX, 30,5x24,5 см ATX, 30,5x24,5 см
Средняя текущая цена (количество предложений) Н/Д(0) Н/Д(0) Н/Д(0)

В завершение описания, хотелось бы разъяснить алгоритм подбора участников тестирования. С одной стороны, полностью исключить из тестов процессоры AMD было бы неправильно, ведь эта платформа — основной конкурент Intel, как сейчас, так и в обозримом будущем. С другой стороны — совмещать в одной статье сравнение двух поколений Pentium 4 с процессорами другого производителя, означало бы не сравнить толком ни то, ни другое. Поэтому мы решили в первом материале, посвященном Prescott, пойти на определенный компрормисс: во-первых, полностью исключить всевозможные «экстремальные» варианты в виде Pentium 4 eXtreme Edition и Athlon 64 FX, во-вторых же, взять в качестве представителя альтернативной платформы только один, но быстрый из обычных десктопных процессоров AMD: Athlon 64 3400+.

Да и то, по большому счету, его результаты здесь приводятся лишь в качестве опции. В этом материале нас более всего интересует сравнение нового ядра Intel со старым. Если кто-то желает получить одновременно информацию о том, как производительность Prescott соотносится с ближайшим конкурентом — что ж, она представлена на диаграммах. Комментарии? Пожалуй, они просто излишни. Вы сами в этом убедитесь. Зная, какова производительность Prescott и Northwood, работающих на одинаковой частоте, и то, как соотносятся производительность Northwood и топовых процессоров AMD (а этот вопрос мы уже неоднократно освещали) — вы знаете вполне достаточно для того, чтобы самостоятельного сделать все остальные выводы.

Кроме того, хотелось бы разъяснить наличие на диаграммах двух столбиков для Prescott 3,2 ГГц. Дело просто в том, что мы решили… подстраховаться. Всем известно, что с выходом процессора на другом ядре, среди производителей системных плат сразу же начинается суматоха с обновлением BIOS, всяческих microcode update, и прочего «железно-ориентированного» ПО. Нам показалось логичным использовать такой ресурс нашей тестовой лаборатории как «официально Prescott-ready» системные платы максимально полно, чтобы уберечься от возможных последствий некорректной работы конкретной модели. Впрочем, как вы увидите далее, опасения оказались напрасными: в большинстве случаев новый процессор вел себя на обеих платах совершенно одинаково.

Все характеристики Prescott 2,8A ГГц программа
CPU-Z определяет вполне корректно:
как наличие SSE3, так и шину 533 МГц

Разумеется, не ошиблась она и в случае с
Prescott 3,2E ГГц

Низкоуровневые тесты в CPU RightMark

Для начала, мы решили проверить функционирование нового ядра в двух режимах — традиционно самом лучшем для процессоров Pentium 4 и самом худшем: SSE/SSE2 и MMX/FPU. Начнем с вычислительного блока (Math Solving).

Результаты неутешительные. Новое ядро медленнее старого, более того — в режиме MMX/FPU его отставание даже больше, чем при использовании SSE/SSE2. Делаем первый вывод: если что-то в FPU и «подкручивали», то явно в CPU RightMark используются другие команды. Ну а что у нас с рендерингом?

Во-первых, рассмотрим варианты работы модуля рендеринга в однопоточном и двухпоточном режимах с максимальной производительностью (SSE/SSE2). Картина достаточно интересная: если используется один поток — преимущество Prescott минимально, а больший по частоте Northwood его легко обгоняет. Однако стоит нам задействовать Hyper-Threading, как Prescott тут же резко вырывается вперед, причем настолько, что обгоняет всех других участников. Возникает впечатление, что некая работа над ядром в плане улучшения обработки параллельно выполняющихся потоков, была проведена, и заключалась она не только в расширении набора команд. Посмотрим теперь, как себя ведут те же процессоры в режиме MMX/FPU.

Абсолютно аналогичная картина. Причем если сопоставить ее с предыдущей — хорошо видно, что тщательность анализа себя оправдала: если бы, к примеру, мы ограничились рассмотрением лучшего (двухпотокового) результата, можно было бы ошибочно сделать вывод о том, что ядро Prescott быстрее в плане исполнения инструкций, причем даже в режиме MMX/FPU. Сейчас же хорошо видно, что быстродействие возросло исключительно благодаря оптимизации использования ресурсов виртуальных CPU.

Тесты в реальных приложениях

Перед тем как начать рассмотрение результатов тестов в реальных приложениях, сделаем небольшое вводное разъяснение. Дело в том, что процессор Pentium 4 на ядре Prescott с частотой 3,4 ГГц, к сожалению, до сих пор для нас недоступен, поэтому то, что вы видите на диаграммах под названием "Virtual" Prescott 3,4 ГГц — это не более чем аппроксимация результатов Prescott 3,2 ГГц, рассчитанная исходя из идеальных условий роста производительности пропорционально частоте. Кто-то может заметить, что это слишком топорный подход. Дескать, намного корректнее было бы, к примеру, разогнать имеющийся Prescott 3,2 ГГц с помощью выставления большей частоты FSB, или хотя бы выстроить кривую аппроксимации по трем точкам: Prescott 2,8 ГГц -> 3,0 ГГц -> 3,2 ГГц. Разумеется, так было бы корректнее. Однако «на всякого мудреца довольно простоты», и… просто обратите внимание на то, какие поправки вносит в общую картину наличие на диаграммах даже «идеального» Prescott 3,4 ГГц (а реальный будет либо таким же, либо медленнее — третьего не дано). Рискуя навлечь на себя немилось преждевременным разглашением тайны, скажем сразу: да практически никаких. Где ядро Prescott выигрывает — там это и так видно. А где проигрывает — не помогают ему даже идеализированные 3,4 ГГц…

Работа с графикой

Самые предсказуемые результаты у Northwood 3,4 ГГц (немного лучше, чем у Northwood 3,2 ГГц) и Prescott 2.8 ГГц (отсутствие поддержки Hyper-Threading сразу же выбросило его в аутсайдеры). Prescott 3,2 ГГц пытается быть хотя бы наравне с одночастотным Northwood, но у него не получается даже это. Ну а наш «виртуальный Prescott 3,4 ГГц», в свою очередь, не смог обогнать реальный Northwood 3,4 ГГц — что тоже естественно. C другой стороны, можно заметить, что все процессоры кроме Prescott 2,8 ГГц почти равны. Вряд ли это будет аргументом для апгрейда на Prescott, но хотя бы не станет существенным доводом против его покупки для тех, кто задумывается над приобретением новой системы.

В Lightwave ситуация аналогичная, только Prescott отстает еще больше. Здесь уместно будет вспомнить, что Lightwave (судя по сравнению результатов 6-й ветки с 7-й), затачивался под Pentium 4 очень тщательно и скрупулезно. Можно предположить, что именно поэтому он оказался так чувствителен к малейшим архитектурным изменениям в ядре. Также отметим, что впервые протестированный нами в этой программе Athlon 64 3400+ демонстрирует пусть и не лучший, но вполне приличный результат.

Для Photoshop в современных процессорных архитектурах, видимо, самым главным параметром является размер кэша. Мы уже неоднократно обращали внимание на то, что эта программа весьма «кэшелюбива», и результаты Prescott это подтверждают.

Кодирование медиаданных

Вообще, поскольку мы тестируем новую (или существенно модифицированную, если вам так больше нравится) архитектуру — то для нас любое приложение может стать маленьким открытием. По сути, сейчас количество даже важнее качества, потому что нам просто необходимо набрать как можно больше данных о том, как старые (еще не оптимизированные под Prescott) программы ведут себя с новым процессорным ядром. Вот, тот же LAME: оказывается, для него Prescott по всем статьям новый процессор — результаты совершенно не ложатся на то, что мы ранее знали про Northwood. Правда, они стали хуже. Что ж, бывает. Продолжаем коллекционировать…

Ogg Encoder демонстрирует практически идентичную картину: Prescott существенно проигрывает всем остальным процессорам без исключения, несмотря на удвоенный кэш данных первого уровня и L2. Остается предположить, что виновато увеличение длины конвейера при оставшемся неизменным объеме Trace Caсhe.

Даже тяготеющий к архитектуре NetBurst кодек DivX невзлюбил новое ядро. Не то что бы очень сильно, но все-таки оно ему не понравилось. Впрочем, тут есть определенная надежда на SSE3 — разработчики DivX просто обожают различные оптимизации (во всяком случае, судя по анонсам), поэтому весьма велик шанс, что единственная и неповторимая инструкция, предназначенная для ускорения кодирования видео, найдет свое место в будущем релизе данного кодека. Однако это все в будущем, а пока — увы…

А вот результаты XviD мы опять не приводим по причине совершенно невообразимого «фортеля», который в очередной раз выкинула эта нежно нами любимая программа. Дело в том, что прирост производительности Prescott по отношению к Northwood в ней составил… 232% ! Такие тесты, пардон, мы использовать просто отказываемся. Похоже, что их результаты могут зависеть вообще от чего угодно…

Ну, вот и первая победа. Впрочем, возвращаясь к теме о предпочтениях различного ПО, можно заметить, что Windows Media Video 9 весьма неплохо поддерживает Hyper-Threading, а данные низкоуровневых тестов показали, что эффективность задействования виртуальных CPU в случае с новым ядром возрастает. Похоже, что это первый положительный результат, достигнутый за счет качественного, а не количественного изменения в Prescott. Во всех предыдущих случаях он «выезжал» исключительно за счет большого объема кэша…

Очень, очень интересный результат. Mainconcept MPEG Encoder, которому мы пеняли за «корявую» работу с Hyper-Threading при кодировании в формат MPEG1 — вполне адекватно работает с виртуальными процессорами, если они эмулируются Prescott, а не Northwood! Впору даже задуматься: быть может, программисты не виноваты, просто «затык» был в процессорном ядре, которое некорректно распараллеливало потоки? Вполне возможно, по крайней мере, глядя на результаты Prescott, понимаешь, что и это предположение имеет право на жизнь. C другой стороны вполне неплохо себя показал Prescott 2,8A ГГц, про Hyper-Threading и слыхом не слыхавший. Забавная ситуация. Пожалуй, мы находимся на пороге интересного открытия: напрашивается предположение, что вся «оптимизация работы Hyper-Threading в Prescott» сводится всего лишь к тому… что этой технологии в Northwood не хватало объема кэша, чтобы развернуться в полную силу!

И снова можно порадоваться за новое ядро: в Mainconcept MPEG Encoder не только пропал «глюк» с кодированием MPEG1, но и преобразование в MPEG2 стало работать существенно быстрее. Имея в виду результаты предыдущих тестов, можно почти однозначно утверждать, что основным виновником торжества является улучшенная работа Hyper-Threading (и не забываем о том, за счет чего она могла стать лучше — если наши предположения верны). Что самое интересное — не понадобились даже специальные команды для управления потоками из набора SSE3, процессор сам отлично разобрался (поддержку SSE3 в данной версии кодировщика предполагать не приходится — она вышла довольно давно).

А вот Canopus ProCoder просто почти ничего не заметил. В принципе, небольшая разница в производительности присутствует, и она даже в пользу Prescott. Но, по сути, это копейки, мелочь. Учитывая «кэшелюбивость» ProCoder, можно даже сказать так: весь большой кэш, судя по всему, ушел на компенсацию других недостатков нового ядра. Он просто вытянул Prescott на ту же высоту, что и Northwood, но, увы — не более.

Архивирование

Традиционно, мы протестировали 7-Zip как со включенной поддержкой многопоточности, так и без нее. Ожидаемый эффект достигнут в этой программе не был: не заметно, чтобы многопоточность на Prescott давала намного больший эффект, чем на Northwood. Да и вообще — особой разницы между старым и новым ядром не видно. Похоже, что мы наблюдаем упомянутый выше эффект: все, что смогли сделать количественные показатели Prescott (объемы кэша L1 Data и L2) — это компенсировать его же удлиненный конвейер.

К слову: один из немногих тестов, где хоть как-то видна разница между платами. В остальном — все та же картина: Prescott и Northwood одинаковой частоты идут рядом, практически не отличаясь по скорости. Пессимисты скажут: «плохо», оптимисты: «могло быть и хуже»:). Мы — просто промолчим…

Игры

Картина во всех трех играх схожая, поэтому особенно расписываться нет нужды: Prescott все же медленнее. Правда, ненамного.

Обобщая результаты

Что ж, если делать какие-то выводы на основании тех тестов, что присутствуют в статье, то ситуация выглядит следующим образом: ядро Prescott в целом медленнее Northwood. Иногда это удается компенсировать бо льшим объемом кэша, вытянув производительность на уровень старого ядра. Ну а если программа особенно чувствительна к объему L2, Prescott даже способен выиграть. Кроме того, несколько улучшилась эффективность Hyper-Threading (но похоже, что причина снова кроется в увеличении объема L2-кэша). Соответственно, если программа умеет использовать обе сильные стороны нового ядра — большой кэш и виртуальную многопроцессорность — то выигрыш получается ощутимым. В целом же, производительность Prescott примерно такая же, как у Northwood, а применительно с старому, неоптимизированному ПО — даже более низкая. Ожидаемой революции, увы, не получилось. С другой стороны… а был ли мальчик? Но об этом — ниже.

Что же касается Prescott 2,8A ГГц с 533-мегагерцевой системной шиной и без поддержки Hyper-Threading, то как раз тут все предельно ясно. Во-первых, для Intel это просто очень хороший способ сделать хотя бы что-то из тех экземпляров, которые в «настоящем Prescott"овском» режиме банально не заработали. Этакий «Celeron среди Prescott"ов» (хотя будет, судя по всему, на базе этого ядра и официальный Celeron). Во-вторых — отсутствие Hyper-Threading скорее всего свидетельствует о принципиальном нежелании Intel видеть HT на устаревшей, низкоскоростной шине. Действительно: единственным представителем 533 МГц FSB + HT так и остался первый процессор с поддержкой этой технологии — Pentium 4 3,06 ГГц. Да и то по вполне понятной, извиняющей его причине: не было еще на тот момент CPU с 800-мегагерцевой шиной.

Таким образом, да простят нам инженеры Intel эту вольность, Pentium 4 2,8A ГГц — это «как бы не Prescott». А просто сравнительно недорогой (другим его выпускать нельзя — не купит ведь никто…), но высокочастотный Pentium 4. И совершенно неважно, на каком он сделан ядре, не в этом суть. Честно говоря, было искушение его в этот материал вообще не включать, но потом мы решили поступить наоборот: дать ему один раз «засветиться», и более к данному чу дному процессору не возвращаться. Из простого сравнения одночастотных ядер Prescott и Northwood понятно, что без Hyper-Threading Prescott 2.8 ГГц даже с Pentium 4 2.8C (800 МГц FSB + HT) по усредненным показателям производительности соперничать не сможет. Версии

Да, именно «версии», а не «выводы». Слишком неоднозначным получился этот материал. Проще было бы ограничиться анализом диаграмм и сделать напрашивающийся, лежащий на поверхности вывод: «если новое не быстрее (а то и медленнее) старого — значит, оно хуже». Списать, так сказать, в расход. Однако самый простой ответ — не всегда самый правильный. Поэтому мы решили коснуться аналитики, и рассмотреть выход Prescott в исторически-рыночной перспективе. Получилось, что ответов на вопрос «в чем для Intel состоит смысл выпуска Pentium 4 на ядре Prescott?» на самом деле несколько, и каждый из них можно логично аргументировать.

Версия первая или Большая ошибка

Почему бы и нет? Жила-была компания Intel, и появилась у нее идея: сделать процессорное ядро, ориентированное не на максимальный КПД (если рассматривать КПД как соотношение производительности к частоте), а на легкую масштабируемость. Дескать, если наши 2000 МГц проигрывают 1000 МГц от конкурента — не беда, догоним частоту до 4 ГГц и оставим всех позади. Между прочим, с чисто инженерной точки зрения, это вполне адекватное решение. Не все ли равно? Пользователя-то (грамотного) все равно интересуют не мегагерцы, а производительность, какая ему разница, за счет чего она достигается? Главное чтобы масштабируемость оказалась именно такой, какую предполагалось достичь. И вот, выясняется, что с масштабируемостью начались большие проблемы. Догнали до 3,4 ГГц, остановились… и пришлось придумывать новое ядро, у которого КПД еще ниже… и неизвестно, какими темпами будет расти у него частота… и так далее. Напомним, что это версия. Рассмотрим ее внимательнее в сопоставлении с реальными фактами.

Факт, свидетельствующий в пользу данной версии — рост частоты Pentium 4 за прошедший 2003 год. Все-таки 200 МГц, да еще и по отношению к такой «частотолюбивой» архитектуре как NetBurst — явно мало. Однако… как общеизвестно, рассматривать какой-то факт в отрыве от других — не очень хорошая практика. Был ли смысл в активном наращивании частоты Pentium 4 в прошлом году? Вроде бы нет… Основной конкурент решал другие вопросы — у него новая архитектура, новое ядро, ему нужно наладить массовое производство процессоров на базе этого ядра, обеспечить им соответствующую обвязку в виде чипсетов, системных плат, программного обеспечения, в конце концов! Поэтому один из вариантов ответа на вопрос «почему практически не росла частота (и производительность) Pentium 4 в 2003 году» звучит просто: не было особого смысла ее наращивать. Ни догонять, ни перегонять — вроде некого. Стало быть, можно особенно не торопиться.

Получить ответ на главный вопрос мы, увы, пока не можем: как будет «гнаться» новое ядро? Пока что, если судить по внешним признакам, фактов, подтверждающих хорошую масштабируемость Prescott — нет. Впрочем, равно как и опровергающих ее. Анонсированы 3,4-гигагерцевые версии как Prescott, так и Northwood. Northwood 3,4 ГГц, наверное, будет последним процессором на этом ядре (хотя, официальных подтверждений этого предположения нет). А то, что Prescott стартовал с 3,4 ГГц, а не с 3,8 или 4,0 тоже легко объяснимо: зачем прыгать через ступеньки? Подводя итог: версия «Большой ошибки», в принципе, имеет право на существование. Но если частота (а еще точнее, — производительность) Prescott будет быстро расти, это однозначно подтвердит ее несостоятельность.

Версия вторая или Переходное ядро

Ни для кого не секрет, что иногда производителю требуется выпустить некое устройство, достаточно ординарное само по себе (в другой ситуации совершенно не заслуживающее звания релизного продукта). Но в том-то и дело, что выпуск данного устройства необходим для продвижения на рынок других, анонсируемых одновременно с ним или чуть позже. Таким был Pentium 4 Willamette, вряд ли достойный звания «хорошего и быстрого процессора», однако явно обозначивший факт перехода одного из самых крупных игроков на процессорном рынке, на новое ядро, и под конец своего существования сменивший «промежуточный» Socket 423 на «долгоиграющий» Socket 478. Что, если аналогичная роль уготована Prescott?

Уже всем известно, что с выходом Grantsdale-P, нас ждет появление еще одного процессорного разъема для Pentium 4 (Socket T / Socket 775 / LGA775), и поначалу устанавливаться в него будут именно CPU на ядре Prescott. Лишь впоследствии Pentium 4 «Tejas» начнет постепенно их замещать. И тут вполне логично задаться вопросом: а насколько быстро будет происходить это замещение? Поскольку мы все равно лишь выдвигаем версии, ограничивать свою фантазию не будем, и предположим, что Intel желает этот процесс максимально ускорить. С помощью чего? Скорее всего — оставив Socket 478 мирно почивать в нижних строчках на диаграммах производительности, и сделав Socket 775 символом обновленной, мощной и скоростной платформы для Pentium 4. Тогда все становится ясно: Prescott нужен для того, чтобы на рынке присутствовал процессор, способный работать как в платах с разъемом Socket 478, так и с новым Socket 775. Tejas же, если наши предположения верны, будет устанавливаться только в Socket 775, и станет, таким образом, могильщиком как для Prescott, так и для устаревшей платформы Socket 478. Логично? Нам кажется, что да. В таком случае, правдоподобно смотрится и следующее предположение: жизнь Prescott’у уготована весьма недолгая…

Версия третья или «Кто с мечом к нам придет…»

Не секрет, что соперничество между двумя основными конкурентами — Intel и AMD, почти всегда строилось на противопоставлении двух основных аргументов. Intel: «наши процессоры — самые быстрые!», AMD: «зато у наших лучше соотношение цены и производительности!». Соперничество давнее, аргументы тоже. Причем, они не изменились даже с выходом процессоров AMD на ядрах K7/K8, — несмотря на то, что у последних с производительностью дела обстоят намного лучше, чем у K6. Ранее Intel не делала исключений из основного своего правила: продавать свои CPU с производительностью, аналогичной процессорам конкурента, немного дороже. Рынок местами очень прост, поэтому причина такого поведения понятна: если их и так покупают — то зачем снижать цену? Опять-таки: хоть участвовать в ценовых войнах Intel и приходилось, но развязывала их всегда AMD, это уже стало традицией. Третья версия базируется на очевидном предположении: а что если на этот раз Intel решила повести себя агрессивнее, чем обычно, и развязать ценовую войну первой?

В списке достоинств нового ядра Prescott числится не только новизна, объемы кэшей, и потенциально хорошая (правда, пока не подтвержденная) масштабируемость, но и… цена! Это сравнительно дешевое в производстве ядро: если при использовании 90-нанометровой технологии будет достигнут показатель выхода годных чипов хотя бы такой же, как у Northwood — то, ничуть не теряя в абсолютных показателях прибыли, Intel сможет продавать свои процессоры за гораздо меньшую цену. Напомним одну очевидную зависимость: такую характеристику CPU как «соотношение цена / производительность», можно улучшать, не только повышая производительность, но и снижая цену. Вообще-то, никто не мешает быстродействие даже понизить (!) — главное, чтобы цена упала еще больше:). Судя по появляющимся в Сети неофициальным анонсам цен на Pentium 4 Prescott, стоить они будут намного дешевле Pentium 4 Northwood. Таким образом, мы можем предположить, что Intel решила осуществить своего рода «обход с флангов»: пока основной конкурент, по старинке, все гонится и гонится за производительностью, ему будет нанесен удар в секторе middle-end систем, где пользователи тщательно анализируют именно такой показатель как price / performance.

Версия четвертая или Тайное оружие

Здесь следует сделать небольшое лирическо-историческое отступление для тех, кто «во времена оные» не очень активно отслеживал разные мелкие нюансы в процессорном секторе. Так, к примеру, можно вспомнить, что сразу после появления первых процессоров с поддержкой Hyper-Threading (а ими были вовсе не Pentium 4 «Northwood» + HT, а Xeon «Prestonia»), многие задались вопросом: «если ядра Prestonia и Northwood настолько похожи, что практически не отличаются по основным характеристикам, но у Prestonia поддержка Hyper-Threading присутствует, а у Northwood ее нет — то не логично ли предположить, что и у Northwood она тоже есть, просто искусственно заблокирована?». Впоследствии это предположение косвенно подтвердилось — анонсом Pentium 4 3,06 ГГц на все том же ядре Northwood, но уже с Hyper-Threading. Более того, самые смелые выдвигали и вовсе крамольную мысль: Hyper-Threading была даже в Willamette!

А теперь вспомним: что у нас в последнее время известно по части новых технологических инициатив Intel. Сразу всплывают два названия: «La Grande» и «Vanderpool». Первое — технология аппаратной защиты приложений от вмешательства извне, которую вкратце можно описать словами «сделать так, чтобы одно ПО не могло вмешиваться в функционирование другого». Впрочем, о La Grande вы можете почитать на нашем сайте . Об Vanderpool информации меньше, но исходя из обрывков доступной на сегодня, можно сделать вывод, что она представляет собой вариацию на тему полной виртуализации PC, включая все без исключения аппаратные ресурсы. Таким образом (самый простой, но и самый эффектный пример), на одном компьютере смогут работать параллельно две операционные системы, причем одна из них может быть даже перезагружена — но это совершенно не отразится на работе другой.

Так вот: есть очень большие подозрения, что и La Grande и Vanderpool в ядре Prescott уже реализованы, но (как было ранее с Hyper-Threading) пока не активированы. Если это предположение истинно, то многое относительно самого ядра становится понятным. В частности — то, почему оно такое большое, почему так долго разрабатывалось, но, несмотря на это, не выирывает в скорости у предыдущего. Если исходить из гипотезы «Тайного оружия», можно предположить, что основные ресурсы команды разработчиков были направлены вовсе не на достижение быстродействия, а на отладку новых функций. Частично данная версия перекликается со второй — так или иначе, но мы имеем дело с переходным ядром. Соответственно, быть совершенным оно вовсе не обязано, ибо не в том его основное предназначение. Между прочим, также удачно вторую и четвертую версии дополняет третья: низкая цена в данном случае является именно той конфеткой, что подсластит для конечного пользователя пилюлю «переходности».

Подводя итоги

Мы не зря назвали эту статью «полшага вперед». Prescott получился более сложным и неоднозначным, чем ожидаемый «Northwood с увеличенным объемом кэша и более высокой частотой» (как многие его воспринимали). Разумеется, можно обвинить производителя в том, что прирост скорости в среднем близок к нулю (а местами и отрицательный), в очередной чехарде с поддержкой процессоров на базе нового ядра системными платами… И, между прочим, вполне справедливо это сделать. Это, в конце концов, не наши проблемы — а между тем, именно мы с ними и столкнемся. Поэтому просто поставим в конце статьи «жирное троеточие». На стоп-кадре видно только начало шага: нога, зависшая в воздухе, или, если угодно, лайнер на взлете. Что нас ждет дальше? Благоприятным ли окажется «приземление» (Tejas?..) Пока можно только догадываться.

Мы уже ни раз говорили, что активное развитие компьютерных технологий заставляет нас пользователей, всегда быть в курсе событий. Вроде бы еще вчера ты неплохо разбирался в современных технологиях, а уже через несколько месяцев, с трудом можешь конфигурировать несложную машинку. Действительно совсем недавно мы считали, что компьютер с процессором Celeron с частотой выше 2ГГц и графической картой GeForce FX 5600, может справиться не только с современными играми, но и с наступающим поколением игр. Однако последние события на рынке компьютерных игр (мы имеем ввиду выход таких шедевров как FarCry) позволяют серьезно задуматься над возможностями вашего компьютера.

В этой статье мы рассмотрим особенности сборки оптимального игрового компьютера, основанного на новом процессоре Intel Pentium 4 Prescott , а так же попробуем выяснить, насколько увеличься производительность игровых приложений при использовании особенностей этого процессора.

Что такое Intel Pentium 4 Prescott?

В начале февраля Intel анонсировала четыре новых процессора Pentium 4 2.8, 3.0, 3.2, и 3.4 ГГц, основанных на долгожданном ядре Prescott , которое включает ряд нововведений, способных в самом ближайшем будущем изменить представление о производительности современного компьютера. Обычно, выход нового ядра процессора, является первым серьезным шагом для перехода к каким-либо новым возможностям, которые, на момент выпуска ядра, не могут быть реализованы, однако в самом ближайшем будущем без них мы не сможем обойтись. Подтверждений для этого множество. Например, появление процессоров с поддержкой технологий MMX и SSE . Тогда, несколько лет назад, мы могли с трудом представить себе, зачем все это надо, и каким будет прирост производительности по сравнению с обычными процессорами Pentium . Зато сегодня очень сложно представить себе процессор без поддержки мультмедийных потоковых инструкций. То же самое происходит сегодня. Скорее всего, увидеть реальное преимущество новых процессоров на старых приложениях будет не просто, однако в самом ближайшем будущем мы себе уже не сможем представить, как могли жить и работать без этих нововведений.

В этой статье мы рассмотрим основные особенности нового ядра, и соответственно, попробуем сравнить возможности новых процессоров с процессорами, основанными на ядре Northwood. Это позволит четко решить, стоит ли покупать новый процессор, или можно обойтись стареньким, проверенным Northwood.

Как отличить новые процессоры?

Новые процессоры имеют точно такую же конструкцию, что и процессоры, основанные на ядре Northwood, поэтому для их отличия Intel ввела новый индекс в названии процессора - E . Например, Процессор Pentium 4 3.2 C основан на ядре Northwood, имеет поддержку 800МГц шины и технологии HT , в то время как Pentium 4 3.2 E выполнен на ядре Prescott , и так же поддерживает 800МГц шину и технологию HT .

Вместе с выпуском четырех новых процессоров, Intel представила процессор Pentium 4 3.4 EE (Extreme Edition), основанный на ядре Northwood и имеющий 2 Mb кэш памяти третьего уровня, а так же упрощенную версию Pentium 4 2.8 A , основанную на ядре Prescott с ограниченной частотой шины (533МГц) и отсутствием поддержки технологии HT .

Что нового?

Новое ядро Prescott включает настолько много изменений, что для этого можно выделить отдельную статью. Однако не всем нам интересно углубленно изучать сложные технические особенности, поэтому мы попробуем на понятном, человеческом языке рассмотреть какие преимущества или недостатки дают все эти нововведения.

Итак, начинаем с самого ядра. Prescott выполнена по новой 90- нанометровой технологии, что позволило уменьшить размеры площадь самого кристалла, при этом общее число транзисторов было увеличено более чем в два раза. В то время как ядро Northwood имеет площадь 145мм2 и на нем размещено 55 миллионов транзисторов, ядро Prescott имеет площадь 122мм2, при этом на нем расположено 125 миллионов транзисторов.

Новые SSE инструкции

В связи с использованием в процессорах AMD технологии SSE 2, Intel представила в новом Prescott новую технологию SSE 3, которая включает 13 новых потоковых инструкций, которые увеличат производительность некоторых операций как только программы начнут использовать их. На самом деле SSE 3 является не просто расширением SSE 2, эта технология не только добавляет новые инструкции, она позволяет облегчить и автоматизировать процесс оптимизации готовых приложений средствами компилятора. Другими словами, разработчику программного обеспечения не надо будет переписывать код программы, необходимо будет только перекомпилировать ее. Таким образом, можно предположить, что воспользоваться новыми возможностями SSE 3, позволяющими значительно увеличить производительность мы сможем уже довольно скоро.

Увеличенный объем кэш памяти

Одним из важнейших, с точки зрения производительности, дополнений можно считать увеличенный до 1 Mb кэш второго уровня. Опыт показывает, чем больше кэш, тем выше производительность. Однако, при увеличении объема кэш памяти, увеличилась латентность. Что это значит и как это влияет на производительность? Здесь есть три варианта развития ситуации. Наибольшее увеличение производительности будет замечено, в случае если объем используемых приложением данных сравним с объемом кэш памяти. В этом случае увеличение объема кэш памяти в два раза заметно снижает процент «промахов» и повышает производительность, не смотря на увеличение латентности. Однако, если объем используемых данных заметно меньше объема кэш памяти, то увеличение латентности негативно скажется на производительности. И третья, возможная ситуация, когда объем данных заметно больше объема кэш памяти. В этом случае кэш памяти не будет влиять на производительность, т.к. основные задержки будут связаны со скоростными характеристиками памяти.

Объем кэш памяти первого уровня так же был увеличен до 16 Kb , при этом так же возросла латентность, но в данном случае это не так важно.

Улучшенная предвыборка данных

Для того, что бы снизить негативный эффект от увеличенной латентности кэш памяти, а так же просто увеличить производительность ядро Prescott имеет улучшенный механизм предвыборки данных.

Улучшенный Hyperthreading

Ядро Prescott включает улучшенную версию технологии Hyperthreading . В новую версию включено множество новых особенностей, способных оптимизировать многопоточное выполнение различных операций. Единственный недостаток новой версии заключается в необходимости перекомпиляции программного обеспечения и обновления операционной системы.

Увеличенная длинна конвейера

Для увеличения рабочей частоты будущих процессоров, ядро Prescott имеет увеличенную длину конвейера с 20 до 31 ступени. Увеличение длинны конвейера негативно сказывается на производительности в случае неправильного предсказания ветвлений. Проще говоря, если ветвление предсказаний будет выполнено неправильно, то будет сброшен весь конвейер, и все будет повторено снова. Для компенсации увеличения длинны конвейера, была улучшена технология предсказания ветвлений.

Почему новый процессор Pentium 4 имеет большую рабочую температуру?

Те, кто уже попробовали новый процессор, заметили, что он имеет заметно более высокую рабочую температуру, чем предыдущее поколение процессоров. Это связано в первую очередь с уменьшением площади кристалла и увеличенным числом транзисторов, что незамедлительно сказалось на потребляемой мощности. Так, если по спецификации TDP процессор Northwood 3.20 C потреблял 82 W , то Prescott 3.20 E потребляет уже 103 W . В результате этого при 100% загрузке процессора, температура увеличилась с 60о С до 80о С. Обращаем внимание, что некоторые платы, имеющие функцию аппаратного мониторинга могут не адекватно среагировать на увеличение температуры и выключить компьютер. Поэтому прежде, чем использовать новый процессор, позаботьтесь о изменении критического уровня производительности.

Совместимость

Несмотря на соответствие новых процессоров спецификации Socket 478 P 4, Intel изменила спецификации потребляемой мощности, и по этому не все платы смогут поддержать новый процессор. Для некоторых моделей придется искать обновление BIOS . Кроме этого, опыт показывает, что для нормальной работы нового процессора необходимо иметь хороший блок питания, мощный стабилизатор питания на системной плате, а так же эффективную систему охлаждения. Ниже мы подробно рассмотрим особенности основных составляющих современного компьютера, и расскажем, на что необходимо обращать внимание при выборе комплектующих. Начнем наш рассказ с выбора корпуса и блока питания.

Выбираем корпус…

Итак, начинаем с выбора корпуса. Корпус для современного компьютера должен не только нравиться вам визуально, но и должен иметь мощный и стабильный блок питания, быть удобным в сборке, а так же обеспечивать достаточное охлаждение всех внутренних элементов.

Для нашего будущего компьютера мы выбрали корпус PowerMan 6200, который имеет не только привлекательный внешний вид, но и достаточно интересную начинку.

Корпус PowerMan 6200 - внешне это обычный корпус класса MidTower, предназначенный для построения универсальных компьютеров на системных платах ATX / microATX. Передняя панель выполненная в оригинальном двухцветном дизайне, позволяет устанавливать до четырех 5.25” устройств и один флоппи дисковод, который спрятан под декоративной панелью. Использование этой панели позволяет сделать корпус более эстетичным, однако, она не позволяет устанавливать вместо дисковода, ZIP - или MO - приводы, т.к. диски этого типа имеют большую толщину и размер. Кроме того, если вы не планируете использовать флоппи-дисковод, то имеющаяся щель будет выглядеть нелепо.

Ниже отсека флоппи-дисковода расположена кнопка включения, два индикатора активности накопителей и питания, а так же одна маленькая кнопка «Сброс», имеющая конструкцию, исключающую случайное нажатие.

Для обеспечения удобного доступа к внутреннему пространству корпуса, можно снять обе боковые стенки корпуса. Шасси корпуса выполнено из высококачественной, хорошо обработанной стали, толщиной 0.6-0.7мм. Все металлические детали корпуса имеют гладкие кромки, предупреждая травматизм при сборке.

Как вы можете видеть, внутри корпуса может быть установлено четыре 5.25” и до восемь 3.5” устройств. Честно говоря, такое количество накопителей свойственно скорее серверам или рабочим станциям, чем игровому компьютеру. Кстати, если вы решите сделать универсальный компьютер, то сможете без проблем установить столько дисков, сколько надо, тем более, что на передней стороне может быть установлено четыре 80мм вентилятора, обеспечивающих надежное охлаждение дисковой подсистемы.

Тыльная сторона корпуса, мало, чем отличается от других MidTower корпусов. Здесь имеется два вентиляционных отверстия, для устновки 80мм вентиляторов, посадочные места для дополнительных разъемов и даже тыльная панель, закрывающая порты ввода-вывода использующая традиционное размещение портов на системной плате.

В этом корпусе используется собственный блок питания PowerMan HPC -300, который по многочисленным мнениям, считается очень неплохим решением для стабильного питания современных компьютеров, использующих высокопроизводительные и функциональные конфигурации.

Блок питания имеет мощность 300 W с номинальной нагрузкой 68% от максимальной. Для обеспечения наиболее комфортной работы, блок питания имеет пониженный уровень шума, достигаемый благодаря управлению скоростью вращения вентилятора, а так же обеспечивает надежную защиту по разным параметрам.

Выходные параметры блока питания

Выходы

Min . нагр.

Max . нагр.

погрешность

шумы и колебания

В принципе, пользователь может выбрать любой понравившейся корпус, оснащенный мощным блоком питания, однако, не забывайте, что экономия здесь может закончиться не только порезанными и поцарапанными руками, но и серьезными проблемами с «железом» будущего компьютера.

Системная плата…

Теперь переходим к системной плате. Выбор системной платы под процессор Pentium 4 с ядром Prescott не самый простой этап в конфигурировании нового компьютера. Дело в том, что на сегодняшний день еще не все производители системных плат, предоставили обновления BIOS для поддержки нового процессора, и, кроме того, из-за повышенного потребления энергии новыми процессорами, плата должна иметь хороший стабилизатор питания.

Для нашего игрового компьютера мы использовали системную плату Albatron PX 865 PE , основанную на чипсете i 865 PE . Эта плата входит в серию PX 865 PE , в которую вошли еще две платы PX 865 PE Pro и ProII , отличающихся наличием на борту сетевого контроллера, а так же наличием других самых современных особенностей, типа Gigabit CSA Ethernet контроллера, 8-канального звукового чипа, ATA 133 RAID контроллера, IEEE 1394 и других особенностей.

Как вы можете понять, Albatron PX 865 PE является начальной моделью в этой линейке, обеспечивая пользователя только основными функциями, свойственными чипсету i 865 PE + ICH 5, включая возможность включения PAT , позволяющая расширить возможности до уровня системных плат, основанных на чипсете i 875.

Для минимизации затрат, комплектация Albatron PX 865 PE включает только самое необходимое. В частности сюда входит описание, CD с драйверами, набор FDD / IDE / SATA кабелей, а так же панель на тыльную сторону корпуса, включающая четыре дополнительных портов USB 2.0.

Спецификация

Albatron PX865PE

Intel Pentium 4/Celeron
(800/533/400MHz FSB, Hyper-Threading, Socket 478)

Чипсет

Разгоночные функции

Adjustable Vcore, Vmem and Vagp
Independently adjustable PCI frequency

Память

4 DDR DIMM slots for DDR400/DDR333/DDR266 SDRAM

Слоты расширения (PCI / ACR / CNR)

USB 2.0 порты

8 (2 на тыльной панели портов ввода-вывода)

IEEE1394

ATA-100/133

SerialATA-150

2 канала (ICH5)

Интегрированный IDE RAID контроллер

Интегрированный звук

Integrated LAN

Phoenix - AwardBIOS v6.00PG

Форм-фактор

Теперь давайте рассмотрим некоторые из особенностей платы. В нижней части платы традиционно располагаются четыре DIMM слота, позволяющие устанавливать до 4Гб памяти DDR 400. Память может работать как в двухканальном, так и в одноканальном режимах. При использовании двухканального режима, модули памяти должны устанавливаться парами. Для облегчения установки, слоты одной пары имеют идентичный цвет. Для получения максимальной производительности памяти мы рекомендуем использовать одинаковые модули памяти. Рядом со слотами памяти, располагается разъем питания ATX 2.01 (дополнительный 4-х контактный разъем питания 12 V расположен рядом с процессором), и два IDE разъема.

Выше слотов памяти, традиционно располагается сокет для процессора, рядом с которым располагается многофазная схема стабилизации, от грамотной реализации зависит не только стабильность работы процессора, но и его работоспособность в целом. Чип северного моста, расположенные слева от процессора, охлаждается достаточно большим пассивным радиатором.

Несмотря на то, что Albatron PX 865 PE имеет только пять PCI слотов, AGP 8 x слот расположен довольно близко к DIMM слотам, затрудняя процесс монтажа модулей памяти при установленной графической карте. Для простой и надежной фиксации AGP карты, слот имеет специальный замок. Кроме AGP 8 x шины, i 865 PE поддерживает шину для гигабитных сетевых контроллеров, однако в нашей плате сетевые особенности отсутствуют.

Теперь давайте рассмотрим, особенности, интегрированные в южный мост ICH 5. Традиционно чип южного моста располагается в левой нижней части платы. Рядом с ним, обычно, размещаются все необходимые разъемы и порты. В нашем случае, рядом с чипом южного моста разместились лишь разъемы SATA 150 контроллера. Как известно, интегрированный SATA контроллер не поддерживает режимы RAID , однако для его использования нет необходимости использовать дополнительные драйверы.

Все остальные разъемы, позволяющие воспользоваться интегрированными особенностями южного моста, располагаются с левого краю платы. Наименее удачным здесь считается расположения разъема для подключения флоппи-дисковода. Кроме этого неудачного разъема, здесь располагаются разъемы для подключения дополнительных USB портов, ИК- датчика, аудио разъемов и т.д.

Несмотря на многочисленные «фи» в адрес такого расположения этих элементов, мы хотим отметить, что с точки зрения сборки все оказалось более чем удобно, позволяя протянуть дополнительные провода по основанию корпуса, исключая вечную путаницу проводов.

В верхней части платы, над слотами расширения, располагается аудио кодек Realtek AC ’97 ALC 650 E , поддерживающий акустику 5.1 и SPDIF . Кроме того, здесь имеется посадочное место для сетевого контроллера 3 Com 910- A 01, используемого на плате Albatron PX 865 PE Pro .

И, наконец, давайте рассмотрим тыльную панель портов ввода-вывода. Как вы можете видеть, здесь используется достаточно скромный набор портов, свойственный платам предыдущего поколения.

Особенности BIOS и разгон

Плата Albatron PX 865 PE оборудована Phoenix AwardBIOS v 6.00 PG , который предлагает широкий набор функций настройки параметров системы, включая мощные средства разгона, позволяющие индивидуально настроить различные частотные параметры. Ниже мы хотели бы обратить ваше внимание на некоторые, наиболее интересные разделы BIOS .

Итак, начнем с Frequency / Voltage Control , который позволяет изменить частоту FSB в диапазоне от 200 до 550МГц, что позволяет разогнать процессор до 7700МГц, что, наверное, будет полезным в ближайшем будущем.

При увеличении частоты FSB увеличивается частота шины памяти, AGP , PCI и SRC . Для достижения максимальной производительности и стабильности пользователь может уменьшить желаемую частоту, для чего в этом разделе имеются специальные опции.

И, наконец, в этом разделе пользователь может изменить напряжение ядра процессора на 0.1 V , 0.2 V или 0.3 V , Vagp на 0.1 V , а так же Vdimm на 0.1 V , 0.2 V или 0.3 V .

В разделе Advanced Chipset Features пользователь может установить некоторые параметры памяти, а так же активизировать режим Performance Enhancement , который, судя по описанию в правой части окна, представляет собой ни что иное, как неофициально поддерживаемую технологию PAT .

Во время наших экспериментов по разгону тестового процессора Intel Pentium 4 2.8 E нам удалось поднять частоту FSB до 220МГц, что увеличило рабочую частоту процессора до 3080МГц. В этом режиме система оставалась максимально стабильной. При увеличении частоты FSB до 230МГц, возникли проблемы стабильности на этапе загрузки операционной системы. Возможно, несколько поработав с напряжением ядра процессора, можно добиться высокой стабильности и в этом режиме, однако, учитывая особые требования по питанию новых процессоров, рисковать с увеличением напряжения мы не стали.

При работе в разогнанном режиме мы обратили внимание на один интересный факт: Рабочая температура не изменялась в зависимости от выбранного частотного режима. Так, в режиме простоя, как в штатном, так и в разогнанном режимах, температура процессора оставалась на уровне 57 оС, а при запуске теста Burnit, позволяющего максимально загрузить процессора, рабочая температура поднималась до 74 оС, что стало возможным благодаря применению нового боксового кулера Intel, который использует более мощный вентилятор и новый профиль радиатора, обеспечивающий более эффективное охлаждение процессора.

Во всем остальном конструкция кулера осталась без изменений, и, естественно не вызывает ни каких проблем при использовании на обычных S 478 платах.

Графическая карта…

Выбор графической карты для игрового компьютера является настолько же важным этапом, как выбор платформы, а может быть и еще важнее. Дело в том, что сегодня на рынке имеется очень четкое деление. Современные графические карты ATI , позволяют заметно расширить производительность современных игр, однако пока их стоимость остается на достаточно высоком уровне. С другой стороны, графические карты GeForece FX 5700 и выше, имеют несколько меньшие возможности, но при этом их цена намного ниже графических карт ATI . В принципе, если позволяют деньги, мы рекомендовали бы использовать что-то типа ATI RADEON 9800 XT , однако, в этой статье мы строим именно оптимальный компьютер, поэтому думать о самых дорогих графических картах не приходиться.

В нашем тестовом компьютере используется графическая карта Albatron FX 5700 EP . Эта видеокарта является одной из младших моделей в семействе Albatron Gigi GeForce FX . Она оборудована 128 Mb DDR памяти, использует 64 bit шину памяти, и ядро, работающее на частоте 425МГц. Кроме этого Albatron FX 5700 EP имеет RAMDAC 400МГц и поддерживает вывод на два монитора с разрешением до 2048х1536, что обеспечивается дополнительными DVI - и TV - выходами. Несмотря на то, что эта карта не имеет ни каких ярких особенностей, ее отличает достаточно низкая цена, порядка 133$ (на апрель 2004 года).

Производительность

Итак, теперь пришло время посмотреть, на что же способен, собранный нами компьютер. Для этого мы проведем стандартный набор тестов, который позволит нам оценить возможности каждой подсистемы компьютера, а так же покажет, как будут работать на нем основные типы игр.

Тестовая конфигурация:

  • Процессор Intel Pentium 2.8E (Prescott)
  • Системная плата Albatron PX 865 PE
  • Графическая карта Albatron FX 5700 EP
  • Жесткий диск 80Gb Seagate Barracuda 7200.7

Для сравнения результатов мы используем платформу следующей конфигурации:

  • Процессор Intel Pentium 4 2.8 С (FSB 800 МГЦ)
  • Системная плата Soltek SL -86 SPE 2 (i865PE)
  • Видеокарта Palit GeForce FX5600 128Mb
  • Жесткий диск 80Gb Seagate Barr а cuda 7200.7

Рассмотрение результатов начнем с теста PCMark 2004, который позволит оценить быстродействие основных компонентов процессора.

В тесте PCMark 2004 мы наблюдаем достаточно интересную картину распределения производительности. Во-первых, общая производительность процессора находиться практически на уровне предыдущего поколения процессоров Pentium 4, оснащенных кэш памятью 512 Mb . Это подтверждает сказанное ранее, что реальное увеличение производительности мы увидим в ближайшем будущем, когда все используемые сегодня программы, будут оптимизированы под новые особенности нового процессора. Во-вторых, мы хотим обратить внимание на заметное увеличение производительности памяти, что свидетельствует о лучшей реализации контроллера памяти в системной плате Albatron PX 865 PE . И, в-третьих, несколько увеличенная производительность дисковых операций. Честно говоря, объяснить это можно только индивидуальными особенностями используемых накопителей.

Другими словами, мы можем говорить, что выбранная нами конфигурация позволяет заметно расширить производительность памяти, и незначительно увеличить производительность процессора, однако, в ближайшем будущем, с появлением программной оптимизации, производительность увеличиться еще больше.

Теперь, давайте перейдем к нашему основному позиционированию - игровым приложениям, и сначала давайте посмотрим на возможности тестовой платформы в DX 9 тесте 3 DMark 2003.

GT1 - Wings of Fury

GT2 - Battle of Proxycon

GT3 - Troll’s Lair

GT4 - Mother Nature

CPU Score

CPU Test 1

CPU Test 2

Fill Rate (Single-Texturing)

337,4 MTexels/ s

516,6 MTexels/ s

Fill Rate (Multi-Texturing)

925,4 MTexels/ s

1043,9 MTexels/ s

Vertex Shader

Pixel Shader 2.0

Ragtroll

Здесь мы провели два испытания без включения режимов сглаживания и анизотропной фильтрации, и с минимальными установками AA и AF .

Как вы можете видеть, при включении режимов сглаживания, заметно падает производительность, что обусловлено в первую очередь возможностями графического чипа FX 5700, однако, без использования режима сглаживания и фильтрации, позволяет получить достаточно высокие скорости, что подтверждают результаты наших традиционных игровых тестов.

Как вы можете видеть, полученные результаты близки и несколько превосходят возможности аналогичных платформ с процессором Pentium 4 2.8 C , и полнее удовлетворят современного геймера, однако, если провести испытания в двух новых играх Halo (~25 fps) и Farcry (~ 13 fps), то вы увидите беспомощность построенной нами системы, что связано в первую очередь с ограничениями графической карты. Если вы хотите без проблем играть в эти игры, то необходимо приобрести видеокарту ATI Radeon 9800 XT , что заметно увеличит цену компьютера, и наша тестовая платформа перестанет быть оптимальной. Можно, конечно же, подыскать более дешевую альтернативу ATI Radeon 9800 XT , однако это в любом случае негативно повлияет на цену. Кстати, одно из оптимальных решений, на которое мы рекомендуем обратить внимание - ATI Radeon 9700.

На момент начала продаж процессорные решения серии Intel Pentium 4 позволяли создавать наиболее производительные настольные вычислительные системы. Спустя 8 лет это семейство чипов устарело и было снято с производства. Именно об этом легендарном модельном ряде ЦПУ и пойдет в этом материале речь.

Позиционирование процессора

На самом старте продаж данные процессоры принадлежали к наиболее быстродействующим решениям. На подобную их принадлежность указывали передовая на тот момент архитектура полупроводникового кристалла NetBurst, существенно возросшие тактовые частоты и прочие значительно улучшенные технические характеристики. Как результат, владельцы персональных компьютеров на их базе могли решать любые по уровню сложности задачи. Единственная сфера, в которой эти чипы не применялись - это серверы. В таких высокопроизводительных вычислительных машинах использовались процессорные решения серии XEON. Также не совсем оправданно применение в составе офисных ПК Intel Pentium 4. Ядра такого чипа в этом случае не до конца нагружались и с экономической точки зрения такой подход был целиком и полностью не оправдан. Для ниши “Интел” выпускала менее производительные и более доступные ЦПУ серии Celeron.

Комплектация

В двух типичных вариантах поставки можно было встретить процессор Intel Pentium 4. Один из них был нацелен на небольшие компании, которые специализировались на сборке системных блоков. Также такой вариант поставки подходил для домашних сборщиков персональных компьютеров. В прайс-листах он обозначался ВОХ, а в него производитель включал следующее:

    Чип в защитной упаковке из прозрачного пластика.

    Фирменную систему теплоотвода, которая состояла из специальной термопасты и кулера.

    Краткое руководство по назначению и использованию процессорного решения.

    Наклейка с логотипом модели чипа для передней панели системного блока.

Второй вариант поставки в каталогах компьютерных комплектующих обозначался TRAIL. В этом случае из списка поставки исключалась система охлаждения и ее необходимо было дополнительно приобретать. Подобный вид комплектации наиболее оптимально подходил для крупных сборщиков персональных компьютеров. За счет большого объема продаваемой продукции они могли позволить покупать системы охлаждения по более низким оптовым ценам и такой подход был оправдан с экономической точки зрения. Также такой вариант поставки пользовался повышенным спросом среди компьютерных энтузиастов, которые приобретали улучшенные модификации кулеров и это позволяло еще лучше разогнать такой процессор.

Процессорные разъемы

Процессор Intel Pentium 4 мог устанавливаться в один из 3-х видов процессорных разъемов:

Первый разъем появился в 2000 году и был актуальным до конца 2001 года. Затем ему на смену пришел PGA478, который вплоть до 2004 года занимал ведущие позиции в перечне продукции компании “Интел”. Последний сокет LGA775 появился на прилавках магазинов в 2004 году. В 2008 году его сменил LGA1156, который был нацелен на применение чипов с более передовой архитектурой.

Сокет 423. Семейства поддерживаемых чипов

Производители процессоров в лице компаний “Интел” и АМД в конце 1999 года - начале 2000 года постоянно расширяли перечень предлагаемых чипов. Только у второй компании была вычислительная платформа с запасом, которая базировалась на сокете PGA462. А вот “Интел” все возможное на тот момент из процессорного разъема PGA370 “выжала” и ее нужно было предлагать рынку компьютерных технологий что-то новое. Этим новым и стал рассматриваемый чип с обновленным процессорным разъемом в 2000 году. Intel Pentium 4 дебютировал одновременно с анонсом платформы PGA423. Стартовая частота процессоров в этом случае была установлена на отметке 1,3 ГГц, а наибольшее ее значение достигало 2,0 ГГц. Все ЦПУ в этом случае принадлежали к семейству Willamette, изготавливались по технологии 190 нм. Частота системной шины была равна реальным 100 МГц, а ее эффективное значение составляло 400 МГц.

Процессорный разъем PGA478. Модели ЦПУ

Через год в 2001 году вышли обновленные процессоры Intel Pentium 4. Socket 478 - это разъем для их установки. Как было уже отмечено ранее, этот сокет был актуальным вплоть до 2004 года. Первым семейством процессоров, которые в него могли быть установлены, стал Willamette. Наивысшее значение частоты для них было установлено на 2,0 ГГц, а начальное - 1,3 ГГц. Техпроцесс у них соответствовал 190 нм. Затем появилось в продаже семейство ЦПУ Northwood. Эффективное значение частоты в некоторых моделях в этом случае было увеличено с 400 МГц до 533 МГц. Частота чипов могла находиться в пределах от 2,6 ГГц до 3,4 ГГц. Ключевое же нововведение чипов этого модельного ряда - это появление поддержки технологии виртуальной многозадачности HyperTraiding. Именно с ее помощью на одном физическом ядре обрабатывалось сразу два потока программного кода. По результатам тестов получался 15-процентный прирост быстродействия. Следующее поколение чипов “Пентиум 4” получило кодовое название Prescott. Ключевые от предшественников в этом случае заключались в улучшенном технологическом процессе, увеличении кеш-памяти второго уровня и повышение тактовой частоты до 800 МГц. При этом сохранилась поддержка HyperTraiding и не увеличилось максимальное значение тактовой частоты - 3,4 ГГц. Напоследок необходимо отметить то, что платформа PGA478 была последней вычислительной платформой, которая не поддерживала 64-битные решения и могла выполнять лишь только 32-разрядный программный код. Причем это касается и системных плат, и процессорных решений Intel Pentium 4. Характеристики компьютеров на базе таких комплектующих являются целиком и полностью устаревшими.

Завершающий этап платформы Pentium 4. Сокет для установки чипов LGA775

В 2006 году производители процессоров начали активно переходить на 64-разрядные вычисления. Именно по этой причине Intel Pentium 4 перешел на новую платформу на основе разъема LGA775. Первым поколением процессорных устройств для нее называлось точно также, как и для PGA478 - Prescott. Технические спецификации у них были идентичны предыдущим моделям чипов. Ключевое отличие - это повышение максимальной тактовой частоты, которая в этом случае могла уже достигать 3,8 ГГц. Завершающим же поколением ЦПУ стало Cedar Mill. В этом случае максимальная частота понизилась до 3,6 ГГц, но при этом техпроцесс улучшился и энергоэффективность улучшилась. В отличие от предшествующих платформ, в рамках LGA775 “Пентиум 4” плавно перешел из сегмента решений среднего и премиального уровня в нишу процессорных устройств бюджетного класса. На его место пришли чипы серии Pentium 2, которые уже могли похвастаться двумя физическими ядрами.

Тесты. Сравнение с конкурентами

В некоторых случаях достаточно неплохие результаты может показать Intel Pentium 4. Processor этот отлично подходит для выполнения программного кода, который оптимизирован под один поток. В этом случае результаты будут сопоставимы даже с нынешними ЦПУ среднего уровня. Конечно, сейчас таких программ не так уж и много, но они все еще встречаются. Также этот процессор способен составить конкуренцию нынешним флагманам в офисных приложениях. В остальных случаях этот чип не может показать приемлемый уровень производительности. Результаты тестов будут приведены для одного из последних представителей данного семейства “Пентиум 4 631”. Конкурентами для него будут процессоры Pentium D 805, Celeron Е1400, Е3200 и G460 от “Интел”. Продукция же АМД будет представлена Е-350. Количество ОЗУ стандарта DDR3 равно 8 Гб. Также данная вычислительная система доукомплектована адаптером GeForce GTX 570 с 1 Гб видеопамяти. В трехмерных пакетах Maya, Creo Elements и Solid Works в актуальных версиях 2011 года рассматриваемая модель “Пентиум 4” показывает достаточно неплохие результаты. По результатам тестов в этих 3-х программных пакетах была выведена средняя оценка по сто балльной шкале и силы распределились следующим образом:

“Пентиум 4 631” проигрывает процессорам с более продвинутой архитектурой и более высокими тактовыми частотами G460 и Е3200, у которых 2 физических ядра. Но при этом обходит полноценную двухъядерную модель D 805 на аналогичной архитектуре. Результаты же Е-350 и Е1400 были предсказуемые. Первый чип ориентирован на сборку ПК, в которых на первый план выходит энергопотребление, а удел второго - это офисные системы. Совершенно по-другому распределяются силы при кодировании медиафайлов в программах Lame, Apple Lossless, Nero AAC и Ogg Vorbis. В этом случае на первый план уже выходит количество ядер. Чем их больше, тем лучше выполняется задача. Опять-таки, по усредненной сто балльной шкале силы распределились следующим образом:

Даже Е-350 с приоритетом на энергоэффективность обходит “Пентиум 4” модели 631. Продвинутая архитектура полупроводникового кристалла и наличие 2-х ядер все-таки дают о себе знать. Изменяется картина при тестировании процессоров в архиваторах WinRAR и 7-Zip. Результаты чипов по той же самой шкале распределились так:

В этом тесте множество факторов оказывает влияние на конечный результат. Это и архитектура, это и размер кеша, это и тактовая частота, это и количеств ядер. Как результат, типичным середнячком получился тестируемый “Пентиум 4” в исполнении 631. Эталонная же система, производительность которой соответствовала 100 баллам, базировалась на ЦПУ Athlon II Х4 модели 620 от АМД.

Разгон

Внушительным увеличением уровня производительности мог похвастаться Intel Pentium 4. Разгон этих процессорных устройств позволял достичь значений тактовой частоты в 3,9-4,0 ГГц при улучшенной воздушной системе охлаждения. Если же заменить воздушное охлаждение на жидкостное на базе азота, то вполне можно рассчитывать на покорение значения в 4,1-4,2 ГГц. Перед разгоном компьютерная система должна быть укомплектована следующим образом:

    Мощность блока питания должна быть минимум 600 Вт.

    В компьютере должна быть установлена продвинутая модель системной платы, на которой можно осуществлять плавное регулирование различных параметров.

    Кроме основного кулера, на процессоре в системном блоке должны находиться дополнительные 2-3 вентилятора для осуществления улучшенного теплоотвода.

Мультипликатор частоты в этих чипах был заблокирован. Поэтому простым поднятием его значения разогнать ПК невозможно. Поэтому единственный способ увеличения производительности - это увеличение реального значения тактовой частоты системной шины. Порядок же разгона в этом случае следующий:

    Уменьшаются значения частот всех компонентов ПК. В этот список лишь только не попадает лишь только системной шины.

    На следующем этапе увеличиваем рабочее значение частоты последней.

    После каждого такого шага необходимо проверить стабильность работы компьютера с помощью прикладного специализированного софта.

    Когда простого повышения частоты уже недостаточно начинаем повышать напряжение на ЦПУ. Его максимальное значение равно 1,35-1,38 В.

    После достижения наибольшего значения напряжения частоту чипа повышать нельзя. Это и есть режим максимального быстродействия компьютерной системы.

В качестве примера можно привести модель 630 процессора “Пентиум 4”. Ее стартовая частота равна 3 ГГц. Номинальная же тактовая частота системной шины составляет в этом случае 200 МГц. Значение последней можно на воздушном охлаждении повысить вплоть до 280-290 МГц. В результате ЦПУ будет работать уже на 4,0 ГГц. То есть прирост производительности составляет 25 процентов.

Актуальность на сегодняшний день

На сегодняшний день целиком и полностью устарели все процессоры Intel Pentium 4. Температура их функционирования, энергопотребление, технологический процесс, тактовые частоты, размер кеш-памяти и ее организация, количество адресуемой ОЗУ - это далеко не полный перечень тех характеристик, которые указывают на то, что это полупроводниковое решение устарело. Возможностей такого чипа лишь достаточно для решения наиболее простых задач. Поэтому владельцам таких компьютерных систем необходимо их обновлять в срочном порядке.

Стоимость

Несмотря на то что в 2008 году выпуск рассматриваемых ЦПУ был прекращен, их все еще можно купить в новом состоянии со складских запасов. При этом необходимо отметить то, что в исполнении LGA775 и с поддержкой технологии НТ можно приобрести чипы Intel Pentium 4. Цена на них находится в пределах 1300-1500 рублей. Для офисных систем это вполне адекватный уровень стоимости. Процессорные решения, которые находились в использовании, можно найти на различных торговых площадках в интернете. Цена в этом случае начинается с отметки в 150-200 рублей. Полностью же собранный персональный компьютер бывший в употреблении можно купить по цене от 1500 рублей.