Технологии мобильных процессоров. Под литерой «М»
Под литерой «М»
Технологии мобильных процессоров
Мобильные технологии и беспроводная связь развиваются все быстрее, а пользователям все более необходим постоянный доступ к сетевым ресурсам как дома, так и на работе и в дороге. Удовлетворяя потребности пользователей, производители сталкиваются с проблемой совмещения в одном устройстве мобильности (малого веса и большого времени автономной работы) и высокой производительности универсальности, так как ноут часто заменяет настольный компьютер. В связи с этим на рынке появилось несколько альтернативных мобильных технологий, суть которых понятна не всем пользователям. В этой статье мы расскажем о наиболее популярных технологиях мобильных процессоров и их особенностях.
На страже мегаваттов
Энергосберегающие технологии получили свое развитие еще в настольных компьютерах. Сбережение энергии достигается переводом энергоемких устройств, таких как монитор и HDD, в «спящий режим» на время, пока компьютер не используется. Однако для настольных ПК -это, скорее, полезное дополнение, чем суровая необходимость. Для мобильных же компьютеров время автономной работы - основной параметр, с которым связан размер батарей, а следовательно, и всего устройства. В результате необузданного роста частот и производительности CPU ноутбучные бренды столкнулись с еще одной важной проблемой -тепловыделением. Если в просторном настольном кейсе можно организовать эффективное охлаждение, то в тесном корпусе ноутбука это сделать очень сложно. На определенном этапе развитие мобильных технологий оказалось недостаточным, чтобы справиться с возросшими энергопотреблением и температурой, поэтому ноутбуки очень часто были громоздкими, и при этом перегревались, глючили и падали в ребут. Изначально, чтобы увеличить время работы от батарей, в ноутбуках был применен тот же принцип, что и в настольных ПК: во время простоя устройство сразу же переводится в «спящий режим» (отключается дисплей и периферийные устройства). Также было предложено по мере разряда батарей понижать частоту и напряжение питания CPU и видеоадаптера. Таким образом, в определенный момент производительность ноутбука падала в разы, и пользователь уже не мог запустить на нем ресурсоемкое приложение. Подобное решение не могло удовлетворить потребителей, поэтому на рынке появились мобильные технологии, которые, в первую очередь, коснулись про-цов, как наиболее «прожорливых» элементов компьютера, породив их специализированные, мобильные версии (в названии присутствует обозначение «Mobile» или просто «М»).
Power Now! Technology
Технология PowerNow! является разработкой компании AMD и впервые была реализована в процессоре AMD Кб 2+, специально сконструированном для ноутбуков (не надо путать ее с Cool'n'Quiet, применяемой в настольных процессорах для контроля охлаждения). CPU был сделан по 0.18-микронному техпроцессу (на тот момент преобладал литографический размер 0.25 мкм) и отличался пониженным энергопотреблением. Известно, что стандартные офисные приложения требуют от железа гораздо меньшей производительности, чем мультимедийная программа или игра. Суть технологии с точки зрения потребителя проста: операционная система множество раз в секунду анализирует степень загруженности процессора, и специальный драйвер постоянно изменяет значения рабочей частоты CPU и потребляемого напряжения. Это позволяет достичь ощутимой экономии заряда батарей. При резком возрастании потребности в вычислительной мощности процессор практически мгновенно переключается в режим максимальной производительности, так что пользователь в большинстве случаев не заметит работу PowerNow!. Увеличение производительности может быть осуществлено и по запросу приложения. При подключении к внешнему источнику питания PowerNow! также дает положительный эффект: ноутбук будет работать тише и меньше греться, что тоже достаточно важно. Пользователь может управлять работой PowerNow! прямо из «Панели управления» WindowsXP (или соответствующими средствами другой ОС). Доступно три режима работы ноутбука: Автоматический режим - PowerNow! выбирает оптимальный режим энергопотребление/производительность и автоматически изменяет его в зависимости от решаемых задач. При тестах обычно четко различимы 5 ступеней снижения частоты CPU. Собственно, это основной режим. Режим максимально долгой работы от батарей (у многих ноутбуков он называется «Презентация» (Presentation)). В этом режиме частота и энергопотребление CPU находятся в самом низком performance-состоянии. Например, у Mobile Athlon XP - это 400 или 533 МГц (у разных ноутбуков). Естественно, при таких установках запуск требовательных к ресурсам приложений вызовет значительные трудности. Режим максимальной производительности позволяет жестко зафиксировать производительность процессора на самом высоком уровне. Этот режим будет полезен, когда ноутбук подключен к стационарному источнику питания, и точно потребуются все вычислительные ресурсы. Например, при запуске требовательной к производительности игры «лишние» переключения частоты могут привести к «подтормаживаниям». Гибкое управление параметрами производительности и энергопотребления является значительным преимуществом перед конкурирующей технологией Intel SpeedStep, однако Intel ориентируется на разработку платформ (в том числе и мобильных), a AMD ограничивается созданием CPU. Конкуренция продолжается и в плане оптимизации работы самих процессоров. В свете необходимости значительно понижать рабочие частоты это становится особенно актуальным. Теперь производители CPU провозгласили курс на IPC (количество инструкций за цикл) и активно используют эту характеристику в рекламных целях вместо постепенно изживающих себя в плане PR'a гигагерц. Начиная с Athlon ХР и Mobile AMD Athlon 4, процессоры AMD построены с использованием фирменной архитектуры QuantiSpeed. Производительность процессора получается путем умножения IPC на частоту. При высоких частотах необходимы более длинные конвейеры, а выполнение команд хуже поддается распараллеливанию. Короткие конвейеры позволяют повысить показатель IPC, но и требуют более низких тактовых частот. Проблема в том, как достичь оптимального соотношения частоты и IPC. Специалисты AMD утверждает, что добились такого соотношения в своем суперскалярном, полностью распараллеленном ядре, которое позволяет одновременно обрабатывать большое количество инструкций. Hardware Data Prefetch (опережающая выборка инструкций) - вторая составляющая технологии - призвана исключить простои конвейеров путем предварительного помещения инструкций (но не данных) из оперативной памяти в КЭШ L1 (благо он довольно просторный - 128 Кб), минуя КЭШ L2. Оптимизация коснулась и операций с плавающей точкой. Floating Unit Point позволяет выполнять операции на всех конвейерах CPU и дает значительный запас по увеличению частоты. Exclusive and Speculative Translation Look-aside Buffers (буферы эксклюзивного и спекулятивного предсказания трансляций) - эта составляющая осуществляет опережающее чтение КЭШа L2 и осуществляет его оптимизацию при помощи матриц данных и инструкций, которые могут понадобиться в ближайшее время, а также исключает дублирование данных (эксклюзивность КЭШа). Борьба за снижение энергопотребления продолжается за счет уменьшения литографического размера и числа транзисторов. Если Mobile AMD Athlon 64 производится по 0.13-мкм техпроцессу и содержит 105.9 млн. транзисторов, то Low Power Mobile AMD Athlon 64 имеет литографический размер уже 0.09-мкм и содержит 68.5 млн. транзисторов за счет урезанного в два раза КЭШа L2 (с 1024 Кб до 512 Кб). На данный момент на рынке представлены ноутбуки на основе мобильных CPU: Mobile AMD Athlon 4, Mobile AMD Athlon XP-M, AMD Athlon 64 Processor For Desktop Replacement Notebooks, Mobile AMD Athlon 64, Low Power Mobile AMD Athlon 64, Mobile AMD Sempron.
IntelSpeedStm
Технология SpeedStep впервые была реализована в Mobile Intel Pentium III как ответ AMD PowerNow!. По сути, принцип SpeedStep - тот же: для увеличения времени работы от батарей CPU переводится в режим пониженной тактовой частоты и энергопотребления. Однако есть существенное отличие: если PowerNow! понижает и повышает частоту постепенно, в соответствии с потребностями системы, то у мобильных процессоров Intel с технологией SpeedStep есть только два состояния Normal и Battery Optimized. Ноутбук стартует в Battery Optimized Mode, то есть на меньшей из двух частот, и если питание осуществляется от сети, драйвер переводит процессор в состояние «глубокого сна» и поднимает напряжение и частоту ядра, а затем возвращает CPU в нормальное состояние. Противоположный процесс (если ноутбук переключился на батареи) происходит в обратном порядке. Надо сказать, что «меньшая» частота отнюдь не в 2 раза меньше. В Battery Optimized Mode достигается почти двукратное снижение потребляемой мощности. Например, у 1 ГГц CPU с питанием ядра 1.7 В и потребляемой мощностью 34 Вт в «экономичном» режиме частота составляет 700 МГц, напряжение питания - 1.35 В, а потребляемая мощность - 16.1 Вт. Но такое решение с трудом могло конкурировать с технологией AMD.
Enhanced SpeedStep
Улучшенная технология отличается большей агрессивностью, то есть процессор меняет частоту и напряжение питания не при переходе с питания от сети на автономное питание, а в зависимости от загрузки системы. Однако состояний по-прежнему два: Maximum Performance и Battery Optimized Mode. Выбрать любой из них можно вручную из мастера управления питанием. Дальнейшее развитие технология SpeedStep получила уже в рамках Intel Centrino.
Intel Centrino
В отличие от AMD, Intel предложила пользователям комплексную мобильную платформу. Intel Centrino - это не только мобильный процессор, но и специально разработанный чипсет, измененная процессорная шина, специализированная система охлаждения и логика беспроводной связи. По данным исследований Intel на долю CPU и платформы в энергопотреблении системы приходятся не такие уж значительные доли (6% и 10%, соответственно), а больше половины приходится на LCD, HDD и потери блока питания. Но почему же тогда в мобильном Pentium внедрено столько энергосберегающих технологий? Возможно, в режиме минимального энергопотребления (7.5 Вт, 0.988 В) так оно и есть, но при максимальной нагрузке мобильные Pentium'bi потребляют уже 21 Вт, так что соотношение меняется, и экономия приобретает смысл.
Pentium M
На сегодняшний момент Pentium M строится на ядре Dothan, которое выполнено по 90 нм техпроцессу, состоит из 140 млн. транзисторов и имеет КЭШ L2 объемом 2 Мб с оптимизированным энергопотреблением. Предыдущее ядро - Banias (0.13 мкм техпроцесс, 77 млн. транзисторов, 1 Мб L2). Выпущены также урезанные версии этих ядер для Celeron M. Технология Enhanced SpeedStep доросла до своей третьей генерации: теперь CPU имеет 5 градаций частоты и напряжения (от 600 МГц, 0.988 В до 2 ГГц, 1.43 В), между которыми переключается в зависимости от загрузки системы. Несмотря на то, что КЭШ L1 невелик, всего 64 Кб, Pentium M обладает огромным инклюзивным КЭШем L2 объемом 2 Мб. Этот КЭШ был бы неэффективен с точки зрения энергопотребления, если бы не его организация. КЭШ имеет 8 каналов и разделен на блоки по 128 Кб (256 Кб для 2 Мб КЭШ). При обращении к блоку, он активируется, но на это потребовалось бы много энергии, поэтому каждый блок поделен на 4 (8 -для 2 Мб КЭШ) квадранта и имеет селектор квадрантов. Таким образом, активируется только 1 из 32 (64 - для 2 Мб КЭШ) частей. Неактивные квадранты отключены от питания и не потребляют энергии. Чтобы избежать простоя конвейеров CPU, в КЭШе используется предвыборка данных из оперативной памяти: отслеживаются обращения к RAM, и в КЭШ загружаются прилегающие области памяти, которые могут потребоваться в дальнейшем. Так как с борьбой за низкое энергопотребление связано значительное снижение частот, для поддержания приемлемого уровня производительности Intel старается оптимизировать работу CPU и максимально снизить количество «лишних» микроопераций. Для этого в Pentium M реализовано три улучшения. Improved branch prediction (улучшенное предсказание ветвлений) - циклы и объекты в ООП-языках (C++, Java) приводят к появлению ветвлений, и если CPU выбрал «неправильную» ветвь, ему придется вернуться в исходную точку, очистить конвейер и начать обрабатывать другую ветвь, что приводит к большому количеству лишних операций. Блок предсказания ветвлений содержит бимодальный алгоритм определения простых ветвлений, а также хранит историю операций для предсказания более сложных ветвлений. Например, если обнаружен цикл, то почти наверняка можно предсказать дальнейшие операции на большое число итераций вперед и пропускать микрооперации с определенным шагом. Более сложные ветви сравниваются с буфером истории ветвлений и, соответственно, быстро определяются их цели, и выбирается нужная ветвь. Механизм предсказания ветвлений имеется в любом суперскалярном процессоре, однако Intel утверждает, что добилась 20%-го снижения количества ошибок по сравнению с предыдущими реализациями механизма. Microops fusion (слияние микроопераций) - инструкции процессору раскладываются на микрооперации, которые выполняются различными его блоками. Например, после обработки адреса загрузка данных из памяти в регистры производится загрузчиком, а математическая операция - АЛУ. Так как вторая операция не может быть выполнена до завершения первой, требуется два цикла. В Pentium M специальный блок связывает эти две операции, и они выполняются за один цикл. По данным Intel, это позволяет экономить до 10% потока инструкций. Dedicated stack manager (выделенный менеджер стека) - операции со стеком требуют большого количества циклов процессора, связанных с обновлением указателя стека в конце каждой операции с ним. Выделенный менеджер стека, представляющий собой отдельный буфер, находящийся перед суперскалярными декодерами и хранящий приращение от всех микроопераций, позволяет снизить количество операций со стеком и увеличить параллелизм. В настоящий момент на рынке представлены следующие мобильные процессоры фирмы Intel: Pentium M, Mobile Pentium 4 supporting Hyper-Threading, Mobile Pentium 4, Intel Celeron M, Mobile Intel Celeron.
Чипсеты
Для Pentium M разработаны специализированные чипсеты, обеспечивающие управление энергосбережением. Это i855PM, два чипсета с интегрированным графическим адаптером: i855GM и J855GME (последний поддерживает DDR333) с частотой FSB 100(400) МГц и i852GME (с интегрированным графическим адаптером), поддерживающий частоту 100(400)/133(533) МГц. Чипсет управляет усилителями шины, которые потребляют значительное количество энергии. Когда данные не передаются, усилители отключаются (в настольных ПК они работают постоянно). При передаче данных чипсет заранее передает CPU команду включить усилители. Также чипсет в полной мере использует возможности энергосбережения RAM, заложенные в стандарте DDR. Дело в том, что в Power-Down Mode память может отключать неиспользуемые модули от питания и не обновлять отдельные ряды в массиве, если в них не содержится данных. Однако в таком режиме память работает медленнее, так как требуется затратить дополнительные циклы на ее «пробуждение». В зависимости от загрузки системы, чипсет переводит память в Power-Down Mode и обратно. Также при работе от батарей чипсет переключает графическое ядро на более низкую частоту и задействует Intel Display Power Saving Technology (DPST). Логика отслеживает уровень освещенности дисплея и степень статичности изображения, в зависимости от этого регулируется мощность подсветки LCD-экрана. По данным Intel, это позволяет сократить потребляемую им энергию на 25%.
Охлаждение
В ноутбуках используется особая система охлаждения. Наибольшим тепловыделением в системе обладает CPU. Pentium М в силу высокой частоты и производительности не может охлаждаться пассивной системой, а организовать активное охлаждение в тонком корпусе проблематично, так как CPU находится в центре и не имеет доступа к открытому воздуху. Таким образом, источник тепла и теплообменник должны быть разнесены на определенное расстояние. Теплообменник с вентилятором находятся в углу корпуса, рядом с вентиляционными отверстиями, а тепловой интерфейс с CPU осуществляется посредством тепловодных труб. Под процессором расположена рассеивающая пластина.
Беспроводная связь
В концепцию Intel Centrino также входит обеспечение беспроводной связи (Wi-Fi, Bluetooth). Поддержание стабильной связи встречает определенные проблемы в связи с тем, что ноутбук сам является источником помех, а кроме того, и Bluetooth, и Wi-Fi (802.11b) работают на частоте -2.4 ГГц. В Intel Centrino включен набор логики, обеспечивающий распределение частот между Bluetooth и Wi-Fi модулями, который позволяет применить алгоритм адаптивного подбора частоты и обеспечить устойчивое соединение.
Transmeta
Если на рынке CPU для настольных ПК играют, в основном, два конкурента, то рынок мобильных технологий более демократичен. Альтернативный взгляд на мобильные CPU предложила компания Transmeta в процессорах Crusoe и Efficeon. Суть технологии VLIW (Very Long Instruction Word) - сверхбольшое командное слово - заключается в том, что ядро работает с 128-разрядными командами в случае Transmeta Crusoe и с 256-разрядными - у Transmeta Efficeon. Специальный софтверный транслятор Code Morphing Software (CMS), который зашит в отдельной FlashROM-микросхеме, расположенной на материнской плате, получает инструкции х86 от приложений и драйверов через операционную систему и преобразует их в длинные команды, которые направляются в процессор. CMS занимается также оптимизацией кода. Однажды транслированные команды хранятся в буфере и используются без повторной трансляции. Таким образом, CPU Transmeta содержит меньше логических транзисторов, являющихся основными потребителями энергии, которые в обычных процах используются в модулях трансляции и оптимизации микроопераций. За цикл данный CPU выполняет 4 (Crusoe) или 8 (Efficeon) 32-битных команд. CMS можно апгрейдить путем перепрошивки соответствующей микросхемы. Несмотря на то, что VLIW считается тупиковой технологией по сравнению с суперскалярными CPU, процы от Transmeta успешно развиваются. Например, Transmeta Efficeon TM8600 производится по 0.13 мкм техпроцессу, имеет L1 64 Кб КЭШ команд, 64 Кб КЭШ данных и 1 Мб КЭШ L2, тактовые частоты до 1.1 ГГц, поддерживает инструкции SSE, SSE2 и ММХ, DDR 166 МГц, AGP 4x, HyperTransport 400 МГц. Еще одной особенностью CPU Transmeta является то, что «северный мост» полностью встроен в проц. Проц, так же, как и чипсеты Intel, может переводить периферийные устройства в спящий режим и управлять режимами энергопотребления DDR. Для управления энергопотреблением и тепловыделением в CPU интегрирована логика технологии Enhanced LongRun. Подобно PowerNow! и Enhanced SpeedStep она динамически переключает частоту и напряжение CPU. Благодаря описанным выше решениям CPU от Transmeta не требуют активного охлаждения - достаточно радиатора! Таким образом, на основе этой платформы делают одни из самых компактных ноутбуков, но производительность оставляет желать лучшего (Crusoe 933 МГц по производительности приблизительно соответствует Pentium M III 600 МГц).
VIA
Известный производитель чипсетов также производит мобильные CPU и процессоры с низким энергопотреблением для настольных ПК. Мобильные процы от VIA это: Eden-N, Eden ESP и СЗ-М. Eden-N производится по 0.13 мкм техпроцессу, имеет размеры 15x15 мм и потребляет всего 7 ватт при тактовой частоте 1 ГГц, соответственно, не требует активного охлаждения. Технология PowerSaver 3.0, аналогично PowerNow! и Enhanced SpeedStep, динамически меняет напряжение и частоту CPU в зависимости от загрузки системы. Процессор имеет два 64 Кб ассоциативных КЭШа L1 и 64 Кб 16-канального эксклюзивного КЭШа L2, работающего на частоте шины. В процессорах VIA также применяются механизмы предсказания ветвлений и предвыборки данных из памяти (l-fetch). Мобильные процессоры VIA эффективно работают в связке с фирменным чипсетом VIA CN400, разработанным специально для цифровых развлекательных устройств. Он оптимизирован под передачу видео- и аудиопотоков, имеет 64-битный контроллер памяти FastStream64 и шину Ultra V-Link с пропускной способностью 1 Гб для связи с южным мостом. Чипсет также обеспечивает управление питанием памяти и периферии. По производительности решения от VIA значительно проигрывают мобильным Сеlегоn'ам от Intel.
Выводы
Итак, развитие мобильных технологий уже прошло этап становления. Производители ориентируются на оптимизацию работы своих CPU, чтобы достичь максимальной производительности при минимальном энергопотреблении. Большое внимание уделяется развитию беспроводной связи. Сделать однозначный вывод о преимуществе одной из технологий нельзя. Intel продвигает комплексное решение, однако AMD предоставляет больше свободы производителям ноутбуков (например, в выборе видеоадаптера, что сейчас немаловажно для потребителя). Решения от Transmeta и VIA пока недостаточно популярны. Остальное покажет время.
Журнал "Железо"