Все о шине PCI и PCI Express – спецификации, различия и совместимость. Чем отличается интерфейс PCI Express от PCI

ВведениеРаньше массового покупателя интересовало главным образом лишь два типа твердотельных накопителей: либо высокоскоростные модели премиального уровня вроде Samsung 850 PRO, либо выгодные по соотношению цены и производительности предложения, такие как Crucial BX100 или SanDisk Ultra II. То есть, сегментация рынка SSD была крайне слабой, а конкуренция между производителями хоть и разворачивалась по направлениям производительности и цены, разрыв между решениями верхнего и нижнего уровня оставался достаточно небольшим. Такое положение дел было отчасти обусловлено тем, что технология SSD сама по себе существенно улучшает ощущения пользователя от работы с компьютером, и поэтому вопросы конкретной реализации для многих отходят на второй план. По этой же причине потребительские твердотельные накопители были вписаны в старую инфраструктуру, которая изначально ориентировалась на механические жёсткие диски. Это существенно облегчило их внедрение, однако заключило SSD в достаточно узкие рамки, которые во многом сдерживают как рост пропускной способности, так и снижение латентности дисковой подсистемы.

Но до определённых пор такое положение дел всех устраивало. Технология SSD была в новинку, и пользователи, переходящие на твердотельные накопители, оставались довольны своим приобретением даже несмотря на то, что по сути они получали продукты, которые на самом деле работают далеко не на пределе своих возможностей, а их производительность сдерживается искусственными барьерами. Однако к сегодняшнему дню SSD, пожалуй, можно считать уже самым настоящим мэйнстримом. Любой уважающий себя владелец персонального компьютера если и не имеет хотя бы один SSD в своей системе, то очень серьёзно настроен на его приобретение в самое ближайшее время. И в этих условиях производители просто вынуждены задумываться о том, чтобы развернуть, наконец, полноценную конкуренцию: разрушить все барьеры и перейти к выпуску более широких линеек продукции, принципиально различающихся по предлагаемым характеристикам. Благо для этого подготовлена вся необходимая почва, и, в первую очередь, большинство разработчиков SSD имеют желание и возможности для того, чтобы заняться выпуском продуктов, работающих не через наследственный SATA-интерфейс, а через куда более производительную шину PCI Express.

Поскольку пропускная способность SATA ограничена величиной 6 Гбит/с, максимальная скорость флагманских SATA SSD не выходит за величину порядка 500 Мбайт/с. Тем не менее, современные накопители, основанные на флеш-памяти, способны на гораздо большее: ведь если задуматься, то они имеют больше общего с системной памятью, нежели с механическими жёсткими дисками. Что же касается шины PCI Express, то сейчас она активно применяется в качестве транспортного уровня при подключении графических карт и прочих дополнительных контроллеров, нуждающихся в обмене данными с высокой скоростью, например, Thunderbolt. Одна линия PCI Express второго поколения обеспечивает пропускную способность на уровне 500 Мбайт/с, а линия PCI Express 3.0 может развивать скорость до 985 Мбайт/с. Таким образом, интерфейсная карта, устанавливаемая в слот PCIe x4 (с четырьмя линиями), может обмениваться данными на скорости до 2 Гбайт/с в случае PCI Express 2.0 и до почти 4 Гбайт/с – при использовании PCI Express третьего поколения. Это отличные показатели, которые вполне подходят и для современных твердотельных накопителей.

Из сказанного закономерно следует, что на рынке помимо SATA SSD должны постепенно находить распространение высокоскоростные накопители, использующие шину PCI Express. И это действительно происходит. В магазинах можно найти несколько моделей потребительских твердотельных накопителей от ведущих производителей, выполненных в виде карт расширения или M.2-плат, которые используют разные варианты шины PCI Express. Мы решили собрать их вместе и сравнить между собой по производительности и другим параметрам.

Участники тестирования

Intel SSD 750 400 Гбайт

На рынке твердотельных накопителей компания Intel придерживается довольно-таки нестандартной стратегии и разработке SSD для потребительского сегмента уделяет не слишком серьёзное внимание, концентрируясь на продуктах для серверов. Однако её предложения от этого не становятся неинтересными, особенно если речь идёт о твердотельном накопителе для шины PCI Express. В данном случае Intel решила адаптировать для использования в высокопроизводительном клиентском SSD свою самую прогрессивную серверную платформу. Именно таким образом и родился Intel SSD 750 400 Гбайт, который получил не только впечатляющие характеристики быстродействия и ряд технологий серверного уровня, отвечающих за надёжность, но и поддержку новомодного интерфейса NVMe, о котором несколько слов стоит сказать отдельно.




Если говорить о конкретных улучшениях NVMe, то в первую очередь упоминания заслуживает снижение накладных расходов. Например, пересылка наиболее типичных 4-килобайтных блоков в новом протоколе требует подачи лишь одной команды вместо двух. А весь набор управляющих инструкций упрощён настолько, что их обработка на уровне драйвера снижает загрузку процессора и возникающие при этом задержки как минимум вдвое. Второе важное нововведение – поддержка глубокой конвейеризации и многозадачности, заключающаяся в возможности параллельно создавать множественные очереди запросов вместо имевшейся ранее единой очереди на 32 команды. Интерфейсный протокол NVMe способен обслуживать до 65536 очередей, причём каждая из них может содержать до 65536 команд. Фактически какие-либо ограничения ликвидируются вообще, и это очень важно для серверных сред, где на дисковую подсистему может возлагаться огромное количество одновременных операций ввода-вывода.



Но несмотря на работу через интерфейс NVMe, Intel SSD 750 – это всё же не серверный, а потребительский накопитель. Да, почти такая же аппаратная платформа, как в этом накопителе, используется в SSD серверного класса Intel DC P3500, P3600 и P3700, но в Intel SSD 750 применена более дешёвая ординарная MLC NAND, а кроме того модифицирована прошивка. Производитель считает, что благодаря таким изменениям получившийся продукт понравится энтузиастам, поскольку он сочетает высокую мощность, принципиально новый интерфейс NVMe и не слишком пугающую стоимость.

Intel SSD 750 представляет собой PCIe x4 карту половинной высоты, которая может задействовать четыре линии стандарта 3.0 и развивать последовательные скорости передачи данных до 2,4 Гбайт/с, а скорость случайных операций – до 440 тысяч IOPS. Правда, наибольшей производительностью отличается наиболее ёмкая модификация на 1,2 Тбайт, полученная же нами на тесты версия объёмом 400 Гбайт немного помедленнее.



Плата накопителя полностью закрыта бронёй. С лицевой стороны это алюминиевый радиатор, а с оборотной – декоративная металлическая пластина, которая на самом деле с микросхемами не соприкасается. Следует отметить, что применение здесь радиатора – необходимость. Основной контроллер интеловского SSD выделяет немало тепла, и при высокой нагрузке даже оснащённый таким охлаждением накопитель может разогреваться до температур порядка 50-55 градусов. Но благодаря предустановленному охлаждению никаких намёков на троттлинг не наблюдается – производительность остаётся постоянной даже в процессе непрерывного и интенсивного использования.



В основе Intel SSD 750 лежит контроллер серверного уровня Intel CH29AE41AB0, который работает на частоте 400 МГц и обладает восемнадцатью (!) каналами для подключения флеш-памяти. Если учесть, что большинство контроллеров для потребительских SSD располагают либо восемью, либо четырьмя каналами, становится понятно, что Intel SSD 750 действительно может прокачивать по шине значительно больше данных, чем привычные модели SSD.



Что касается используемой флеш-памяти, то в этой части Intel SSD 750 не проводит никаких инноваций. Он основывается на обычной MLC NAND интеловского же производства, выпущенной по 20-нм техпроцессу и имеющей ядра объёмом и 64, и 128 Гбит вперемежку. Следует заметить, что большинство прочих производителей SSD достаточно давно отказались от подобной памяти, перейдя на чипы, сделанные по более тонким нормам. Да и сама Intel начала перевод на 16-нм память не только своих потребительских, но и серверных накопителей. Однако несмотря на всё это, в Intel SSD 750 устанавливается более старая память, которая предположительно имеет более высокий ресурс.

Серверное происхождение Intel SSD 750 прослеживается ещё и в том, что общий объём флеш-памяти у этого SSD составляет 480 ГиБ, от которых пользователю доступно лишь около 78 процентов. Остальное отводится на подменный фонд, сборку мусора и технологии защиты данных. В Intel SSD 750 реализована традиционная для флагманских накопителей RAID 5-подобная схема на уровне кристаллов MLC NAND, что позволяет успешно восстанавливать данные даже в том случае, когда один из чипов полностью выходит из строя. Кроме того, интеловский SSD обеспечивает полную защиту данных от перебоев питания. На Intel SSD 750 имеется два электролитических конденсатора, и их ёмкости хватает для штатного завершения работы накопителя в автономном режиме.

Kingston HyperX Predator 480 Гбайт

Kingston HyperX Predator – это куда более традиционное по сравнению с Intel SSD 750 решение. Во-первых, работает оно через протокол AHCI, а не NVMe, а во-вторых, для подключения к системе этому SSD требуется более распространённая шина PCI Express 2.0. Всё это делает вариант Kingston несколько медленнее – пиковые скорости при последовательных операциях не превышают 1400 Мбайт/с, а случайные – 160 тысяч IOPS. Но зато HyperX Predator не накладывает никаких специальных требований на систему – он совместим с любыми, в том числе и старыми платформами.

Вместе с этим, накопитель имеет не совсем простую двухкомпонентную конструкцию. Сам SSD представляет собой плату в форм-факторе M.2, которая дополнена PCI Express переходником, позволяющим подключать M.2-накопители через обычные полноразмерные PCIe слоты. Переходник выполнен в виде PCIe x4 карты половинной высоты, задействующей все четыре линии PCI Express. Благодаря такой конструкции Kingston продаёт свой HyperX Predator в двух вариантах: как PCIe SSD для десктопов и как M.2-накопитель для мобильных систем (в этом случае переходник в поставку не включается).



Kingston HyperX Predator базируется на контроллере Marvell Altaplus (88SS9293), который с одной стороны поддерживает четыре линии PCI Express 2.0, а с другой – имеет восемь каналов для подключения флеш-памяти. На данный момент это – самый быстрый серийно выпускаемый SSD-контроллер фирмы Marvell с поддержкой PCI Express. Однако вскоре у Marvell появятся и более быстрые последователи с поддержкой NVMe и PCI Express 3.0, которой у чипа Altaplus нет.



Поскольку сама компания Kingston не производит ни контроллеров, ни памяти, собирая свои SSD из элементной базы, закупаемой у других производителей, нет ничего странного в том, что в основе HyperX Predator PCIe SSD лежит не только сторонний контроллер, но и 128-гигабитные 19-нм чипы MLC NAND компании Toshiba. Такая память имеет невысокую закупочную цену и ставится сейчас во многие продукты Kingston (и других фирм), и в первую очередь в ширпотребные модели.



Однако использование подобной памяти породило парадокс: несмотря на то, что по своему формальному позиционированию Kingston HyperX Predator PCIe SSD – это продукт премиального класса, на него даётся всего лишь трёхлетняя гарантия, а заявленное среднее время наработки на отказ значительно меньше, чем у флагманских SATA SSD других производителей.

Никаких особенных технологий защиты данных в Kingston HyperX Predator также не предусматривается. Но накопитель имеет сравнительно большую скрытую от глаз пользователя область, размер которой составляет 13 процентов от полной ёмкости накопителя. Входящая в неё резервная флеш-память используется для сборки мусора и выравнивания износа, но в первую очередь расходуется на подмену вышедших из строя ячеек памяти.

Остаётся лишь добавить, что в конструкции HyperX Predator не предусмотрено никаких специальных средств для отвода тепла от контроллера. В отличие от большинства прочих высокопроизводительных решений, радиатора у этого накопителя нет. Тем не менее, к перегреву этот SSD совершенно не склонен – его максимальное тепловыделение лишь немного превышает 8 Вт.

OCZ Revodrive 350 480 Гбайт

OCZ Revodrive 350 с полным правом можно назвать одним из самых старых потребительских твердотельных накопителей с интерфейсом PCI Express. Ещё в те времена, когда никто из прочих производителей о выпуске клиентских PCIe SSD даже не задумывался, в модельном ряду компании OCZ имелся RevoDrive 3 (X2) – прообраз современного Revodrive 350. Однако уходящие в прошлое корни PCIe-накопителя OCZ делают его несколько странным предложением на фоне актуальных конкурентов. В то время как большинство производителей высокопроизводительных накопителей для ПК пользуются современными контроллерами с врождённой поддержкой шины PCI Express, в Revodrive 350 реализована очень замысловатая и явно неоптимальная архитектура. Он базируется на двух или четырёх (в зависимости от объёма) контроллерах SandForce SF-2200, которые собраны в RAID-массив нулевого уровня.

Если говорить о принявшей участие в этом тестировании модели OCZ Revodrive 350 объёмом 480 Гбайт, то в её основе, фактически, лежат четыре SATA SSD ёмкостью по 120 Гбайт, каждый из которых базируется на собственном чипе SF-2282 (аналоге широко распространённого SF-2281). Затем эти элементы объединены в единый четырёхкомпонентный RAID 0-массив. Однако для этой цели используется не совсем привычный RAID-контроллер, а фирменный процессор виртуализации (VCA 2.0) OCZ ICT-0262. Впрочем, очень похоже на то, что под этим именем скрывается перелицованная микросхема Marvell 88SE9548, представляющая собой четырёхпортовый RAID-контроллер SAS/SATA 6 Гбит/с с интерфейсом PCI Express 2.0 x8. Но даже если и так, то инженеры OCZ написали для этого контроллера собственную прошивку и драйвер.



Уникальность программной составляющей RevoDrive 350 заключается в том, что в нём реализован не совсем классический RAID 0, а некое его подобие с интерактивной балансировкой нагрузки. Вместо разбиения потока данных на блоки фиксированного размера и последовательной их передачи на разные контроллеры SF-2282, технология VCA 2.0 предполагает анализ и гибкое перераспределение операций ввода-вывода в зависимости от текущей занятости контроллеров флеш-памяти. Поэтому RevoDrive 350 выглядит для пользователя как монолитный твердотельный накопитель. В его BIOS нельзя зайти, а обнаружить, что в недрах этого SSD скрывается RAID-массив, без подробного знакомства с аппаратной начинкой невозможно. Более того, в отличие от обычных RAID-массивов, в RevoDrive 350 поддерживаются все типичные функции SSD: SMART-мониторинг, TRIM и операция Secure Erase.

RevoDrive 350 выпускается в виде плат с интерфейсом PCI Express 2.0 x8. Несмотря на то, что все восемь линий интерфейса реально используются, заявленные показатели производительности заметно ниже их суммарной теоретической пропускной способности. Максимальная скорость последовательных операций ограничивается величиной 1800 Мбайт/с, а производительность произвольных операций не превышает 140 тысяч IOPS.

Стоит отметить, что выполнен OCZ RevoDrive 350 в виде PCI Express x8 платы полной высоты, то есть этот накопитель физически больше, чем все остальные участвующие в тестировании SSD, и поэтому он не может быть установлен в низкопрофильные системы. Лицевая поверхность платы RevoDrive 350 закрыта декоративным металлическим кожухом, по совместительству выступающим радиатором для базовой микросхемы RAID-контроллера. Контроллеры SF-2282 расположены на оборотной стороне платы и какого-либо охлаждения лишены.



Для формирования массива флеш-памяти OCZ воспользовалась микросхемами своей материнской компании – Toshiba. Используются чипы, производимые по 19-нм техпроцессу и имеющие ёмкость 64 Гбит. Общий объём флеш-памяти в RevoDrive 350 480 Гбайт составляет 512 Гбайт, но 13% зарезервировано под внутренние нужды – выравнивание износа и сборку мусора.



Стоит отметить, что архитектура RevoDrive 350 не уникальна. На рынке представлены ещё несколько моделей подобных SSD, работающих по принципу «RAID-массив из SATA SSD на базе контроллеров SandForce». Однако все такие решения, как и рассматриваемый PCIe-накопитель OCZ отличаются неприятным недостатком – их производительность на операциях записи деградирует со временем. Связано это с особенностями внутренних алгоритмов контроллеров SandForce, операция TRIM у которых не возвращает скорость записи до первоначального уровня.



Тот бесспорный факт, что RevoDrive 350 стоит на ступеньку ниже PCI Express накопителей нового поколения подчёркивается и тем, что на этот накопитель даётся всего трёхлетняя гарантия, а его гарантируемый ресурс записи составляет лишь 54 Тбайт – в разы меньше, чем у конкурентов. Более того, несмотря на то, что RevoDrive 350 основывается на том же дизайне, что и серверный Z-Drive 4500, никакой защиты от перепадов напряжения питания он не имеет. Однако всё это не мешает OCZ с присущей ей дерзостью позиционировать RevoDrive 350 в качестве премиального решения уровня Intel SSD 750.

Plextor M6e Black Edition 256 Гбайт

Сразу же необходимо отметить, что накопитель Plextor M6e Black Edition является прямым последователем хорошо известной модели M6e . Похожесть новинки на предшественницу прослеживается почти во всём, если говорить о технической, а не эстетической составляющей. Новый SSD точно так же имеет двухкомпонентную конструкцию, включая в себя собственно накопитель в формате M.2 2280 и переходник, который позволяет устанавливать его в любой обычный слот PCIe x4 (или более скоростной). В его же основе лежит восьмиканальный контроллер Marvell 88SS9183, общающийся с внешним миром по двум линиям PCI Express 2.0. Так же, как и в прошлой модификации, в M6e Black Edition используется MLC-флеш-память компании Toshiba.

И это значит, что несмотря на то, что M6e Black Edition в сборе выглядит как карта половинной высоты с интерфейсом PCI Express x4, на самом деле этот SSD пользуется лишь двумя линиями PCI Express 2.0. Отсюда и не слишком впечатляющие скорости, которое лишь немного превышают быстродействие традиционных SATA SSD. Паспортная производительность на последовательных операциях ограничивается величиной 770 Мбайт/с, а на произвольных – 105 тысяч IOPS. Стоит отметить, что работает Plextor M6e Black Edition по наследственному AHCI-протоколу, и это обеспечивает его широкую совместимость с различными системами.



Несмотря на то, что Plextor M6e Black Edition, как и Kingston HyperX Predator, представляет собой комбинацию из PCI Express переходника и «ядра» в формате M.2-платы, с лицевой стороны определить это невозможно. Весь накопитель спрятался под фигурным чёрным алюминиевым кожухом, в центре которого врезан красный радиатор, который должен отводить тепло от контроллера и чипов памяти. Расчёт дизайнеров понятен: подобное цветовое решение повсеместно применяется в различном игровом железе, поэтому Plextor M6e Black Edition будет гармонично смотреться рядом со многими геймерскими материнскими платами и видеокартами большинства ведущих производителей.



Массив флеш-памяти в Plextor M6e Black Edition набран 19-нм чипами MLC NAND компании Toshiba второго поколения с ёмкостью 64 Гбит. На резерв, используемый для подменного фонда и работы внутренних алгоритмов выравнивания износа и сборки мусора отведено 7 процентов от общего объёма. Всё остальное – доступно пользователю.



Из-за использования достаточно слабого контроллера Marvell 88SS9183 с внешней шиной PCI Express 2.0 x2 накопитель Plextor M6e Black Edition стоит считать достаточно медленным PCIe SSD. Однако это не мешает производителю относить этот продукт в верхнюю ценовую категорию. С одной стороны, он всё-таки быстрее SATA SSD, а с другой – обладает неплохими характеристиками надёжности: имеет продолжительное время наработки на отказ и покрывается пятилетней гарантией. Впрочем, никаких специальных технологий, способных защитить M6e Black Edition от перепадов напряжения или увеличить его ресурс, в нём не реализовано.

Samsung SM951 256 Гбайт

Samsung SM951 – самый неуловимый накопитель в сегодняшнем тестировании. Дело в том, что изначально это – продукт для сборщиков компьютеров, поэтому в розничной продаже он представлен достаточно блекло. Тем не менее, при желании, купить его всё-таки возможно, поэтому отказываться от рассмотрения SM951 мы не стали. Тем более, если судить по характеристикам, это – весьма быстродействующая модель. Она ориентирована на работу по шине PCI Express 3.0 x4, использует протокол AHCI и обещает впечатляющие скорости: до 2150 Мбайт/с на последовательных операциях и до 90 тысяч IOPS – на произвольных. Но самое главное, при всём при этом Samsung SM951 дешевле многих прочих PCIe SSD, так что его поиски в продаже могут иметь под собой вполне конкретное экономическое обоснование.

Ещё одна особенность Samsung SM951 заключается в том, что поставляется он в M.2-виде. Изначально это решение ориентировано на мобильные системы, поэтому никаких переходников для полноразмерных слотов PCIe в комплекте с накопителем не прилагается. Тем не менее, это вряд ли можно считать серьёзным недостатком – большинство флагманских материнских плат имеют на своём борту и интерфейсные слоты M.2. Кроме того, необходимые платы-переходники широко представлены в продаже. Сам же Samsung SM951 представляет собой плату форм-фактора M.2 2280, разъём которой имеет ключ типа M, указывающий на потребность SSD в четырёх линиях PCI Express.



В основе Samsung SM951 лежит исключительно мощный контроллер Samsung UBX, разработанный производителем специально для SSD c интерфейсом PCI Express. Он базируется на трёх ядрах с ARM-архитектурой и в теории способен работать как c AHCI-, так и с NVMe-командами. В рассматриваемом SSD в контроллере включён лишь AHCI-режим. Но NVMe-версию данного контроллера в скором времени можно будет увидеть в новом потребительском SSD, который Samsung должен запустить этой осенью.



Из-за OEM-направленности для рассматриваемого накопителя не сообщается ни сроков гарантии, ни прогнозируемой выносливости. Декларировать эти параметры должны сборщики систем, в которые будет установлен SM951, либо продавцы. Однако следует отметить, что трёхмерная V-NAND, которая сейчас активно продвигается Samsung в потребительских SSD как более быстродействующая и надёжная разновидность флеш-памяти, в SM951 не используется. Вместо этого в нём применена обычная планарная Toggle Mode 2.0 MLC NAND, производимая, предположительно, по 16-нм технологии (некоторые источники предполагают 19-нм техпроцесс). Это означает, что ожидать от SM951 столь же высокой выносливости, как у флагманского SATA-накопителя 850 PRO, явно не следует. По этому параметру SM951 ближе к обычным моделям среднего уровня, к тому же на резервирование в этом SSD отводится только 7 процентов от массива флеш-памяти. Нет в Samsung SM951 и каких-то особых технологий серверного уровня для защиты данных от сбоев питания. Иными словами, акцент в этой модели сделан исключительно на скорости работы, а всё остальное отсечено для снижения стоимости.



Стоит отметить и ещё один момент. При высокой нагрузке Samsung SM951 демонстрирует достаточно серьёзный нагрев, который в конечном итоге может даже приводить ко включению троттлинга. Поэтому в высокопроизводительных системах для SM951 желательно организовать как минимум обдув, а лучше – закрыть его радиатором.

Сравнительные характеристики протестированных SSD


Вопросы совместимости

Как и всякая новая технология, твердотельные накопители с интерфейсом PCI Express пока не могут похвастать 100-процентной беспроблемной работоспособностью с любыми платформами, особенно старыми. Поэтому выбирать подходящий SSD приходится не только исходя из потребительских характеристик, но и с оглядкой на совместимость. И здесь важно иметь в виду два момента.

В первую очередь, разные SSD могут использовать разное количество линий PCI Express и разные поколения этой шины - 2.0 или 3.0. Поэтому перед покупкой PCIe накопителя нужно убедиться в том, что в системе, куда его планируется установить, есть свободный слот с нужной полосой пропускания. Конечно, более скоростные PCIe SSD имеют обратную совместимость с медленными слотами, однако в этом случае приобретение высокоскоростного SSD имеет не слишком много смысла – он попросту не сможет раскрыть весь заложенный в него потенциал.

Наиболее широкой совместимостью в этом смысле обладает Plextor M6e Black Edition – он требует всего две линии PCI Express 2.0, и такой свободный слот наверняка найдётся на практически любой материнской плате. Для Kingston HyperX Predator нужно уже четыре линии PCI Express 2.0: такие слоты PCIe тоже есть на многих платах, но некоторые дешёвые платформы лишними слотами с числом линий PCI Express четыре или более могут и не обладать. Особенно это касается материнок, построенных на чипсетах нижнего уровня, общее число линий у которых может быть урезано до шести. Поэтому перед приобретением Kingston HyperX Predator обязательно проверьте, что в системе есть свободный слот с четырьмя или большим числом линий PCI Express.

OCZ Revodrive 350 задаёт задачку посложнее – ему уже требуется восемь линий PCI Express. Такие слоты обычно реализуются уже силами не чипсета, а процессора. Поэтому оптимальным местом применения такого накопителя являются LGA 2011/2011-3-платформы, где PCI Express контроллер процессора располагает избыточным числом линий, позволяющим обслуживать более чем одну видеокарту. В системах же с LGA 1155/1150/1151-процессорами OCZ Revodrive 350 будет уместен лишь в том случае, если используется встроенная в CPU графика. В противном случае в пользу твердотельного накопителя придётся отнять половину линий у GPU, переведя его в режим PCI Express x8.

Intel SSD 750 и Samsung SM951 в чём-то похожи на OCZ Revodrive 350: их тоже предпочтительнее использовать в слотах PCI Express, питаемых от процессора. Однако причина тут не в количестве линий – им требуется всего четыре линии PCI Express, а в поколении этого интерфейса: оба эти накопителя способны задействовать увеличенную пропускную способность PCI Express 3.0. Однако есть и исключение: новейшие интеловские наборы системной логики сотой серии, предназначенные для процессоров семейства Skylake, получили поддержку PCI Express 3.0, поэтому в новейших LGA 1151-платах их без зазрений совести можно устанавливать и в чипсетные PCIe-слоты, к которым подведено как минимум четыре линии.

У проблемы совместимости есть и вторая часть. Ко всем ограничениям, связанным с пропускной способностью различных вариаций слотов PCI Express добавляются ещё и ограничения, связанные с используемыми протоколами. Наиболее беспроблемными в этом смысле являются SSD, которые работают через AHCI. Благодаря тому, что в них эмулируется поведение обычного SATA-контроллера, они могут работать с любыми, даже старыми, платформами: они видятся в BIOS любых материнских плат, могут быть загрузочными дисками, а для их работы в операционной системе не требуется и никаких дополнительных драйверов. Иными словами, Kingston HyperX Predator и Plextor M6e Black Edition – это два самых беспроблемных PCIe SSD.

А что же другая пара AHCI-накопителей? С ними ситуация немного сложнее. OCZ Revodrive 350 работает в операционной системе через собственный драйвер, но даже несмотря на это проблем с тем, чтобы сделать этот накопитель загрузочным, нет никаких. Хуже дело обстоит с Samsung SM951. Хотя этот SSD и общается с системой посредством наследственного протокола AHCI, он лишён собственного BIOS, и поэтому его инициализацию должен проводить BIOS материнской платы. К сожалению, поддержка данного SSD есть далеко не во всех материнках, в особенности старых. Поэтому с полной уверенностью можно говорить лишь о его совместимости с платами на базе последних интеловских чипсетов девяностой и сотой серии. В остальных случаях он может попросту не видеться материнской платой. Конечно, это не помешает использовать Samsung SM951 в операционной системе, где его легко инициализирует AHCI-драйвер, но в таком случае о возможности загрузки со скоростного SSD придётся забыть.

Но самые большие неудобства способен причинить Intel SSD 750, работающий через новый интерфейс NVMe. Драйверы, которые необходимы для поддержки твердотельных накопителей, работающих по этому протоколу, присутствуют только в новейших операционных системах. Так, в Linux поддержка NVMe появилась в версии ядра 3.1; «врождённый» драйвер NVMe имеется в микрософтовских системах, начиная с Windows 8.1 и Windows Server 2012 R2; а в OS X совместимость с NVMe-накопителями была добавлена в версии 10.10.3. Кроме того, NVMe SSD поддерживается далеко не всеми материнскими платами. Для того чтобы такие накопители можно было использовать в качестве загрузочных, BIOS материнской платы должен тоже располагать соответствующим драйвером. Однако производители встроили необходимую функциональность лишь в самые последние версии прошивок, выпущенные для наиболее свежих моделей материнок. Поэтому поддержка загрузки операционной системы с NVMe-накопителей есть лишь на самых современных платах для энтузиастов, основанных на наборах логики Intel Z97, Z170 и X99. В более старых и дешёвых платформах пользователи смогут воспользоваться NVMe SSD лишь как вторыми дисками в ограниченном наборе ОС.

Несмотря на то, что мы постарались описать все возможные комбинации платформ и PCI Express накопителей, основной вывод из сказанного таков: совместимость PCIe SSD с материнскими платами – вопрос далеко не такой очевидный, как в случае с SATA SSD. Поэтому перед приобретением любого высокоскоростного твердотельного накопителя, работающего через PCI Express, обязательно уточните его совместимость с конкретной материнской платой на сайте производителя.

Тестовая конфигурация, инструментарий и методика тестирования

Тестирование проводится в операционной системе Microsoft Windows 8.1 Professional x64 with Update, корректно распознающей и обслуживающей современные твердотельные накопители. Это значит, что в процессе прохождения тестов, как и при обычном повседневном использовании SSD, команда TRIM поддерживается и активно задействуется. Измерение производительности выполняется с накопителями, находящимися в «использованном» состоянии, которое достигается их предварительным заполнением данными. Перед каждым тестом накопители очищаются и обслуживаются с помощью команды TRIM. Между отдельными тестами выдерживается 15-минутная пауза, отведённая для корректной отработки технологии сборки мусора. Во всех тестах, если не указано иное, используются рандомизированные несжимаемые данные.

Используемые приложения и тесты:

Iometer 1.1.0

Измерение скорости последовательного чтения и записи данных блоками по 256 Кбайт (наиболее типичный размер блока при последовательных операциях в десктопных задачах). Оценка скоростей выполняется в течение минуты, после чего вычисляется средний показатель.
Измерение скорости случайного чтения и записи блоками размером 4 Кбайт (такой размер блока используется в подавляющем большинстве реальных операций). Тест проводится дважды - без очереди запросов и с очередью запросов глубиной 4 команды (типичной для десктопных приложений, активно работающих с разветвлённой файловой системой). Блоки данных выравниваются относительно страниц флеш-памяти накопителей. Оценка скоростей выполняется в течение трёх минут, после чего вычисляется средний показатель.
Установление зависимости скоростей случайного чтения и записи при работе накопителя с 4-килобайтными блоками от глубины очереди запросов (в пределах от одной до 32 команд). Блоки данных выравниваются относительно страниц флеш-памяти накопителей. Оценка скоростей выполняется в течение трёх минут, после чего вычисляется средний показатель.
Установление зависимости скоростей случайного чтения и записи при работе накопителя с блоками разного размера. Используются блоки объёмом от 512 байт до 256 Кбайт. Глубина очереди запросов в течение теста составляет 4 команды. Блоки данных выравниваются относительно страниц флеш-памяти накопителей. Оценка скоростей выполняется в течение трёх минут, после чего вычисляется средний показатель.
Измерение производительности при смешанной многопоточной нагрузке и установление её зависимости от соотношения между операциями чтения и записи. Тест проводится дважды: для последовательных чтений и записей блоками объёмом 128 Кбайт, выполняемыми в два независимых потока и для случайных операций с блоками объёмом 4 Кбайт, которые выполняются в четыре потока. В обоих случаях соотношение между операциями чтения и записи варьируется с шагом 20 процентов. Оценка скоростей выполняется в течение трёх минут, после чего вычисляется средний показатель.
Исследование падения производительности SSD при обработке непрерывного потока операций случайной записи. Используются блоки размером 4 Кбайт и глубина очереди 32 команды. Блоки данных выравниваются относительно страниц флеш-памяти накопителей. Продолжительность теста составляет два часа, измерения моментальной скорости проводятся ежесекундно. По окончании теста дополнительно проверяется способность накопителя восстанавливать свою производительность до первоначальных величин за счёт работы технологии сборки мусора и после отработки команды TRIM.

CrystalDiskMark 5.0.2
Синтетический тест, выдающий типовые показатели производительности твердотельных накопителей, измеренные на 1-гигабайтной области диска «поверх» файловой системы. Из всего набора параметров, которые можно оценить с помощью этой утилиты, мы обращаем внимание на скорость последовательного чтения и записи, а также на производительность произвольных чтения и записи 4-килобайтными блоками без очереди запросов и с очередью глубиной 32 команды.
PCMark 8 2.0
Тест, основанный на эмулировании реальной дисковой нагрузки, которая характерна для различных популярных приложений. На тестируемом накопителе создаётся единственный раздел в файловой системе NTFS на весь доступный объём, и в PCMark 8 проводится тест Secondary Storage. В качестве результатов теста учитывается как итоговая производительность, так и скорость выполнения отдельных тестовых трасс, сформированных различными приложениями.
Тесты копирования файлов
В этом тесте измеряется скорость копирования директорий с файлами разного типа, а также скорость архивации и разархивации файлов внутри накопителя. Для копирования используется стандартное средство Windows – утилита Robocopy, при архивации и разархивации – архиватор 7-zip версии 9.22 beta. В тестах участвует три набора файлов: ISO – набор, включающий несколько образов дисков c дистрибутивами программ; Program – набор, представляющий собой предустановленный программный пакет; Work – набор рабочих файлов, включающий офисные документы, фотографии и иллюстрации, pdf-файлы и мультимедийный контент. Каждый из наборов имеет общий объём файлов 8 Гбайт.

В качестве тестовой платформы используется компьютер с материнской платой ASUS Z97-Pro, процессором Core i5-4690K со встроенным графическим ядром Intel HD Graphics 4600 и 16 Гбайт DDR3-2133 SDRAM. Диски с SATA-интерфейсом подключается к контроллеру SATA 6 Гбит/с, встроенному в чипсет материнской платы, и работают в режиме AHCI. Накопители с интерфейсом PCI Express устанавливаются в первый полноскоростной слот PCI Express 3.0 x16. Используется драйверы Intel Rapid Storage Technology (RST) 13.5.2.1000 и Intel Windows NVMe driver 1.2.0.1002.

Объём и скорость передачи данных в бенчмарках указываются в бинарных единицах (1 Кбайт = 1024 байт).

Помимо пяти главных героев этого теста – клиентских твердотельных накопителей с интерфейсом PCI Express, мы добавили к ним в компанию и самый быстрый SATA SSD – Samsung 850 PRO.

В результате, список протестированных моделей приобрёл следующий вид:

Intel SSD 750 400 Гбайт (SSDPEDMW400G4, прошивка 8EV10135);
Kingston HyperX Predator PCIe 480 Гбайт (SHPM2280P2H/480G, прошивка OC34L5TA);
OCZ RevoDrive 350 480 Гбайт (RVD350-FHPX28-480G, прошивка 2.50);
Plextor M6e Black Edition 256 Гбайт (PX-256M6e-BK, прошивка 1.05);
Samsung 850 Pro 256 Гбайт (MZ-7KE256, прошивка EXM01B6Q);
Samsung SM951 256 Гбайт (MZHPV256HDGL-00000, прошивка BXW2500Q).

Производительность

Последовательные операции чтения и записи






Новое поколение твердотельных накопителей, переведённых на шину PCI Express, должно в первую очередь выделяться высокими скоростями последовательного чтения и записи. И именно это мы видим на графике. Все PCIe SSD оказываются производительнее лучшего SATA SSD – Samsung 850 PRO. Однако даже такая простая нагрузка как последовательное чтение и запись показывает огромные различия между SSD различных производителей. Причём, вариант используемой шины PCI Express не имеет определяющего значения. Лучшую производительность здесь может выдать PCI Express 3.0 x4 накопитель Samsung SM951, а на втором месте – Kingston HyperX Predator, работающий через PCI Express 2.0 x4. Прогрессивный же NVMe-накопитель Intel SSD 750 оказался лишь на третьем месте.

Случайные операции чтения






Если же говорить о случайном чтении, то как видно из диаграмм, PCIe SSD не особенно отличаются по скорости от традиционных SATA SSD. Причём, это касается не только AHCI-накопителей, но и того продукта, который работает с протоком NVMe. Фактически лучшую, чем Samsung 850 PRO производительность при случайных операциях чтения на небольших очередях запросов могут продемонстрировать лишь три участника этого теста: Samsung SM951, Intel SSD 750 и Kingston HyperX Predator.

Несмотря на то, что операции с глубокой очередью запросов для персональных компьютеров не свойственны, мы всё же посмотрим, как зависит производительность рассматриваемого SSD от глубины очереди запросов при чтении 4-килобайтных блоков.



По графику хорошо видно, насколько решения, работающие через PCI Express 3.0 x4, могут превосходить все другие SSD. Кривые, соответствующие Samsung SM951 и Intel SSD 750 находятся существенно выше графиков других накопителей. По приведённой диаграмме можно сделать и ещё одно заключение: OCZ RevoDrive 350 – это позорно медленный твердотельный накопитель. На случайных операциях чтения он где-то вдвое отстаёт от SATA SSD, что обусловлено его RAID-архитектурой и использованием устаревших контроллеров SandForce второго поколения.

В дополнение к этому предлагаем посмотреть, как зависит скорость случайного чтения от размера блока данных:



Здесь картина немного иная. С ростом размера блоков операции начинают походить на последовательные, поэтому роль начинает играть не только архитектура и мощность контроллера SSD, но и пропускная способность используемой ими шины. На блоках больших размеров лучшую производительность обеспечивают Samsung SM951, Intel SSD 750 и Kingston HyperX Predator.

Случайные операции записи






Где-то преимущества интерфейса NVMe, обеспечивающего низкие латентности, и контроллера Intel SSD 750 с высоким уровнем параллелизма должны были проявиться. К тому же имеющийся в этом SSD вместительный DRAM-буфер позволяет организовать очень эффективное кеширование данных. И в результате Intel SSD 750 выдаёт непревзойдённую скорость произвольной записи даже в том случае, если очередь запросов имеет минимальную глубину.

Более явно увидеть, что происходит с производительностью случайной записи при увеличении глубины очереди запросов, можно на следующем графике, показывающем зависимость скорости произвольной записи 4-килобайтными блоками от глубины очереди запросов:



Масштабирование производительности Intel SSD 750 происходит до тех пор, пока глубина очереди не достигнет 8 команд. Это – типичное поведение для потребительских SSD. Однако новинка Intel отличается тем, что её скорости при случайной записи значительно выше, чем у любых других твердотельных накопителей, в том числе и у быстрейших PCIe-моделей вроде Samsung SM951 или Kingston HyperX Predator. Иными словами, при случайной нагрузке в виде записи данных Intel SSD 750 предлагает принципиально лучшую производительность, чем любые другие SSD. Иными словами, переход на использование интерфейса NVMe позволяет прокачать скорость случайной записи. И это – безусловно важная характеристика, но в первую очередь для серверных накопителей. Собственно, Intel SSD 750 как раз и является близким родственником таких моделей как Intel DC P3500, P3600 и P3700.

Следующий график отражает зависимость производительности случайных записей от размера блока данных.



По мере увеличения размеров блоков Intel SSD 750 теряет своё безоговорочное преимущество. Примерно такую же производительность начинают выдавать Samsung SM951 и Kingston HyperX Predator.


По мере удешевления твердотельные накопители перестают использоваться в качестве исключительно системных и становятся обычными рабочими дисками. В таких ситуациях на SSD поступает не только рафинированная нагрузка в виде записи или чтения, но и смешанные запросы, когда операции чтения и записи инициируются разными приложениями и должны обрабатываться одновременно. Однако работа в дуплексном режиме для современных контроллеров SSD остаётся существенной проблемой. При смешивании операций чтения и записи в одной очереди скорость большинства твердотельных накопителей потребительского уровня заметно проседает. Это стало поводом для проведения отдельного исследования, в рамках которого мы проверяем, как работают SSD при необходимости обработки последовательных операций, поступающих вперемежку. Следующая пара диаграмм демонстрирует наиболее характерный для десктопов случай, когда соотношение количества операций чтения и записи составляет 4 к 1.






При последовательной смешанной нагрузке с преобладающими операциями чтения, что характерно для обычных персональных компьютеров, наилучшую производительность выдают Samsung SM951 и Kingston HyperX Predator. Случайная смешанная нагрузка оказывается более тяжёлым испытанием для SSD и оставляет в лидерах Samsung SM951, но на второе место выдвигает Intel SSD 750. При этом Plextor M6e Black Edition, Kingston HyperX Predator и OCZ RevoDrive 350 вообще оказываются заметно хуже обычного SATA SSD.

Следующая пара графиков даёт более развёрнутую картину производительности при смешанной нагрузке, показывая зависимость скорости SSD от того, в каком соотношении приходят на него операции чтения и записи.






Всё сказанное выше хорошо подтверждается и на приведённых графиках. При смешанной нагрузке с последовательными операциями лучшее быстродействие показывает Samsung SM951, который чувствует себя как рыба в воде при любой работе с последовательными данными. При произвольных смешанных операциях ситуация немного отличается. Оба накопителя компании Samsung, и работающий через PCI Express 3.0 x4 SM951, и обычный SATA 850 PRO, в этом тесте выдают очень хорошие результаты, обходя по производительности почти все остальные SSD. Противостоять им в отдельных случаях может лишь Intel SSD 750, который благодаря системе команд NVMe отлично оптимизирован под работу со случайными записями. И когда в потоке смешанных операций доля записей возрастает до 80 процентов или выше, он резко вырывается вперёд.

Результаты в CrystalDiskMark

CrystalDiskMark - это популярное и простое тестовое приложение, работающее «поверх» файловой системы, которое позволяет получать результаты, легко повторяемые обычными пользователями. Полученные в нём показатели производительности должны дополнить подробные графики, построенные нами на основании тестов в IOMeter.












Приведённые четыре диаграммы представляют лишь теоретическую ценность, показывая пиковую производительность, не достижимую в типичных клиентских задачах. Глубины очереди запросов в 32 команды в персональных компьютерах никогда не бывает, но в специальных тестах она позволяет получить максимальные показатели производительности. И в этом случае лидирующее быстродействие с большим отрывом выдаёт Intel SSD 750, который имеет архитектуру, унаследованную от серверных накопителей, где большая глубина очереди запросов – вполне в порядке вещей.












А вот эти четыре диаграммы представляют уже практический интерес – на них отображена производительность при нагрузке, которая характерна для персональных компьютеров. И здесь лучшую производительность выдаёт уже Samsung SM951, который отстаёт от Intel SSD 750 лишь при случайных 4-килобайтных записях.

PCMark 8 2.0, реальные сценарии использования

Тестовый пакет Futuremark PCMark 8 2.0 интересен тем, что он имеет не синтетическую природу, а напротив - основывается на том, как работают реальные приложения. В процессе его прохождения воспроизводятся настоящие сценарии-трассы задействования диска в распространённых десктопных задачах, и замеряется скорость их выполнения. Текущая версия этого теста моделирует нагрузку, которая взята из реальных игровых приложений Battlefield 3 и World of Warcraft и программных пакетов компаний Abobe и Microsoft: After Effects, Illustrator, InDesign, Photoshop, Excel, PowerPoint и Word. Итоговый результат исчисляется в виде усреднённой скорости, которую показывают накопители при прохождении тестовых трасс.



Тест PCMark 8 2.0, оценивающий производительность систем хранения данных в реальных приложениях, недвусмысленно говорит нам о том, что существует лишь два PCIe-накопителя, скорость которых принципиально выше, чем у привычных моделей с SATA-интерфейсом. Это - Samsung SM951 и Intel SSD 750, которые побеждают и во многих других тестах. Другие же PCIe SSD, например, Plextor M6e Black Edition и Kingston HyperX Predator отстают от лидеров более чем в полтора раза. Ну а OCZ ReveDrive 350 демонстрирует откровенно плохое быстродействие. Он медленнее лучших PCIe SSD более чем вдвое и при этом уступает по скорости даже Samsung 850 PRO, который работает через SATA-интерфейс.

Интегральный результат PCMark 8 нужно дополнить и показателями производительности, выдаваемыми флеш-дисками при прохождении отдельных тестовых трасс, которые моделируют различные варианты реальной нагрузки. Дело в том, что при разной нагрузке флеш-приводы зачастую ведут себя немного по-разному.






























О каком бы приложении ни шла речь, в любом случае наивысшую производительность выдаёт один из SSD с интерфейсом PCI Express 3.0 x4: либо Samsung SM951, либо Intel SSD 750. Что интересно, остальные PCIe SSD в ряде случаев вообще выдают скорость лишь на уровне SATA SSD. Фактически, преимущество тех же Kingston HyperX Predator и Plextor M6e Black Edition над Samsung 850 PRO можно увидеть лишь в Adobe Photoshop, Battlefield 3 и Microsoft Word.

Копирование файлов

Имея в виду, что твердотельные накопители внедряются в персональные компьютеры всё шире и шире, мы решили добавить в нашу методику измерение производительности при обычных файловых операциях – при копировании и работе с архиваторами – которые выполняются «внутри» накопителя. Это – типичная дисковая активность, возникающая в том случае, если SSD исполняет роль не системного накопителя, а обычного диска.









В тестах копирования в лидерах оказываются всё те же Samsung SM951 и Intel SSD 750. Однако если речь идёт о больших последовательных файлах, то конкуренцию им может составить Kingston HyperX Predator. Надо сказать, что при простом копировании почти все PCIe SSD оказываются быстрее Samsung 850 PRO. Исключение лишь одно – Plextor M6e Black Edition. А OCZ RevoDrive 350, который в остальных тестах стабильно оказывался в положении безнадёжного аутсайдера, неожиданно обходит не только SATA SSD, но и самого медленного PCIe SSD.

Вторая группа тестов проведена при архивации и разархивации директории с рабочими файлами. Принципиальное отличие этого случая заключается в том, что половина операций выполняется с разрозненными файлами, а вторая половина – с одним большим файлом архива.






Похожая ситуация и при работе с архивами. Отличие лишь в том, что тут Samsung SM951 удаётся уверенно оторваться от всех конкурентов.

Работа TRIM и фоновой сборки мусора

Испытывая различные твердотельные накопители, мы всегда проверяем то, как они отрабатывают команду TRIM и способны ли они собирать мусор и восстанавливать свою производительность без поддержки со стороны операционной системы, то есть в такой ситуации, когда команда TRIM не передаётся. Такое тестирование было проведено и в этот раз. Схема этого испытания стандартна: после создания длительной непрерывной нагрузки на запись данных, которая приводит к деградации скорости записи, мы отключаем поддержку TRIM и выжидаем 15 минут, в течение которых SSD может попытаться самостоятельно восстановиться за счёт собственного алгоритма сборки мусора, но без помощи со стороны операционной системы, и замеряем скорость. Затем на накопитель принудительно подаётся команда TRIM - и после небольшой паузы скорость измеряется ещё раз.

Результаты такого тестирования приведены в следующей таблице, где для каждой протестированной модели указано, реагирует ли она на TRIM очисткой неиспользуемой части флеш-памяти и может ли она заготавливать чистые страницы флеш-памяти под будущие операции, если команда TRIM на неё не подаётся. Для накопителей, которые оказались способны осуществлять сборку мусора и без команды TRIM, мы также указали тот объём флеш-памяти, который был самостоятельно освобождён контроллером SSD под будущие операции. Для случая эксплуатации накопителя в среде без поддержки TRIM это - как раз тот объём данных, который можно будет сохранить на накопитель с высокой первоначальной скоростью после простоя.



Несмотря на то, что качественная поддержка команды TRIM стала отраслевым стандартом, некоторые производители считают допустимым продавать накопители, в которых эта команда не отрабатывается в полной мере. Такой отрицательный пример демонстрирует OCZ Revodrive 350. Формально TRIM он понимает, и даже что-то пытается сделать при получении этой команды, но о полном возвращении скорости записи к первоначальным значениям говорить не приходится. И в этом нет ничего странного: в основе Revodrive 350 лежат контроллеры SandForce, которые отличаются своей необратимой деградаций производительности. Соответственно присутствует она и в Revodrive 350.

Все же остальные PCIe SSD работают с TRIM как и их SATA-собратья. То есть, идеально: в операционных системах, которые подают эту команду на накопители, производительность остаётся на неизменно высоком уровне.

Однако мы хотим большего – качественный накопитель должен уметь проводить сборку мусора и без подачи команды TRIM. И здесь выделяется Plextor M6e Black Edition – накопитель, который способен самостоятельно освободить под предстоящие операции значительно больше флеш-памяти, чем его конкуренты. Хотя, конечно, в той или иной мере автономная сборка мусора работает у всех протестированных нами SSD, за исключением Samsung SM951. Иными словами, при обычном использовании в современных средах производительность Samsung SM951 деградировать не будет, однако в тех случаях, когда TRIM не поддерживается, применять этот SSD не рекомендуется.

Выводы

Начать подводить итоги, наверное, следует с констатации факта, что потребительские SSD с интерфейсом PCI Express – это уже не экзотика и не какие-то экспериментальные продукты, а целый рыночный сегмент, в котором играют наиболее быстродействующие твердотельные накопители для энтузиастов. Естественно, это же и означает, что с PCIe SSD уже давно нет никаких проблем: они поддерживают все функции, что есть в SATA SSD, но при этом более производительны и порой обладают некоторыми новыми интересными технологиями.

В то же время рынок клиентских PCIe SSD не столь переполнен, и войти в когорту производителей таких твердотельных накопителей пока смогли лишь компании, обладающие высоким инженерным потенциалом. Это связано с тем, что у независимых разработчиков массовых контроллеров SSD пока нет решений-конструкторов, позволяющих приступить к выпуску PCIe-накопителей с минимальными инженерными усилиями. Поэтому каждый из представленных в настоящее время на полках магазинов PCIe SSD по-своему самобытен и уникален.

В этом тестировании нам удалось собрать вместе пять самых популярных и наиболее распространённых PCIe SSD, ориентированных на эксплуатацию в составе персональных компьютеров. И по результатам знакомства с ними становится понятно, что покупателям, желающим перейти на пользование твердотельными накопителями с прогрессивным интерфейсом, никакие серьёзные муки выбора пока не грозят. В большинстве случаев выбор будет однозначным, настолько сильно отличаются по своим потребительским качествам протестированные модели.

В целом, наиболее привлекательной моделью PCIe SSD оказался Samsung SM951 . Это – блестящее решение от одного из лидеров рынка, работающее через шину PCI Express 3.0 x4, которое не только оказалось способно обеспечить наивысшую производительность в типичных общеупотребительных нагрузках, но и к тому же заметно дешевле всех остальных PCIe-накопителей.

Однако Samsung SM951 всё же не идеален. Во-первых, в нём нет никаких специальных технологий, ориентированных на повышение надёжности, а в продуктах премиального уровня их всё-таки хотелось бы иметь. Во-вторых, этот SSD достаточно тяжело найти в продаже в России – по официальным каналам он в нашу страну не поставляется. К счастью, мы можем предложить обратить внимание и на неплохую альтернативу – Intel SSD 750 . Этот SSD тоже работает через PCI Express 3.0 x4, и всего лишь немного отстаёт от Samsung SM951. Зато он является прямым родственником серверных моделей, а потому имеет высокую надёжность и работает по протоколу NVMe, что позволяет ему демонстрировать непревзойдённую скорость на операциях случайной записи.

В принципе, на фоне Samsung SM951 и Intel SSD 750 остальные SSD с интерфейсом PCIe смотрятся достаточно слабо. Однако всё-таки существуют ситуации, когда предпочесть им придётся какую-то другую модель PCIe SSD. Дело в том, что передовые накопители Samsung и Intel совместимы лишь с современными материнскими платами, построенными на интеловских чипсетах девяностой или сотой серии. В более же старых системах они способны работать лишь в роли «второго диска», а загрузка с них операционной системы окажется невозможной. Поэтому для модернизации платформ прошлых поколений ни Samsung SM951, ни Intel SSD 750 не подойдут, и выбор придётся остановить на накопителе Kingston HyperX Predator , который с одной стороны может обеспечить неплохую производительность, а с другой – гарантированно не имеет никаких проблем совместимости со старыми платформами.

Если спросить, какой интерфейс следует использовать для твердотельного накопителя с поддержкой протокола NVMe, то любой человек (вообще знающий, что такое NVMe) ответит: конечно PCIe 3.0 x4! Правда, с обоснованием у него, скорее всего, возникнут сложности. В лучшем случае получим ответ, что такие накопители поддерживают PCIe 3.0 x4, а пропускная способность интерфейса имеет значение. Иметь-то имеет, однако все разговоры об этом начались только тогда, когда некоторым накопителям на некоторых операциях стало тесно в рамках «обычного» SATA. Но ведь между его 600 МБ/с и (столь же теоретическими) 4 ГБ/с интерфейса PCIe 3.0 x4 - просто пропасть, причем заполненная массой вариантов! А вдруг и одной линии PCIe 3.0 хватит, поскольку это уже в полтора раза больше SATA600? Масла в огонь подливают производители контроллеров, грозящиеся в бюджетной продукции перейти на PCIe 3.0 x2, а также тот факт, что у многих пользователей и такого-то нет. Точнее, теоретически есть, но высвободить их можно, лишь переконфигурировав систему или даже что-то в ней поменяв, чего делать не хочется. А вот купить топовый твердотельный накопитель - хочется, но есть опасения, что пользы от этого не будет совсем никакой (даже морального удовлетворения от результатов тестовых утилит).

Но так это или нет? Иными словами, нужно ли действительно ориентироваться исключительно на поддерживаемый режим работы - или все-таки на практике можно поступиться принципами ? Именно это мы сегодня и решили проверить. Пусть проверка будет быстрой и не претендующей на исчерпывающую полноту, однако полученной информации должно оказаться достаточно (как нам кажется) хотя бы для того, чтобы задуматься... А пока вкратце ознакомимся с теорией.

PCI Express: существующие стандарты и их пропускная способность

Начнем с того, что́ представляет собой PCIe и с какой скоростью этот интерфейс работает. Часто его называют «шиной», что несколько неверно идеологически: как таковой шины, с которой соединены все устройства, нет. На деле имеется набор соединений «точка-точка» (похожий на многие другие последовательные интерфейсы) с контроллером в середине и присоединенными к нему устройствами (каждое из которых само по себе может быть и концентратором следующего уровня).

Первая версия PCI Express появилась почти 15 лет назад. Ориентация на использование внутри компьютера (нередко - и в пределах одной платы) позволила сделать стандарт скоростным: 2,5 гигатранзакции в секунду. Поскольку интерфейс последовательный и дуплексный, одна линия PCIe (x1; фактически атомарная единица) обеспечивает передачу данных на скоростях до 5 Гбит/с. Однако в каждом направлении - лишь половина от этого, т. е. 2,5 Гбит/с, причем это полная скорость интерфейса, а не «полезная»: для повышения надежности каждый байт кодируется 10 битами, так что теоретическая пропускная способность одной линии PCIe 1.x составляет примерно 250 МБ/с в каждую сторону. На практике нужно еще передавать служебную информацию, и в итоге правильнее говорить о ≈200 МБ/с передачи пользовательских данных. Что, впрочем, на тот момент времени не только покрывало потребности большинства устройств, но и обеспечивало солидный запас: достаточно вспомнить, что предшественница PCIe в сегменте массовых системных интерфейсов, а именно шина PCI, обеспечивала пропускную способность в 133 МБ/с. И даже если рассматривать не только массовую реализацию, но и все варианты PCI, то максимумом были 533 МБ/с, причем на всю шину, т. е. такая ПС делилась на все подключенные к ней устройства. Здесь же 250 МБ/с (поскольку и для PCI приводится обычно полная, а не полезная пропускная способность) на одну линию - в монопольном использовании. А для устройств, которым нужно больше, изначально была предусмотрена возможность агрегирования нескольких линий в единый интерфейс, по степеням двойки - от 2 до 32, т. е. предусмотренный стандартом вариант х32 в каждую сторону мог передавать уже до 8 ГБ/с. В персональных компьютерах х32 не использовался из-за сложности создания и разведения соответствующих контроллеров и устройств, так что максимумом стал вариант с 16 линиями. Использовался он (да и сейчас используется) в основном видеокартами, поскольку большинству устройств столько не требуется. Вообще, немалому их количеству и одной линии вполне достаточно, но некоторые применяют с успехом и х4, и х8: как раз по накопительной теме - RAID-контроллеры или SSD.

Время на месте не стояло, и около 10 лет назад появилась вторая версия PCIe. Улучшения касались не только скоростей, но и в этом отношении был сделан шаг вперед - интерфейс начал обеспечивать 5 гигатранзакций в секунду с сохранением той же схемы кодирования, т. е. пропускная способность удвоилась. И еще раз она удвоилась в 2010 году: PCIe 3.0 обеспечивает 8 (а не 10) гигатранзакций в секунду, но избыточность уменьшилась - теперь для кодирования 128 бит используется 130, а не 160, как ранее. В принципе, и версия PCIe 4.0 с очередным удвоением скоростей уже готова появиться на бумаге, но в ближайшее время в железе мы ее массово вряд ли увидим. На самом деле и PCIe 3.0 до сих пор в массе платформ используется совместно с PCIe 2.0, потому что и производительность последней для многих сфер применения просто... не нужна. А где нужна - работает старый добрый метод агрегации линий. Только каждая из них стала за прошедшие годы вчетверо быстрее, т. е. PCIe 3.0 х4 - это PCIe 1.0 x16, самый быстрый слот в компьютерах середины нулевых. Именно этот вариант поддерживают топовые контроллеры SSD, и именно его рекомендуется использовать. Понятно, что если такая возможность есть - много не мало. А если ее нет? Будут ли возникать какие-то проблемы, и если да, то какие? Вот с этим-то вопросом нам и предстоит разобраться.

Методика тестирования

Провести тесты с разными версиями стандарта PCIe несложно: практически все контроллеры позволяют использовать не только поддерживаемый ими, но и все более ранние. Вот с количеством линий - сложнее: нам хотелось непосредственно протестировать и варианты с одной-двумя линиями PCIe. Используемая нами обычно плата Asus H97-Pro Gamer на чипсете Intel H97 полного набора не поддерживает, но кроме «процессорного» слота х16 (который обычно и используется) на ней есть еще один, работающий в режимах PCIe 2.0 х2 или х4. Вот этой тройкой мы и воспользовались, добавив к ней еще и режим PCIe 2.0 «процессорного» слота, дабы оценить, есть ли разница. Все-таки в этом случае между процессором и SSD посторонних «посредников» нет, а вот при работе с «чипсетным» слотом - есть: собственно чипсет, фактически соединяющийся с процессором тем же PCIe 2.0 x4. Можно было добавить еще несколько режимов работы, но основную часть исследования мы все равно собирались провести на другой системе.

Дело в том, что мы решили воспользоваться случаем и заодно проверить одну «городскую легенду», а именно поверие о полезности использования топовых процессоров для тестирования накопителей. Вот и взяли восьмиядерный Core i7-5960X - родственника обычно применяемого в тестах Core i3-4170 (это Haswell и Haswell-E), но у которого ядер в четыре раза больше. Кроме того, обнаруженная в закромах плата Asus Sabertooth X99 нам сегодня полезна наличием слота PCIe x4, на деле способного работать как х1 или х2. В этой системе мы протестировали три варианта х4 (PCIe 1.0/2.0/3.0) от процессора и чипсетные PCIe 1.0 х1, PCIe 1.0 х2, PCIe 2.0 х1 и PCIe 2.0 х2 (во всех случаях чипсетные конфигурации отмечены на диаграммах значком (c) ). Есть ли смысл сейчас обращаться к первой версии PCIe, с учетом того, что вряд ли найдется хоть одна плата с поддержкой только этой версии стандарта, способная загрузиться с NVMe-устройства? С практической точки зрения - нет, а вот для проверки априори предполагаемого соотношения PCIe 1.1 х4 = PCIe 2.0 х2 и подобных оно нам пригодится. Если проверка покажет, что масштабируемость шины соответствует теории, значит, и неважно, что нам не удалось пока получить практически значимые способы подключения PCIe 3.0 x1/х2: первый будет идентичен как раз PCIe 1.1 х4 или PCIe 2.0 х2, а второй - PCIe 2.0 х4. А они у нас есть.

В плане ПО мы ограничились только Anvil’s Storage Utilities 1.1.0: разнообразные низкоуровневые характеристики накопителей она измеряет неплохо, а ничего другого нам и не нужно. Даже наоборот: любое влияние других компонентов системы является крайне нежелательным, так что низкоуровневая синтетика для наших целей безальтернативна.

В качестве «рабочего тела» мы использовали Patriot Hellfire емкостью 240 ГБ . Как было установлено при его тестировании, это не рекордсмен по производительности, но его скоростные характеристики вполне соответствуют результатам лучших SSD того же класса и той же емкости. Да и более медленные устройства на рынке уже есть, причем их будет становиться все больше. В принципе, можно будет повторить тесты и с чем-нибудь более быстрым, однако, как нам кажется, необходимости в этом нет - результаты предсказуемы. Но не станем забегать вперед, а посмотрим, что же у нас получилось.

Результаты тестов

Тестируя Hellfire, мы обратили внимание на то, что максимальную скорость на последовательных операциях из него можно «выжать» лишь многопоточной нагрузкой, так что это тоже надо принимать во внимание на будущее: теоретическая пропускная способность на то и теоретическая, что «реальные» данные, полученные в разных программах по разным сценариям, будут больше зависеть не от нее, а от этих самых программ и сценариев - в том случае, конечно, когда не помешают обстоятельства непреодолимой силы:) Как раз такие обстоятельства мы сейчас и наблюдаем: выше уже было сказано, что PCIe 1.x x1 - это ≈200 МБ/с, и именно это мы и видим. Две линии PCIe 1.x или одна PCIe 2.0 - вдвое быстрее, и именно это мы и видим. Четыре линии PCIe 1.x, две PCIe 2.0 или одна PCIe 3.0 - еще вдвое быстрее, что подтвердилось для первых двух вариантов, так что и третий вряд ли будет отличаться. То есть в принципе масштабируемость, как и предполагалось, идеальная: операции линейные, флэш с ними справляется хорошо, так что интерфейс имеет значение. Флэш перестает справляться хорошо на PCIe 2.0 x4 для записи (значит, подойдет и PCIe 3.0 x2). Чтение «может» больше, но последний шаг дает уже полутора-, а не двукратный (каким он потенциально должен быть) прирост. Также отметим, что заметной разницы между чипсетным и процессорным контроллером нет, да и между платформами тоже. Впрочем, LGA2011-3 немного впереди, но на самую малость.

Все ровно и красиво. Но шаблоны не рвет : максимум в этих тестах составляет лишь немногим больше 500 МБ/с, а это вполне по силам даже SATA600 или (в приложении к сегодняшнему тестированию) PCIe 1.0 х4 / PCIe 2.0 х2 / PCIe 3.0 х1 . Именно так: не стоит пугаться выпуску бюджетных контроллеров под PCIe х2 или наличию лишь такого количества линий (причем версии стандарта 2.0) в слотах М.2 на некоторых платах, когда больше-то и не нужно. Иногда и столько не нужно: максимальные результаты достигнуты при очереди в 16 команд, что для массового ПО не типично. Чаще встречается очередь с 1-4 командами, а для этого обойтись можно и одной линией самого первого PCIe и даже самым первым SATA. Впрочем, накладные расходы и прочее имеют место быть, так что быстрый интерфейс полезен. Однако излишне быстрый - разве что не вреден.

А еще в этом тесте по-разному ведут себя платформы, причем с единичной очередью команд - принципиально по-разному. «Беда» вовсе не в том, что много ядер - плохо. Они тут все равно не используются, разве что одно, и не настолько, чтоб вовсю развернулся буст-режим. Вот и имеем разницу где-то в 20% по частоте ядер и полтора раза по кэш-памяти - она в Haswell-E работает на более низкой частоте, а не синхронно с ядрами. В общем, топовая платформа может пригодиться разве что для вышибания максимума «йопсов» посредством максимально многопоточного режима с большой глубиной очереди команд. Жаль только, что с точки зрения практической работы это совсем уж сферическая синтетика в вакууме:)

На записи положение дел принципиально не изменилось - во всех смыслах. Но, что забавно, на обеих системах самым быстрым оказался режим PCIe 2.0 х4 в «процессорном» слоте. На обеих! И при многократных проверках/перепроверках. Тут уж поневоле задумаешься, нужны ли эти ваши новые стандарты или лучше вообще никуда не торопиться...

При работе с блоками разного размера теоретическая идиллия разбивается о то, что повышение скорости интерфейса все же имеет смысл. Результирующие цифры такие, что хватило бы пары линий PCIe 2.0, но реально в таком случае производительность ниже, чем у PCIe 3.0 х4, пусть и не в разы. И вообще тут бюджетная платформа топовую «забивает» в куда большей степени. А ведь как раз такого рода операции в основном в прикладном ПО и встречаются, т. е. эта диаграмма - наиболее приближенная к реальности. В итоге нет ничего удивительного, что никакого «вау-эффекта» толстые интерфейсы и модные протоколы не дают. Точнее, переходящему с механики - дадут, но ровно такой же, какой ему обеспечит любой твердотельный накопитель с любым интерфейсом.

Итого

Для облегчения восприятия картины по больнице в целом мы воспользовались выдаваемым программой баллом (суммарным - по чтению и записи), проведя его нормирование по «чипсетному» режиму PCIe 2.0 x4: на данный момент именно он является наиболее массово доступным, поскольку встречается даже на LGA1155 или платформах AMD без необходимости «обижать» видеокарту. Кроме того, он эквивалентен PCIe 3.0 x2, который готовятся освоить бюджетные контроллеры. Да и на новой платформе AMD АМ4, опять же, именно этот режим как раз можно получить без влияния на дискретную видеокарту.

Итак, что мы видим? Применение PCIe 3.0 x4 при наличии возможности является, безусловно, предпочтительным, но не необходимым: NVMe-накопителям среднего класса (в своем изначально топовом сегменте) он приносит буквально 10% дополнительной производительности. Да и то - за счет операций в общем-то не столь уж часто встречающихся на практике. Для чего же в данном случае реализован именно этот вариант? Во-первых, была такая возможность, а запас карман не тянет. Во-вторых, есть накопители и побыстрее, чем наш тестовый Patriot Hellfire. В-третьих, есть такие области деятельности, где «атипичные» для настольной системы нагрузки - как раз вполне типичные. Причем именно там наиболее критично быстродействие системы хранения данных или, по крайней мере, возможность сделать ее часть очень быстрой. Но к обычным персональным компьютерам это все не относится.

В них, как видим, и использование PCIe 2.0 x2 (или, соответственно, PCIe 3.0 х1) не приводит к драматическому снижению производительности - лишь на 15-20%. И это несмотря на то, что потенциальные возможности контроллера в этом случае мы ограничили в четыре раза! Для многих операций и такой пропускной способности достаточно. Вот одной линии PCIe 2.0 уже недостаточно, поэтому контроллерам имеет смысл поддерживать именно PCIe 3.0 - и в условиях жесткой нехватки линий в современной системе это будет работать неплохо. Кроме того, полезна ширина х4 - даже при отсутствии поддержки современных версий PCIe в системе она все равно позволит работать с нормальной скоростью (пусть и медленнее, чем могло бы потенциально), если найдется более-менее широкий слот.

В принципе, большое количество сценариев, в которых узким местом оказывается собственно флэш-память (да, это возможно и присуще не только механике), приводит к тому, что четыре линии третьей версии PCIe на этом накопителе обгоняют одну первой примерно в 3,5 раза - теоретическая же пропускная способность этих двух случаев различается в 16 раз. Из чего, разумеется, не следует, что нужно спешно бежать осваивать совсем медленные интерфейсы - их время ушло безвозвратно. Просто многие возможности быстрых интерфейсов могут быть реализованы лишь в будущем. Или в условиях, с которыми обычный пользователь обычного компьютера никогда в жизни непосредственно не столкнется (за исключением любителей меряться известно чем). Собственно, и всё.

Физический уровень интерфейса допускает как электрическую, так и оптическую реализацию. Базовое соединение электрического интерфейса (1x) состоит из двух дифференциальных низковольтных сигнальных пар — передающей (сигналы PETp0, PETn0) и принимающей (PERp0, PERn0). В интерфейсе применена развязка передатчиков и приемников по постоянному току, что обеспечивает совместимость компонентов независимо от технологии изготовления компонентов и снимает некоторые проблемы передачи сигналов. Для передачи используется самосинхронизирующееся кодирование, что позволяет достигать высоких скоростей передачи. Базовая скорость — 2,5 Гбит/с «сырых» данных (после кодирования 8B/10B) в каждую сторону, в перспективе планируются и более высокие скорости. Для масштабирования пропускной способности возможно агрегирование сигнальных линий (lanes, сигнальных пар в электрическом интерфейсе), по одинаковому числу в обоих направлениях. Спецификация рассматривает варианты соединений из 1, 2, 4, 8, 12, 16 и 32 линий (обозначаются как x1, x2, x4, x8, x12, x16 и x32); передаваемые данные между ними распределяются побайтно. В каждой из линий самосинхронизация выплняется независимо, так что явление переноса (бич параллельных интерфейсов) отсутствует. Таким образом достижима скорость до 32×2,5 = 80 Гбит/с, что примерно соответствует пиковой скорости 8 Гбайт/с. Во время аппаратной инициализации в каждом соединении согласуется число линий и скорость передачи; согласование выполняется на низком уровне без какого-либо программного участия. Согласованные параметры соединения действуют на все время последующей работы.

Обеспечение «горячего» подключение на физическом уровне PCI Express не требует каких-либо дополнительных аппаратных затрат, поскольку двухточечное соединение не затрагивает «лишних» участников. Безопасная коммутация сигналов не требуется, возможности подключаемого устройства никак не влияют на режимы работы остальных устройств.

Малое число сигнальных контактов интерфейса дает большую свободу в выборе конструктивных реализаций PCI Express :

  • соединение компонентов в пределах платы;
  • слоты и карты расширения в конструктивах PC/AT и ATX;
  • внутренние и внешние карты расширения мобильных ПК;
  • малогабаритные модули ввода/вывода для серверов и коммуникационной аппаратуры;
  • модули для промышленных компьютеров;
  • разъемное подключение «дочерних» карт (mezannine interface);
  • кабельные соединения блоков.

Для карт расширения в конструктивах PC/AT и ATX предусматриваются разные модификации разъема-слота PCI Express, отличающиеся числом пар сигнальных линий (x1, x4, x8, x16) и, соответственно, размером (см. рисунок ниже). При этом в слоты большего размера можно устанавливать карты с разъемом того же размера или меньшего (это называется Up-plugging). Однако противоположный вариант (Downplugging) — большую карту в меньший слот — механически невозможен (в PCI/PCI-X это возможно). Как было показано выше, самый маленький вариант PCI Express обеспечивает пропускную способность на уровне стандартной шины PCI.

Назначение контактов слотов PCI Express приведено в таблице ниже.

Набор сигналов интерфейса PCI Express невелик:

  • PETp0, PETn0… PETp15, PETn15 — выходы передатчиков сигнальных пар 0…15;
  • PERp0, PERn0… PERp15, PERn15 — входы приемников;
  • REFCLK+ и REFCLK — сигналы опорной частоты 100 МГц;
  • PERST# — сигнал сброса карты;
  • WAKE# — сигнал «пробуждения» (от карты);
  • PRSNT1#, PRSNT2# — сигналы обнаружения подключения-отключения карты для системы горячего подключения. На карте эти цепи соединяются между собой, причем для PRSNT2# выбирается контакт с самым большим номером. Это позволяет точнее отслеживать моменты подключения-отключения (в случае наклона карты). Для определения числа линий подключенной карты данные линии не используются — разрядность линий определяется автоматически при установлении соединения (в процедуре тренировки).

Дополнительно на слоте имеются необязательные сигналы шины SMBus (SMB_CLK и SMB_DATA) и интерфейса JTAG (TCLK, TDI, TDO, TMS, TRST#).

Питание на карты подается по следующим шинам:

  • +3,3V — основное питание +3 В при токе до 9 А;
  • +12V — основное питание +12 В при токе до 0,5/2,1/4,4А для слотов x1/x4, x8/x16 соответственно;
  • +3,3Vaux — дополнительное питание, ток до 375 мА в системах, способных к пробуждению по сигналу от карты и до 20 мА в непробуждаемых системах.

Таблица. Разъемы PCI Express

Ряд B Ряд A
1 +12V PRSNT1#
2 +12V +12V
3 Резерв +12V
4 GND GND
5 SMB_CLK TCK
6 SMB_DATA TDI
7 GND TDO
8 +3.3 V TMS
9 TRST# +3.3 V
10 +3.3 Vaux +3.3 V
11 WAKE# PERST#
КЛЮЧ
12 Резерв GND
13 GND REFCLK+
14 PETp0 REFCLK-
15 PETn0 GND
16 GND PERp0
17 PRSNT2# PERn0
18 GND GND
Конец x1-коннектора
19 PETp1 Резерв
20 PETn1 GND
21 GND PERp1
22 GND PERn1
23 PETp2 GND
24 PETn2 GND
25 GND PERp2
26 GND PERn2
27 PETp2 GND
28 PETn2 GND
29 GND PERp3
30 Резерв PERn3
31 PRSNT2# GND
32 GND Резерв
Конец x4-коннектора
33 PETp4 Резерв
34 PETn4 GND
35 GND PERp4
36 GND PERn4
37 PETp5 GND
38 PETn5 GND
39 GND PERp5
40 GND PERn5
41 PETp6 GND
42 PETn6 GND
43 GND PERp6
44 GND PERn6
45 PETp7 GND
46 PETn7 GND
47 GND PERp7
48 PRSNT2# PERn7
49 GND GND
Конец x8-коннектора
50 PETp8 Резерв
51 PETn8 GND
52 GND PERp8
53 GND PERn8
54 PETp9 GND
..... ..... .....
79 PETn15 GND
80 GND PERp15
81 PRSNT2# PERn15
82 GND GND
Конец x16-коннектора

Для мобильных компьютеров PCMCIA ввела конструктив ExpressCard (см. следующий рисунок), для которого на системный разъем выводится два интерфейса: PCI Express (1x) и USB 2.0. Модули ExpressCard компактнее прежних карт PCMCIA (PC Card и CardBus); предлагается две модификации, различающиеся по ширине: ExpressCard/34 (34×75×5 мм) и ExpressCard/54 (54×75×5 мм). Толщина модулей всего 5 мм, но, если требуется, то более длинные модули могут иметь утолщения в части, выходящие за габариты корпуса компьютера (за пределами 75 мм от края разъема). Как и прежние карты PCIMCIA, карты ExpressCard доступны пользователям и поддерживают «горячее» подключение.

Для внутренних карт расширения блокнотных ПК введен конструктив Mini PCI Express (см. рисунок ниже), формат которого происходит от Mini PCI Type IIIA. Благодаря уменьшению числа контактов ширина карты уменьшена до 30 мм, так что на месте одной карты Mini PCI можно разместить пару карт Mini PCI Express. На разъем карты (см. таблицу ниже) кроме PCI Express выведены интерфейсы последовательных шин USB 2.0 (USB_D+ и USB_D-) и SMBus (SMB_CLK и SMB_DATA), питание +3,3 В (750 мА основное и 250 мА дополнительное) и +1,5 В (375 мА). Собственно интерфейс PCI Express (x1) занимает всего 6 контактов (выходы передатчика PETp0 и PETn0, входы приемника PERp0 и PERn0, а также сигналы опорной частоты 100 МГц REFCLK+ и REFCLK-. Сигнал PERST# — сброс карты, сигнал WAKE# — «пробуждение» (от карты). Сигналы LED_Wxxx# служат для управления светодиодными индикаторами состояния.

Таблица. Разъемы Mini PCI Express

Цепь Цепь
1 WAKE# 2 3.3 V
3 Резерв 4 GND
5 Резерв 6 1.5 V
7 Резерв 8 Резерв
9 GND 10 Резерв
11 REFCLK+ 12 Резерв
13 REFCLK- 14 Резерв
15 GND 16 Резерв
Ключ
17 Резерв 18 GND
19 Резерв 20 Резерв
21 GND 22 PERST#
23 PERn0 24 +3.3 V
25 PERp0 26 GND
27 GND 28 +1.5 V
29 GND 30 SMB_CLK
31 PETn0 32 SMB_DATA
33 PETp0 34 GND
35 GND 36 USB_D-
37 Резерв 38 USB_D+
39 Резерв 40 GND
41 Резерв 42 LED_WWAN#
43 Резерв 44 LED_WLAN#
45 Резерв 46 LED_WPAN#
47 Резерв 48 +1.5 V
49 Резерв 50 GND
51 Резерв 52 +3.3 V

С интерфейсом PCI Express удобно компонуются модули ввода/вывода и сетевых интерфейсов для серверов и коммуникационных устройств стоечного исполнения. Такие модули могут быть достаточно компактными (высота 2U не вызывает проблем размещения разъема), при этом производительности интерфейса достаточно даже для таких критичных модулей, как Fibre Channel, Gigabit Ethernet (GbE), 10GbE.

Интерфейс PCI Express принимается и для промышленных компьютеров, для чего имеются спецификации PICMG 3.4 (малогабаритные конструктивы для x1, x2 и x4), а также конструктивы в формате Compact PCI.

Интерфейс PCI Express существует и в кабельном исполнении для кабельных соединений блоков, находящихся на небольшом удалении друг от друга. Так, например, по PCI Express можно подключать док-станции к блокнотным ПК. Возможность вывода интерфейса системного уровня за пределы корпуса компьютера из предшественников PCI Express поддерживала только шина ISA, и то только при низких скоростях обмена (на частотах до 5 МГц). Из новых последовательных интерфейсов системного уровня эта возможность имеется и в InfiniBand. Наличие кабельного варианта высокопроизводительного интерфейса системного уровня может позволить отойти от традиционной компоновки компьютера, при которой в системном блоке концентрируются все компоненты, требующие интенсивного обмена с ядром компьютера.

Алексей Борзенко ,
к.т.н., доцент РРТА

Интерфейс PCI Express (известный прежде под названием 3GIO) основан на открытых стандартах и выступает как наследник PCI и его вариантов для систем ввода-вывода серверов и клиентских устройств. В отличие от PCI и PCI-X, основанных на 32- и 64-разрядной параллельной шине, PCI Express использует высокоскоростную технологию последовательного соединения, похожую на ту, что используется в Gigabit Ethernet, Serial ATA (SATA) и Serial Attached SCSI (SAS). PCI Express отражает общую для компьютерной индустрии тенденцию замены устаревших параллельных общих шин на высокоскоростные последовательные соединения типа "точка-точка" (point-to-point).

Новая технология шины обеспечивает скорость передачи, которая будет достаточной с учетом развития процессоров и подсистем ввода-вывода, по крайней мере, в течение следующих 10 лет.

По сравнению с PCI технология PCI Express имеет следующие преимущества:

  • высокая пропускная способность - в первой версии теоретическая пиковая пропускная способность составит 5-80 Гбит/с, в зависимости от реализации;
  • последовательное соединение, обеспечивающее масштабирование производительности;
  • отдельное соединение "точка-точка" для каждого устройства вместо общей шины PCI;
  • малые задержки для серверной архитектуры;
  • меньший размер разъемов и упрощенное проектирование систем;
  • расширенные функции.

В течение следующего десятилетия интерфейс PCI Express постепенно заменит параллельные шины PCI, PCI-X и AGP. Сначала он вытеснит шины, которые требуют дополнительной производительности и функций. Например, первоначально PCI Express будет применяться как замена шины передачи графических данных AGP 8X в клиентских системах, обеспечивая высокую полосу пропускания и поддержку мультимедийного трафика. Он будет сосуществовать с шиной PCI-X и постепенно вытеснять ее в серверных системах.

Шина PCI

Шина PCI, появившаяся в 1992 г., стала основой системы ввода-вывода практически для всех компьютерных платформ. Первоначальная 33-МГц, 32-разрядная реализация обеспечивала теоретически возможную пиковую производительность 133 Мбайт/с. В последующие годы архитектура платформы развивалась, различные функции перекладывались на варианты PCI с более высокой пропускной способностью (табл. 1), включая AGP и PCI-X.

Таблица 1. Пропускная способность шин PCI, PCI-X и AGP

Шина и частота Пиковая пропускная способность, Мбайт/с
в 32-разрядном режиме в 64-разрядном режиме
PCI 33 МГц 133 266
PCI 66 МГц 266 532
PCI-X 100 МГц Не поддерживает 800
PCI-X 133 МГц Не поддерживает 1 Гбайт/с
AGP 8X 2,1 Гбайт/с Не поддерживает

Если внимательно изучить применяемую в PCI технологию передачи сигналов, станет ясно, что увеличить производительность этой многоточечной параллельной шины уже невозможно. Дело в том, что для шины PCI трудно реализовать наращивание частоты или уменьшение напряжения. Кроме того, она не поддерживает такие функции, как расширенное управление энергопотреблением, замена и подключение в горячем режиме периферийных устройств и функции качества сервиса - QoS (а проще говоря, доступности) для гарантированной полосы пропускания операций в реальном времени. Наконец, вся имеющаяся полоса пропускания шины PCI не поддерживает одновременную передачу данных в обоих направлениях. Многие сети передачи данных обеспечивают параллельный трафик, благодаря чему задержка при передаче сообщений сводится к минимуму.

Клиентские системы

Первый вариант шины PCI был разработан для поддержки 2D-графики, высокопроизводительных жестких дисков и локальных сетей. Вскоре после появления PCI выросшие требования к пропускной способности графической подсистемы 3D превысили возможности 32-разрядной шины PCI с частотой 33 МГц. Чтобы решить эту проблему, корпорация Intel (http://www.intel.com) вместе с несколькими производителями графических плат разработали спецификацию AGP, описывающую выделенную высокоскоростную шину для работы с графикой. Шина AGP освободила систему PCI от передачи графики, что позволило задействовать ее пропускную способность для других операций передачи данных и ввода-вывода. Кроме того, впоследствии Intel добавила выделенные каналы USB 2.0 и Serial ATA к южному мосту своих наборов микросхем (НМС), что дополнительно уменьшило нагрузку ввода-вывода на шину PCI. На рис. 1 показана внутренняя архитектура типичной клиентской системы ПК и пропускная способность шины ввода-вывода и графики.

Узкие места клиентских систем

Есть несколько шин клиентской системы, способных ограничивать производительность из-за постоянного совершенствования центрального процессора, памяти и устройств ввода-вывода: шина PCI, шина AGP и канал между северным и южным мостами.

PCI Bus. Шина PCI обеспечивает скорость передачи до 133 Мбайт/с для подключенных устройств ввода-вывода. Ряд устройств ввода-вывода способны загрузить значительную часть этой полосы пропускания, так что если подключить несколько таких устройств, то общая шина PCI не сможет справиться с трафиком.

На рис. 2 показаны требования к полосе пропускания разных сетевых протоколов, видеоприложений и внешних устройств, которые обслуживает шина PCI. Как видно, многоточечная общая шина PCI с трудом способна работать с современными устройствами. Проблема обостряется с появлением новых периферийных устройств, использующих еще более высокую скорость передачи.

Например, для Gigabit Ethernet нужна полоса пропускания 125 Мбайт/с, иными словами, этот сетевой протокол фактически полностью загружает шину PCI 133 Мбайт/с. У IEEE 1394b максимальная полоса пропускания составляет 100 Мбайт/с, и он также полностью загружает стандартную PCI-шину.

AGP. В последнее десятилетие требования к производительности видео удваивались каждые два года. За этот период шина передачи графики перешла от PCI к AGP, затем от AGP к AGP 2X, AGP 4X и, наконец, к сегодняшней AGP 8X.

AGP 8X работает на скорости 2,134 Гбайт/с. Несмотря на такую полосу пропускания, постепенный рост требований к производительности шины AGP создает значительные проблемы при проектировании плат и повышает стоимость соединений. Как и в случае шины PCI, расширение возможностей шины AGP становится все сложнее и дороже по мере роста частот.

Канал между северным и южным мостами. Нагрузка на шину PCI влияет и на связь между северным и южным мостами, особенно при использовании дисков SATA и устройств USB. В будущем здесь потребуется канал с большей полосой пропускания.

Серверные системы

В серверах первоначальная 32-разрядная, 33-МГц шина PCI была расширена до 64-разрядной 66-МГц с пропускной способностью 532 Мбайт/с. Частота 64-разрядной шины была увеличена до 100 и до 133 МГц - этот вариант называется PCI-X. Такая шина соединяет НМС серверной системы (или двухпроцессорной рабочей станции класса high-end) со слотами расширения, контроллерами Gigabit Ethernet и Ultra320 SCSI, интегрированными на системной плате. 64-разрядная шина PCI-X с частотой 133 МГц обеспечивает пиковую полосу пропускания 1 Гбайт/с между НМС системы и устройством ввода-вывода. Сейчас этого достаточно для большинства операций ввода-вывода, включая протоколы Gigabit Ethernet, Ultra320 SCSI и Fibre Channel 2 Гбит/с. Однако PCI-X, как и PCI, - это общая шина с присущими ей недостатками.

Группа PCI Special Interest Group (PCI SIG, http://www.psisig.com) разработала спецификацию PCI-X 2.0, описывающую 64-разрядную, 266-МГц шину PCI-X, у которой скорость передачи вдвое больше, чем у 133-МГц PCI-X. Тем не менее при использовании расширенного варианта параллельной шины PCI-X возникают серьезные проблемы с проектированием. Разъемы для нее громоздкие и дорогие, а строгие требования к проектированию значительно повышают стоимость системных плат по мере роста частот. Кроме того, на высоких частотах допускается подключение к шине PCI-X 2.0 только одного устройства ввода-вывода в конфигурации "точка-точка".

Узкие места серверных систем

На рис. 3 показаны внутренние системные межсоединения в типичной двухпроцессорной серверной системе. В этой архитектуре расширение полосы пропускания обеспечивается с помощью фирменного интерфейса между микросхемами северного моста и моста PCI-X. Несколько шин PCI-X подключаются к высокоскоростным слотам расширения, 10-Гбит Ethernet и дискам SAS/SATA. Но эта архитектура имеет несколько недостатков. Специальные кристаллы мостов PCI-X соединяют несколько параллельных шин PCI-X со специальным последовательным межсоединением НМС. Такой подход связан с высокими затратами, неэффективен и приводит к задержке передачи между устройствами ввода-вывода и северным мостом. Например, этот подход предусматривает соединение последовательной фабрики 10 Гбит/с с 64-разрядной параллельной шиной, которая, в свою очередь, подключается через фирменный кристалл моста PCI-X к последовательному межсоединению в северном мосте.

Рис. 3. Современная двухпроцессорная архитектура процессора.

Кроме того, технология внешнего ввода-вывода в серверах нового поколения требует намного более широкой полосы пропускания, чем способна обеспечить 133-МГц шина PCI-X. Эти технологии включают такие фабрики, как 10-Гбит Ethernet, Fibre Channel 10 Гбит/с и 4x Infiniband, а также будущие высокоскоростные интерфейсы жестких дисков - SATA и SAS 3 Гбит/с. В случае фабрики 10 Гбит/с каждый порт с пропускной способностью 10 Гбит/с может передавать данные в обоих направлениях с пиковой скоростью 2 Гбайт/с, а 133-МГц шина PCI-X обеспечивает максимальную скорость 1 Гбайт/с в одном направлении в один момент времени. Это означает, что 133-МГц шина PCI-X способна обработать пиковую пропускную способность таких фабрик не более чем на 50%.

Хотя PCI-X 2.0 с частотой 266 МГц удвоит ширину пиковой полосы пропускания PCI-X - до 2 Гбайт/с, ее все же будет недостаточно для суммарных 4 Гбайт/с, которые нужны двухпортовому контроллеру фабрики 10 Гбит/с. Ясно, что клиентским системам и серверам требуется замена параллельной шины PCI и ее вариантов.

PCI Express

PCI Express предоставляет масштабируемую высокоскоростную последовательную шину ввода-вывода. Многоуровневая архитектура PCI Express поддерживает существующие приложения PCI и драйверы за счет обратной совместимости с существующей моделью PCI. В частности, архитектура PCI Express определяет высокопроизводительную масштабируемую последовательную шину "точка-точка". Канал PCI Express состоит из двух однонаправленных каналов, каждый из которых реализован как пара передачи и пара приема для одновременной передачи в обоих направлениях. Каждая пара состоит из двух низковольтных пар дифференциальных сигналов. Таймер синхронизации встроен в каждую пару и использует схему кодировки для синхронизации 8b/10b, позволяя достичь высокой скорости передачи данных. На рис. 4 представлены каналы PCI в сравнении с PCI Express.


Рис. 4. PCI в сравнении с PCI Express.

Многоуровневая архитектура PCI Express

Уровень Конфигурация/ОС определяет стандартный механизм (в соответствии со спецификацией PCI Plug-and-Play) инициализации устройств, их нумерацию и конфигурирование. Этот уровень общается с уровнем ПО, инициирующего передачу данных между периферийными устройствами или получение данных от подключенной периферии. Интерфейс PCI Express разрабатывался как совместимый с существующими ОС, но для поддержки мощных функций технологии потребуются ОС будущего времени.

Уровень Программное обеспечение генерирует запросы чтения и записи к периферийным устройствам. PCI Express обеспечивает инициализацию и совместимость с ПО PCI. Как и в PCI, модель инициализации PCI Express позволяет ОС обнаруживать новые аппаратные устройства и распределять ресурсы системы. PCI Express сохраняет пространство конфигурирования PCI и программирование устройств ввода-вывода, и все ОС будут загружаться, не требуя модификации, в системах с использованием PCI Express. Сохраняется и модель выполнения ПО PCI, что позволяет запускать существующее ПО без всякой модификации.

Уровень Транзакций читает и записывает запросы от уровня ПО к канальному уровню с помощью протокола на основе пакетов и обеспечивает соответствие ответных пакетов запросам ПО. Этот уровень поддерживает 32-разрядную и расширенную 64-разрядную адресацию памяти, адресное пространство PCI памяти, ввода-вывода и конфигурации, а также новое пространство сообщений для таких сообщений, как прерывания и сбросы.

Канальный уровень добавляет последовательность пакетов и обнаружение ошибок на основе циклических кодов избыточности (CRC) к пакетам данных, создавая надежный механизм передачи данных между системным НМС и контроллером ввода-вывода.

Физический уровень базируется на двойных однонаправленных каналах PCI Express. Это обеспечивает гибкость и позволяет использовать разные технологии и частоты. Благодаря такому подходу первоначальную кремниевую технологию можно будет со временем заменить инновациями, которые сохранят обратную совместимость. Например, для повышения скорости передачи данных можно использовать оптоволоконную технологию.

Механический уровень определяет форм-факторы периферийных устройств.

Уровни архитектуры PCI Express

Ширину пропускания канала PCI Express можно масштабировать за счет добавления сигнальных пар для формирования нескольких линий между двумя устройствами. Спецификация поддерживает ширину линии x1, x4, x8 и x16 и соответственно расщепляет байты данных по линиям. После того, как два агента на обоих концах канала PCI Express договорятся о ширине линии и частоте передачи, байты данных передаются расщепленными по линиям с кодировкой.

Базовый канал x1 имеет пиковую "сырую" полосу пропускания на уровне 2,5 Гбит/с. Поскольку шина работает в двух направлениях (данные могут одновременно передаваться в обоих направлениях), эффективная "сырая" скорость передачи равна 5 Гбит/с. В табл. 2 приведены скорости передачи данных с кодированием и без кодирования при реализации линий x1, x4, x8 и x16, которые определены в первой версии PCI Express.

Таблица 2. Полоса пропускания PCI Express

В будущих реализациях PCI Express частота передачи данных по каналу еще больше увеличится. Например, после появления второго поколения PCI Express частота передачи вырастет не менее чем вдвое. Благодаря архитектуре "точка-точка" вся полоса пропускания каждой шины PCI Express выделяется устройству на конце канала. Несколько устройств PCI могут работать одновременно, не мешая друг другу.

PCI Express, в отличие от PCI, имеет минимальные сигналы боковой полосы, а временные метки и информация об адресе встроены в данные. Именно поэтому данная технология обеспечивает высокую полосу пропускания на один контакт разъема ввода-вывода по сравнению с PCI (рис. 5). В результате соединители становятся более эффективными, компактными и дешевыми.

Технология PCI Express надежно обеспечивает более высокие скорости передачи данных за счет низковольтных дифференциальных сигналов. При таком подходе сигнал идет от источника к получателю по двум линиям: по одной посылается "позитивный" образ, по другой - "негативный", или "перевернутый" образ сигнала. Из-за строгих правил маршрутизации шум, влияющий на одну линию, влияет и на другую. Приемник получает оба сигнала, инвертирует негативную версию обратно в позитивную и суммирует два собранных сигнала, в результате шумы эффективно удаляются.

В первоначальной спецификации PCI Express определены графические платы мощностью до 75 Вт. Сейчас разрабатывается новая спецификация графики PCI Express для карт мощностью до 150 Вт. Эти характеристики соответствуют требованиям графических адаптеров, для которых сейчас предел мощности составляет 41 Вт для массовых карт AGP и 110 Вт для карт AGP Pro 110.

Полоса пропускания PCI Express

Полоса пропускания PCI Express обычно обозначается как "кодированная" полоса пропускания. PCI Express использует кодировку 8b/10b, которая транслирует 8-разрядные данные в 10-битную последовательность передаваемых символов. Этот подход улучшает физический сигнал, что облегчает синхронизацию битов, упрощает проектирование приемников и передатчиков, совершенствует обнаружение ошибок и позволяет отличить управляющие символы от символов данных.

Ширина "кодированной" полосы пропускания базовой линии x1 PCI Express равна 5 Гбит/с. Однако более точную цифру дает полоса пропускания "без кодировки", ширина которой составляет 80% "кодированной", т. е. 4 Гбит/с. В табл. 2 приведена полоса пропускания PCI Express с кодировкой и без нее.

Расширенные функции PCI Express

В PCI Express предусмотрены расширенные функции, которые будут постепенно реализовываться по мере их поддержки ОС и устройствами, а также по мере их использования приложениями. В список этих функций входят:

  • расширенное управление энергопотреблением;
  • поддержка трафика данных в реальном времени;
  • горячая замена;
  • целостность данных и обработка ошибок.

Расширенное управление энергопотреблением

Управление в PCI Express позволяет уменьшить энергопотребление, если шина не активна (т. е. данные не пересылаются между компонентами и периферийными устройствами). Интерфейс PCI Express должен быть активным все время, чтобы передатчик и получатель работали синхронно. Для этого, если нет данных для передачи, непрерывно посылаются пустые символы, получатель декодирует их и отбрасывает. Этот процесс потребляет дополнительную энергию, что, в частности, уменьшает время работы от батарей ноутбуков и карманных компьютеров.

Для решения этой проблемы спецификация PCI Express определяет два состояния канала с низким энергопотреблением и протокол Active-State Power Management (ASPM). Когда канал PCI Express не используется, он может перейти в одно из двух состояний с низким энергопотреблением. Эти состояния экономят энергию, но требуют времени на восстановление для ресинхронизации передатчика и получателя, когда нужно передать данные. Чем дольше время восстановления (или запаздывания), тем ниже энергопотребление.

Поддержка трафика реального времени

PCI Express, в отличие от PCI, поддерживает изохронную (или зависимую от времени) передачу данных и разные уровни QoS. Эти функции реализованы с помощью "виртуальных каналов", которые гарантируют, что конкретные пакеты данных прибудут по своему конечному адресу в определенный момент времени. PCI Express поддерживает несколько изохронных виртуальных каналов (каждый с независимым сеансом связи) на одну линию. Все эти каналы могут иметь разную доступность. Данное законченное решение предназначено для приложений, требующих доставки данных в реальном времени (такова, например, работа с аудио и видео в реальном времени).

Горячая замена

Системы на базе PCI не имеют встроенной поддержки горячей замены плат ввода-вывода. Уже после выпуска стандарта PCI как дополнение к нему была разработана функция горячей замены серверных карт и PC Card с ограниченными возможностями. Эти решения рассчитаны на растущие требования серверов и портативных компьютеров. Во-первых, часто трудно или невозможно запланировать отключение сервера для замены или установки периферийных карт. Возможность горячей замены устройств ввода-вывода сводит к минимуму простои. Во-вторых, пользователям ноутбуков нужно заменять в горячем режиме карты, обеспечивающие такие функции ввода-вывода, как мобильный диск и работа в сети.

В PCI Express реализована оригинальная поддержка для горячей замены периферии ввода-вывода. Единая программная модель может использоваться для всех форм-факторов PCI Express.

Целостность данных и обработка ошибок

Интерфейс PCI Express поддерживает целостность данных на уровне каналов для всех типов пакетов транзакций и каналов данных. Благодаря этому обеспечивается целостность данных при их передаче для приложений высокой доступности, особенно для выполняющихся на серверных системах. PCI Express также поддерживает обработку ошибок PCI и использует усовершенствованный механизм оповещения об ошибках и их обработки, что расширяет возможности решений для изоляции сбоев и восстановления работоспособности.

Форм-факторы PCI Express

Разработаны различные форм-факторы PCI Express, предназначенные для клиентских систем, серверов и портативных компьютеров. В их числе стандартные и низкопрофильные карты - для настольных ПК, рабочих станций и серверов, Mini Card - для портативных компьютеров, ExpressCard - для портативных и настольных ПК, а также модули Server I/O Module (SIOM).

Стандартные и низкопрофильные карты

Выпускаемые сейчас стандартные и низкопрофильные карты PCI используются на различных платформах, включая серверы, рабочие станции и настольные ПК. PCI Express также определяет стандартные и низкопрофильные карты, которые могут заменить устаревшие карты PCI и сосуществовать с ними. Эти карты имеют те же размеры, что и карты PCI, и оборудованы задними скобами для внешних кабельных соединений.

Карты PCI и PCI Express отличаются соединителями ввода-вывода - разъем x1 PCI Express имеет 36 контактов, а у стандартного соединителя PCI их 120.

Коннектор x1 PCI Express намного меньше, чем у карты PCI Card. Рядом с разъемом PCI Express расположена маленькая заглушка, которая не позволяет вставить его в слот PCI. Стандартные и низкопрофильные форм-факторы также поддерживают реализации x4, x8 и x16. На рис. 6 показаны размеры соединителей PCI в сравнении с разъемами PCI, AGP 8X и PCI-X, которые они заменят на системной плате.

В табл. 3 приведены требования к совместимости для стандартных и низкопрофильных карт PCI Express. Карта x1 может использоваться во всех четырех слотах системной платы: x1, x4, x8 и x16. Когда карта x1 вставляется в слот с более высокой скоростью, канальный уровень снижает скорость канала до x1.

Таблица 3. Совместимость карт PCI Express Card

Реализация PCI Express Слот x1 Слот x4 Слот x8 Слот x16
Карта x1 Нужна Нужна Нужна Нужна
Карта x4 Нет Нужна Допускается Допускается
Карта x8 Нет Допускается* Нужна Допускается
Карта x16 Нет Нет Нет Нужна
*Эта реализация будет иметь коннектор x8 на слоте x4, т. е. в такой слот можно вставлять карты x8,
которые, однако, будут работать на скорости x4.

Переход на карты PCI Express

Платы клиентских систем будут постепенно переходить от соединителей PCI к соединителям x1 PCI Express. Рабочие станции соответственно будут переходить от PCI на разъемы x1 PCI Express и от PCI-X - к x4 PCI Express. Соединитель AGP 8X будет заменяться разъемом x16 PCI Express. В отличие от AGP, он может использоваться для других карт PCI Express, если не требуется графическая карта PCI Express.

Серверы будут постепенно переходить от соединителей PCI-X в основном на x4 и x8. Использование в серверных системах комбинации слотов PCI Express и PCI/PCI-X позволит покупателям адаптироваться к новой технологии при сохранении поддержки унаследованных систем.

Рассмотрим пример типичной современной клиентской системы и переходной системной платы PCI Express. Системная плата PCI содержит пять стандартных слотов PCI и один слот AGP. Системная плата PCI Express также имеет шесть слотов ввода-вывода, но только три из них - слоты PCI, а еще два - это соединители x1 PCI Express и один - разъем x16 PCI Express, заменяющий слот AGP 8X. Соединители PCI Express на системной плате иногда делают черными, чтобы отличить их от белых слотов PCI и коричневых AGP.

Конечно, первыми устройствами, которые перейдут на карты PCI Express, станут платы с повышенными требованиями к полосе пропускания. В клиентских системах это графические адаптеры, адаптеры стандарта IEEE 1394, Gigabit Ethernet и ТВ-тюнеры, а в серверных системах - карты Ultra320 SCSI RAID, HBA-адаптеры Fibre Channel и карты Gigabit Ethernet и 10 Gigabit Ethernet. Ожидается, что стоимость этих плат будет сравнима с ценой аналогичных PCI-X, а в некоторых случаях даже меньше. Другие карты также постепенно перейдут на PCI Express, но может потребоваться несколько лет, прежде чем недорогие карты, работающие с низкой пропускной способностью (например, модемы), начнут использовать эту технологию. Таким образом, как это было и с переходом от ISA к шине PCI, еще долгие годы PCI и PCI Express будут сосуществовать.

PCI Express Mini Card

PCI Express Mini Card заменят Mini PCI, представляющие собой маленькую внутреннюю плату, по своей функциональности аналогичную картам PCI для настольных ПК. Карты Mini PCI используются в основном для реализации сетевых функций в портативных компьютерах, выпускаемых серийно или на заказ. По размерам PCI Express Mini Card вдвое меньше Mini PCI, что позволяет проектировщикам ноутбуков предусмотреть место для одной или двух карт в зависимости от размера компьютера.

PCI Express Mini Card может использовать PCI Express и/или USB 2.0. Разъем PCI Express Mini Card на системной плате должен поддерживать как канал x1 PCI Express, так и USB 2.0. Поддержка USB 2.0 облегчит переход на PCI Express, потому что производителям периферии нужно определенное время для реализации поддержки PCI Express в своих наборах микросхем. В переходный период PCI Express Mini Card можно будет легко подключать с помощью USB 2.0.

ExpressCard

ExpressCard - это маленькая модульная дополнительная карта, которая в течение следующих лет должна заменить PC Card. Спецификация ExpressCard была разработана ассоциацией Personal Computer Memory Card International Association (PCMCIA, http://www.pcmcia.org). Форм-фактор ExpressCard обеспечивает замену PC Card с меньшими размерами и стоимостью и более высокой производительностью. Как и PCI Express Mini Card, модуль ExpressCard поддерживает каналы x1 PCI Express и USB 2.0. Низкая цена делает его оптимальным для настольных систем с уменьшенным форм-фактором. Модуль ExpressCard также имеет пониженное энергопотребление, и его можно вставлять в горячем режиме. Скорее всего, ExpressCard будут использоваться в сетевых платах, жестких дисках и будущих технологиях ввода-вывода.

PCI Express Server I/O Module

Массовое появление модулей SIOM ожидается после выхода второго поколения PCI Express. PCI Express SIOM обеспечивает форм-фактор, который легко установить и заменить. Он будет модульным, что позволит устанавливать и обслуживать карты ввода-вывода без прерывания работы системы и не открывая корпус компьютера.

SIOM предусматривает более радикальное изменение форм-фактора, чем другие варианты PCI Express. Он решит многие проблемы с серверными картами PCI и PCI-X. Конструкция SIOM делает карты более надежными, что особенно важно в центрах обработки данных. Модуль также разрабатывался с расчетом на принудительную вентиляцию, поскольку мощным серверам свойственно высокое тепловыделение. Потоки охлаждающего воздуха могут идти сзади, сверху или снизу модуля. Такая гибкость дает проектировщикам систем больше свободы при оценке вариантов охлаждения стоечных систем, оборудованных SIOM.

Модули SIOM с самым большим форм-фактором способны выполнять сравнительно сложные функции и использовать весь диапазон каналов PCI Express.

Примеры систем с PCI Express

Рассмотрим, как технология PCI Express может быть реализована в клиентской и серверной системах. Первоначально канал x16 PCI Express заменит шину AGP между графической подсистемой и северным мостом. Вариант PCI Express может заменить и канал между обоими мостами НМС. Предусмотрено также несколько каналов PCI Express от южного моста к контроллеру сетевого интерфейса (NIC), устройствам IEEE 1394 и другой периферии. Южный мост будет по-прежнему поддерживать устаревшие слоты PCI.

Такая архитектура дает покупателям несколько важных преимуществ. Настольные системы еще долго будут оснащаться шинами как PCI, так и PCI Express. Первые поколения серверов PCI Express также будут иметь слоты PCI-X для устаревших карт PCI-X. Чтобы упростить переход, предусмотрена защита от ошибочной установки PCI в слоты PCI Express и карт PCI Express - в слоты PCI. Кроме того, PCI Express обеспечивает широкое применение карт Gigabit Ethernet, 10 Gigabit Ethernet, 1394b и других высокоскоростных устройств в клиентских системах. Он также поддерживает растущие требования к полосе пропускания графических подсистем.

PCI Express может применяться в двухпроцессорной серверной архитектуре, значительно упрощая систему. Каналы PCI Express для устройств ввода-вывода и слотов подключаются непосредственно к северному мосту. Такой подход дает ряд преимуществ. Во-первых, это высокая полоса пропускания для ввода-вывода следующего поколения, например, 10 Gigabit Ethernet и фабрики x4 Infiniband. Например, канал x8 PCI Express способен обеспечить пиковую полосу пропускания, которая требуется двухпортовому контроллеру 10 Гбит/с.

Во-вторых, меньше становятся расходы на внедрение. Удается подключить к системному набору микросхем больше слотов и встроенных устройств ввода-вывода, что уменьшает число микросхем моста и снижает требования к маршрутизации сигналов на системной плате. И наконец, за счет отказа от использования микросхемы моста PCI-X уменьшается запаздывание передачи между устройствами ввода-вывода и центральным процессором и памятью.

Таким образом, технология PCI Express обеспечивает надежное и масштабируемое последовательное соединение, обратно совместимое с PCI. Как и PCI, она будет использоваться в широком спектре существующих платформ, включая серверы, портативные компьютеры, настольные системы и рабочие станции. Она также позволит реализовать новаторскую конструкцию модульных компьютерных систем.

PCI Express vs. PCI
Вести со звуковых фронтов

Когда нам ждать звуковых карт на PCIe?

Наши читатели задаются вопросом задержки выхода PCI Express звуковых карт. Цитата из форума: «На новых материнских платах обычные PCI слоты в дефиците, а встроенный звук слишком посредственный. Чего там производители тянут? Вроде времени прошло уже немало, где PCI Express карты?»

Действительно, спецификация PCI Express была объявлена ещё в середине 2002 года. PCIe призвана сменить шину PCI, бывшую общепринятым стандартом для карт расширения в течение более чем десятка лет.

Основные отличия PCI Express от PCI:

  1. PCI Express — шина последовательная, а не параллельная. Основные преимущества — снижение стоимости, миниатюризация, лучшее масштабирование, более выгодные электрические и частотные параметры (нет необходимости синхронизировать все сигнальные линии);
  2. Спецификация разделена на стек протоколов, каждый уровень которого может быть усовершенствован, упрощен или заменен, не сказываясь на остальных;
  3. В спецификации заложены возможности горячей замены карт;
  4. В спецификации заложены возможности создания виртуальных каналов, гарантирования пропускной полосы и времени отклика, сбора статистики QoS (Quality of Service);
  5. В спецификации заложены возможности контроля целостности передаваемых данных (CRC);
  6. В спецификации заложены возможности управления питанием.

Реально из устройств на рынке доступны лишь видеокарты, где большая пропускная способность может найти наилучшее применение. Слот для видеокарты PCIe 16x имеет наибольшую скорость и подсоединен к северному мосту чипсета. Однако даже внедрение видеокарт прошло с большими проблемами. Из-за отсутствия спроса и весьма невысокого прироста производительности по сравнению с AGP производители понесли убытки. И это учитывая полное отсутствие альтернативы, в виду того что слот AGP в новых PCIe чипсетах был убран.

Что говорить о периферийных слотах PCIe 1x для карт расширения, таких как звуковые карты, модемы, TV-тюнеры и прочее? Для них мало того, что присутствуют слоты PCI, но и отсутствуют потенциальные преимущества для перехода на новую шину. Стоит ли удивляться, что наученные опытом гигантов видеокарто-строения, производители периферии, имеющие более скромные бюджеты и возможности для маневра, не стали рисковать и бросаться выпускать PCIe карты. Всё же PCIe 16х для видео — это одно, а PCIe 1x для периферии — совсем другое. Все помнят судьбу изобретённых Intel неполноценных разъемов для звуковух/модемов/сетевых плат AMR, CNR, ACR.

Мотивация пользователей ослаблена ещё одним фактором. Современные чипсеты и основанные на них материнские платы предлагают обширные встроенные возможности: AC"97/HDA-звук, 100 Мбит/1 Гбит сеть, RAID массив, 8 портов USB2.0. Что ещё нужно рядовому пользователю? Категория энтузиастов, скорее всего, озаботится наличием PCI слотов в материнской плате, чтобы не идти на бессмысленные траты. Особенно если это касается тех устройств, которым с запасом хватает PCI. Для звука есть также альтернатива — USB и FireWire устройства.

Можно лишь пожалеть покупателей, в очередной раз купивших «мегагерцы» и оказавшихся в ситуации с отсутствием свободных слотов PCI. Но это неизбежная участь тех, кто бежит впереди паровоза и безоглядно покупает что-то «на будущее» — оплачивать прогресс из своего кошелька и наживать язву, чертыхаясь на проблемы, глюки и обвиняя крупные компании в мировом заговоре. Приверженцы PCIe поневоле живут надеждами на скорое появление периферии под новую шину.

В сфере аудио у многих была надежда на появление под PCIe нового поколения звуковых карт Creative. Но разработка X-Fi под шину PCI длилась более 5 лет. По заявлению производителя, попытки адаптации под PCIe вызвали технические затруднения, в частности, с latency (время задержки звука на буферизацию и обработку), так что в ближайшее время выход карт под новую шину не ожидается. Что касается опасений в отношении упущенной прибыли от потенциальных продаж несуществующих пока PCIe карт, Creative не успевает отгружать в магазины карты X-Fi с шиной PCI. Уже несколько месяцев подряд новые карты в дефиците и раскупаются моментально.

С технической стороны последовательная шина с той же частотой имеет большую latency, чем параллельная, так как отсутствуют служебные сигнальные линии, посему для звуковых задач, где важнее не пиковая скорость при пересылке гигабайт, а быстрый доступ на малых объемах, подходит хуже. К сожалению, в сети сложно найти тесты сравнения именно карт PCIe 1x vs. PCI. Рекламные заявления о превосходстве шины PCIe во всём сложно принимать на веру.

Независимая энциклопедия Wikipedia говорит следующее: «PCIe посылает все управляющие команды, включая прерывания, по тем же линиям, что и данные. Последовательный протокол нельзя разделить на отдельные части, так что latency сравнима с PCI. <...> Спецификация PCIe называет эти чередующиеся данные «полосы данных» <...> такие данные не обязательно уменьшают latency на небольших пакетах данных, передаваемых по шине».

Почему некоторые считают PCI морально устаревшим интерфейсом для звуковых карт, так и не удается понять. Из спецификаций ясно одно: существующие звуковые устройства не ограничены параметрами PCI. Обычно за недостатком аргументов, основанных на достоверных фактах, дискуссия перерастает в религиозную войну.

Ведущий английский журнал профессионального звукового оборудования Sound on Sound в декабрьском номере 2005 года провел круглый стол с представителями проаудио производителей и задал им подобные вопросы. Мы публикуем часть дискуссии в русском переводе (полную версию на английском языке можно прочесть на сайте упомянутого журнала).

Поддержка PCI Express

PC со слотами PCI Express доступны на рынке более года, но пока ни одного аудио интерфейса PCI Express не анонсировано. Что вы думаете о способностях новой шины, ожидается ли разработка новых продуктов с поддержкой PCI Express?

Матиас Карстенс, RME: Устройство шины PCI Express намного сложнее, чем в случае PCI. Без сомнений индустрии проаудио потребуется год или больше для исследований и производства образцов. Согласно некоторым источникам, рано или поздно готовые решения появятся.

PCI имеет все необходимое для обычных нужд. PCI Express будет полезна только для профессионального мультитрекового использования, когда лимитирующим фактором будет шина. Например, при использовании нескольких карт HDSP MADI (каждая имеет 64 входа/выхода), ожидается, что PCI Express значительно поможет. Поэтому неудивительно, что у нас в планах портировать карту MADI на PCI Express, но точная дата пока неизвестна.

Интересно отметить, что первые PCI Express Firewire карты сейчас доступны. Первые тесты показывают, что все работает как обычно. Это хороший знак, потому как в случае полной непригодности PCI Express (например, постоянные щелчки, несмотря на высокую пропускную способность) никто бы в аудио мире не удивился. Дальнейшие тесты с несколькими устройствами Firefaces, работающими на 192 кГц, будут необходимы для выявления предела использования PCI Express для аудио целей. Если новая шина подойдет лучше (а пока все Firewire интерфейсы основаны на PCI), внедрение PCI Express пойдет быстрее.

Клаус Райтмюллер, ESI: Шина PCI Express как минимум такая же продвинутая и гибкая, как и PCI или PCI-X. Однако они несовместимы. Это на сегодня представляет большие затруднения для производителей железа. В любом случае, PCI Express, несомненно, в планах ESI Professional в будущих разработках.

Мило Стрит, Echo: Мы пока оцениваем шину PCI Express и, вероятно, будем производить продукты с её поддержкой в будущем. Одно потенциальное преимущество над PCI заключается в качестве обслуживания и возможности управления полосой пропускания. В теории это может позволить иметь меньшую latency, чем PCI, что уже лучше, чем Firewire или USB.

Брет Костин, M-Audio: PCI Express обещает увеличенную полосу пропускания, но наши пользователи пока вполне довольны продуктами на Firewire, USB and PCI. Малая часть из сегодняшних компьютеров имеет дополнительные PCI Express слоты для аудио, а поддержки PCI Express среди производителей звуковых чипов, кажется, пока нет.

Фил Палмер, Edirol: У нас пока нет планов в отношении PCI Express. Edirol/Roland возглавил разработку USB-интерфейсов для PC и Mac. Мы и сейчас плотно работаем с Apple над Firewire продуктами. Мы чувствуем, что концентрация на этих технологиях — это лучший способ произвести передовые продукты. Протокол PCI Express пока еще слишком новый и, как и все высоко-скоростные технологии, скорее всего, изначально предназначен для определенного рода непрерывной однонаправленной передачи данных, что характерно для дисковых контроллеров и графических карт.

Марио Мичел, Terratec: Звуковые PCI системы Terratec Producer всегда основаны на специализированных чипах контроллеров на шине PCI, таких как VIA1712(24). До сегодняшнего дня мы не слышали о стандартных чипах звуковых PCI Express контроллеров, поэтому у нас нет никаких планов. В любом случае, PCI Express нужно в основном для гигантского количества аудиоканалов (как, например, 64 канала у MADI). Мы не планируем выпускать такие устройства в ближайшем будущем.

Питер Пек, Yamaha: Yamaha не может комментировать какие-либо новые разработки, которые ведутся. Мы сосредоточены на разработке продуктов mLAN, так как потребности наших пользователей более чем удовлетворены возможностями шины IEEE1394. В данный момент нет острой необходимости бросаться разрабатывать PCI Express, тогда как уже есть такое количество входов и выходов через mLAN, что превышает большинство запросов для работы со звуком. Однако… никогда не говори никогда!

Джим Купер, MOTU: Как ведущий производитель звуковых интерфейсов, MOTU
серьезно приглядывается ко всем новым интерфейсным технологиям.

Смерть PCI карт

С анонсом PCI Express и популярностью интерфейсов на USB и Firewire, многие музыканты начинают предполагать, что звуковые карты на PCI сродни вымирающему виду. Как вы думаете, сколько времени потребуется для полного исчезновения интерфейса PCI, как это произошло в случае с предыдущим стандартом ISA?

Клаус Райтмюллер, ESI: На текущий момент, решения на шинах PCI и PCI-X наиболее рентабельны, как в высшем сегменте, где требуется множество аудио каналов (например, наша серия MaXiO), так и на рынке устройств начального уровня (такие продукты, как Juli@ или ESP1010). Шина PCI позволяет реализовать решения с наивысшим соотношением цена/качество, что пока невозможно для устройств на USB или Firewire по той же цене, или с тем же качеством. Даже по этой причине, мы продолжим видеть PCI аудиоустройства в течение продолжительного времени в будущем. В конечном счете, PCI Express заменит PCI и ещё более упрочит себя в роли решения, более предпочтительного, чем Firewire и уж точно USB.

Джим Купер, MOTU: Текущие системы MOTU на PCI все ещё более производительны, чем Firewire или USB продукты, даже на шинах второго поколения Firewire B (800 Мбит/с) и USB 2.0 (480 Мбит/с). И наши продажи подтверждают это. PCI системы MOTU всё ещё весьма привлекательны для многих пользователей — в основном для high-end покупателей, которым нужно высочайшее качество АЦП/ЦАП, насколько только возможно, большое количество каналов, различные форматы интерфейсов, низкая latency и широкомасштабное межинтерфейсное микширование, предоставляемое нашей серией продуктов PCI424. Мы полагаем, что система PCI424 является самой лучшей системой, среди доступных в продаже.

Брет Костин, M-Audio: Скорее, это будет двумя годами позже. Производительность звуковых карт ISA и PCI сильно отличалась, так как последние имели серьезные преимущества над ISA. Сегодняшние преимущества не так значительны, в результате продвижение идет недостаточно агрессивно для внедрения новой технологии.

Марио Мичел, Terratec: Наши разработки сосредоточены на USB 1.1/2.0 и IEEE1394 Firewire 400/800. Мы не планируем новых PCI систем в ближайшем будущем, и будем обновлять драйвера и софт для существующих PCI продуктов ещё долгое время. Мы будем продавать наши PCI системы столько, сколько покупатели будут готовы их покупать, и я уверен, что стабильные продажи PCI устройств сохранятся в ближайшие 2-3 года.

Фил Палмер, Edirol: Сложно предсказывать, но я полагаю, что PCI продукты сохранятся до тех пор, пока производители не перестанут устанавливать PCI слоты в компьютерах.

Матиас Карстенс, RME: Как минимум 5 последующих лет. IMHO.

Мило Стрит, Echo: Преимущества PCI Express над PCI для аудио не такие значительные, как это было в случае превосходства PCI над ISA. Наверное, PCI будет существовать, пока PCI слоты не исчезнут с материнских плат (это заняло несколько лет в случае ISA), так что покупаемые сегодня звуковые PCI интерфейсы останутся пригодными надолго. Однако можно ожидать, что большинство производителей со временем или перейдут на PCI Express, или будут поддерживать только последовательные интерфейсы.

Питер Пек, Yamaha: По моему опыту, музыкантам больше нравится гибкость внешних устройств — с возможностью переносить железо на другой компьютер без вскрытия корпуса. Далее, с увеличением использования ноутбуков для музыкального продакшена, внешние устройства окажутся ещё более привлекательными для покупателя. Эта гибкость позволяет продлить срок службы внешнего устройства по сравнению с внутренними картами и отработать большие деньги. Это еще один фактор, который ставит шину PCI под удар.

Спасибо Sound on Sound за интересное интервью. Совершенно недавно о первом появлении звукового PCIe интерфейса, правда, только под Mac.

Digidesign предлагает две равноправные версии своей профессиональной аудио-продакшн системы Pro Tools|HD. Производитель стремится обеспечить совместимость с максимально возможным количеством компьютеров, оборудованных шинами PCI, PCI-X и PCIe, поэтому продолжает выпускать существующую версию под PCI и анонсирует новую версию под PCI Express.

Предполагается выпуск Pro Tools|HD версии PCIe для нового ряда Apple Power Mac G5. Так как новые компьютеры Power Mac G5 имеют лишь три разъема PCIe, первоначально поддержка PCIe-версии Pro Tools|HD ограничено установкой максимум трех карт. Если требуется большее число карт, необходимо воспользоваться Digidesign Expansion|HD (стоимостью $2400), исполненном во внешнем 4U модуле адаптером расширения с шин PCI, PCI-X, PCIe на 6 слотов PCI.

Варианта для платформы Windows в настоящий момент не имеется. Digidesign планирует протестировать и адаптировать PCIe систему для Windows-компьютеров, как только на этой платформе станет стандартом как минимум три свободных PCIe слота в каждой машине. До этого момента можно без проблем использовать PCI версию.

PCIe-совместимые системы Pro Tools|HD имеют ту же цену, что и PCI решения. Digidesign предлагает специальную программу апгрейда Pro Tools LE или Pro Tools TDM до систем Pro Tools|HD на шинах PCI, PCIe. Также имеется программа замены PCI версии на PCIe.

На сайте Digidesign приведен интересный FAQ, из которого можно понять, что: Digidesign не собирается прекращать выпуск PCI версии в обозримом будущем, PCIe решения требуют для работы программный пакет Digidesign Pro Tools HD версии 7.1, более трех карт PCIe установить никак не удастся, решений расширения PCIe-to-PCIe не существует.

Напомним, система Pro Tools|HD в обоих вариантах с одной картой HD Core (PCI) или Accel Core (PCIe) обеспечивает 32 канала вход/выход, 96 аудио дорожек и предлагается по цене $7995. Две карты предлагают вдвое более высокую функциональность по цене $10995. Три карты обойдутся в $13995.

Поздравляем поклонников шины PCIe — лед тронулся!

Участник круглого стола Sound On Sound, Матиас Карстенс из RME, после анонса Pro Tools|HD PCIe так прокомментировал ситуацию: «Естественно мы добавим PCI Express версии существующих продуктов в нашу линейку». По его мнению, первые анонсы должны состояться в следующем году на Frankfurt Musikmesse. «Используя последние технологии FPGA , мы сможем полностью реализовать все существующие наработки RME. Например, HDSP 9652, где технология FPGA полностью воплощена в текущей модели. Эта карта не имеет Steady Clock, и также отсутствует инверсия фазы и опциональное усиление +6dB в микшере Total Mix. В версии PCI Express мы можем добавить эти функции. Мы также сделаем PCI Express версию выпускаемой интерфейсной HDSP карты для пользователей Digiface и Multiface, но она будет функционально идентична PCI модели, для совместимости с внешними устройствами».

Пока что у RME нет планов предложить пользователям возможность апгрейда PCI карт на PCI Express, и Матиас отметил, что анонс PCIe продукта для платформы Apple не повлиял на планы его компании по продвижению PCI Express продуктов на рынок. Причина, почему другие производители не анонсируют PCI Express карты, может быть в том, что нет сопутствующих решений для внедрения новой шины, таких как мосты «PCIe-to-PCI», или готовые чипы контроллеров, как Via Envy24, которые повсеместно используются в массовых PCI звуковых картах и интерфейсах. А подобных решений нет из-за отсутствия на них спроса. Получаем замкнутый круг, разомкнуть который, очевидно, под силу лишь лидерам рынка, остальные подтянутся. Слово за производителями чипов.