Главная » Статьи » Intel Optane Memory и NVMe SSD на базе QLC-памяти: проверяем пригодность такой гибридизации для практического использования

Intel Optane Memory и NVMe SSD на базе QLC-памяти: проверяем пригодность такой гибридизации для практического использования

pcmark-10-storage-big.jpg
Краткое знакомство с новым тестовым пакетом PCMark 10 Storage

Изучая недавно новый тестовый пакет PCMark 10 Storage, мы провели с его помощью и практическое тестирование некоторых твердотельных накопителей. Причем тестирование «двойное»: в пустом состоянии и оставив свободными всего 100 ГБ — производительность многих SSD во втором случае существенно падает. В частности, мы отметили почти двукратное падение результатов для накопителей на базе QLC NAND. В то же время, использование TLC-памяти даже в паре с бюджетными контроллерами приводит к снижению скоростных показателей примерно в полтора раза. Тоже много, конечно, но разница с QLC более чем заметная. С этим можно мириться, поскольку «приличные» QLC-модели, типа Intel SSD 660p, по скорости все равно обходят любые SSD с SATA-интерфейсом, не говоря уже о жестких дисках. Но можно попробовать решить проблему немного нестандартным способом, который предлагает Intel. Компания даже самостоятельно использует его в своих гибридных накопителях линеек Optane Memory H10 и H20, где на одной плате «соседствуют» QLC SSD и кэширующий модуль Optane Memory. Такое исполнение необходимо для компактных систем, но само по себе кэширование можно организовать и в случае двух накопителей в отдельных слотах. Главное — чтобы это были слоты M.2, подключенные к одному из «свежих» чипсетов Intel, а кэшируемым был как раз Intel SSD 660p или 665p — продукты других производителей не поддерживаются.

chart-170.png

Использование Optane Memory для ускорения накопителей разных типов, включая и твердотельные

Что забавно, в случае SATA-интерфейса подобных ограничений нет — «ускорять» можно любое устройство. Чем мы пару лет назад и воспользовались, «собирая» композитные накопители из модулей Optane Memory на 32 и 64 ГБ и терабайтного Samsung 860 Qvo. Тогда мы пришли к выводу, что такой метод увеличения производительности не слишком интересен, потому что… он ее практически не увеличивает. Жесткие диски «подстегнуть» можно радикально — до уровня многих SSD. Но тут-то изначально такой уровень и есть. С другой стороны, на тот момент у нас был ограниченный набор инструментов. Да и производительность заполненных накопителей мы не тестировали —, а с ней, как уже было сказано, основные проблемы и возникают. Посмотрим, получится ли с ними что-то сделать.

О самой технологии кэширования Optane Memory сегодня много говорить не будем, поскольку этому вопросу уже было посвящено большое количество материалов:

Соответственно, если интересуют подробности — можно с ними ознакомиться в статьях по ссылкам. Фактически в рамках упомянутого мини-цикла мы начали с теоретических аспектов, а закончили, охватив весь набор SATA-накопителей в качестве объектов ускорения. Первое время ничего другого и не предполагалось — причем в первую очередь Intel говорила об «оптанизации» именно жестких дисков. Три года назад это было актуально: с учетом тогдашних цен на SSD идея персональных компьютеров без HDD лишь с натяжкой могла казаться перспективной. Да и твердотельный накопитель невысокой емкости в качестве «системного» встречался далеко не в каждом новом компьютере — не говоря уже о парке находящейся в использовании техники. Отсюда и идея кэширования. Которое, казалось бы, уже устарело — вместе с уходом винчестеров исключительно в область хранения «холодных» данных. Однако Intel, как уже было сказано выше, нашла для технологии такое вот неожиданное применение, скрестив Optane Memory с SSD на базе QLC-памяти (которых на старте тоже не существовало).

При попытке оценить перспективность этого подхода сразу обнаружились подводные камни: собрать подобную конфигурацию на базе «стандартного» тестового стенда (где использовалась системная плата на базе старенького чипсета Intel Z270) не получилось. Утилита просто не распознавала NVMe-накопители в качестве совместимых, хотя официально для их поддержки просто достаточно RST версии 17.5.2.1024 или более новой, а других ограничений не прописано. Взяли Gigabyte Z490 Aorus Master на чипсете Intel Z490 — все заработало с абсолютно тем же софтом. Одна проблема: SSD на данный момент в системах на платформе LGA1200 работают медленнее, чем из них получается выжать на «первой версии» LGA1151, так что сравнивать результаты напрямую нельзя — и большой базы протестированных устройств для полностью корректного сравнения у нас не будет. Но есть по крайней мере Silicon Power US70 1 ТБ — как и другие модели на базе контроллера Phison E16, он в первую очередь рассчитан на использование в системах с поддержкой интерфейса PCIe 4.0. При наличии же только PCIe 3.0 — становится «просто» быстрым SSD. Но этого нам как раз и хватит.

Главными же героями станут два SSD Intel 660p — на 512 ГБ и 1 ТБ. Каждый будет тестироваться как сам по себе, так и в паре с Optane Memory на 16 и 32 ГБ. Почему два разных модуля? Напомним, что и работают они немного по-разному. Младшие модели — на уровне секторов, а от 32 ГБ появляется еще файловый уровень. Что позволяет, например, какие-то часто используемые файлы жестко закреплять в «быстрой области». А файлы операционной системы туда попадают изначально и автоматом. В случае теста PCMark 10 Storage это актуально: он работает как раз с реальными файлами и каталогами — в отличие от предыдущих версий этого тестового пакета, размещавшего все трассы в одном мета-файле, что могло привести к «недобору попугаев» при использовании Optane Memory. И, естественно, производительность мы тестировали в двух состояниях — «пустом» и «полном». Начнем с первого — как самого простого.

Intel 660p благодаря агрессивному SLC-кэшированию работает очень быстро — пока сам кэш большой. В таком состоянии он не слишком-то отстает от «нормальных» быстрых SSD сопоставимой емкости. Если же его «пришпорить» Optane Memory — может их и обогнать. Правда, только в случае модулей Optane Memory на 32 ГБ — это как раз разница между файловым и секторным уровнем. Производительность второго, в принципе, можно подтянуть длительным «обучением» —, но первый работает сразу. Поэтому в рамках тестирования пользы от «оптанизации» пустого 660р младшими модулями практически нет.

Совсем другая картина в заполненном состоянии. На месте остается только Silicon Power US70 — такие SSD демонстрируют отличную стабильность скоростных характеристик. Что же касается остальных испытуемых, то они становятся медленнее. Сильнее всего пропускная способность снижается у «чистого» SSD, заметно меньше — при использовании кэширующего модуля хотя бы на 16 ГБ. ОМ на 32 ГБ опять отлично «сглаживает» падение, и поскольку на пустом устройстве его использование заметно повышало производительность, конечный результат оказывается очень хорошим.

Среднее время доступа изменяется аналогичным образом (здесь, напомним, меньше — лучше). На результатах пустого накопителя кэширование модулями объемом 16 ГБ практически не сказывается, а вот модуль на 32 ГБ существенно сокращает задержки, и они становятся меньше, чем у заведомо более быстрых SSD.

В «забитом» состоянии результаты 660р, разумеется, заметно хуже, но эффект от применения кэширования остается. В первом приближении можно сказать, что производительность 660р по мере заполнения данными снижается примерно в два раза — что было отмечено и в прошлый раз. Но! При применении кэширования два раза превращаются в полтора — так ведут себя бюджетные SSD на более дорогой TLC-памяти. При этом есть разница, какими модулями Optane Memory кэшировать: 16 ГБ просто сглаживает падение, а 32 ГБ позволяет повысить производительность, а потом снижаться уже от этого уровня.

Как уже было сказано в материале про сам тестовый пакет, в новой версии общий результат целиком и полностью определяется пропускной способностью и задержками. Соответственно, картина та же, что мы уже видели выше. Применение кэширующих модулей на 16 ГБ почти не повышает производительность пустого SSD, а вот 32 ГБ позволяют изначально недорогой и небыстрой QLC-модели обогнать накопители более высокого уровня.

В заполненном состоянии — никаких рекордов. Но зато и таких провалов, как без кэширования, тоже нет. И тут интересно сравнение даже не в равных условиях, а чуть более сложное. Например, пустой терабайтный 660р «набивает» 1885 попугаев. Полный терабайтный 660р, ускоренный при помощи кэширующего модуля на 32 ГБ — 1637. Без него — всего-то 1066. То есть главное, чего позволяет добиться использование Optane Memory в паре с SSD класса Intel 660р — не увеличить скорость, когда она и так высокая, а не допустить слишком уж сильных провалов в работе.

С такой задачей справляются и кэширующие модули минимальной емкости, однако разница заметна, поскольку, опять же, принципиально разная логика работы. Модули на 16 ГБ ограничены переносом в быструю область исключительно логических секторов — согласно статистике их использования. Даже если это части одного файла, сообразить перенести такой файл целиком в кэш драйвер не способен. При наличии же 32 ГБ или большего количества памяти — может. Некоторые файлы может переписать в кэш заранее — в частности, относящиеся к «резидентному ядру» Windows 10, на что требуется примерно 3 ГБ свободного места. А некоторые файлы — по личному указанию пользователя. Причем они из кэша вытесняться потом не будут, несмотря на нагрузки, а вот из младших модификаций модулей — могут. Да и ме́ста в тех банально меньше для того, чтобы использовать Optane Memory в качестве именно кэша, хотя достаточно для того, чтобы закэшированы оказались служебные области типа MFT и т. п. Поэтому требования к скорости записи «основного» SSD существенно снижаются —, а именно она и падает у «забитого» данными устройства, поскольку в пустом состоянии с такими операциями нормально справляется и «собственный» динамический SLC-кэш.

В этом плане очень любопытно выглядит линейка накопителей Optane Memory H10: в двух модификациях из трех используется как раз 32 ГБ кэша при емкостях флэш-памяти в 512 ГБ и 1 ТБ. Фактически эти два случая мы и эмулировали. Обделенной оказывается лишь младшая модель — на 256 ГБ. Но это с какой стороны посмотреть. Без «довеска» в виде 16 ГБ 3D XPoint уровень производительности такого устройства совсем уж уныл (660р на 256 ГБ — чистый ОЕМ-продукт, о котором Intel вообще старается не слишком распространяться — именно по этой причине). С «довеском» же может получиться что-то приличное. В рамках бюджетного сегмента, разумеется.

Включив внутреннего конспиролога, можно предположить, что такое применение Optane Memory планировалось компанией изначально. А вот использование этой технологии для ускорения работы жестких дисков на первом этапе было как раз временным решением (закладываться только на него к тому моменту было поздновато). Недаром в первые годы было много рассуждений о том, что Optane Memory — технология мертворожденная и бесперспективная: чем больше распространяются «обычные» SSD на флэш-памяти, тем меньше ареал ее обитания. На практике же оказалось, что кэширование нужно и таким SSD. «Внутреннее» кэширование (тот самый SLC-кэш) за последние пять лет стало обязательным механизмом, без которого о получении высоких скоростей при использовании TLC- и, в особенности, QLC-памяти даже заикаться не приходится (а в перспективе на горизонте маячит уже «упаковка» в одну ячейку 5–8 бит данных — где эти тенденции существенно усугубятся). Однако для эффективной работы SLC-кэширования требуется наличие «запаса» свободного места. Обеспечить же это удается далеко не всегда. Да и вообще: за предложение купить терабайтный накопитель и использовать лишь половину его емкости, в приличном обществе можно и канделябром. «Внешнее» кэширование, разумеется, тоже увеличивает цену устройства, однако позволяет сэкономить на стоимости самой памяти, что особенно весомо при большом ее количестве.

adata-xpg-gammix-s50-lite-big.jpg

Обзор SSD Adata XPG Gammix S50 Lite 1 ТБ на новом контроллере Silicon Motion SM2267 с формальной поддержкой PCIe 4.0

Со скоростными характеристиками может быть по-разному. К примеру, недавно мы протестировали Adata XPG Gammix S50 Lite — относительно новый накопитель с поддержкой PCIe 4.0. Правда, как выяснилось, контроллеру Silicon Motion SM2267 в паре с 96-слойной памятью 3D TLC NAND Micron с кристаллами по 512 Гбит эта поддержка ничего не дает — производительность в системе на базе Ryzen 7 3800X и системной платы на чипсете AMD B550 (где режим PCIe 4.0 работал) оказалась немного ниже, чем на нашем «стандартном» тестовом стенде (напомним: старичок Core i7–7700 и Intel Z270, ничего выше PCIe 3.0 не поддерживающие). Но эта платформа в любом случае дороже, чем тот же Intel SSD 660p — где и более старый SM2263, и QLC-флэш. Хотя и быстрее, конечно.

А вот что получается, если мы добавим к 660p модуль Optane Memory на 32 ГБ. Докапываться до запятых не стоит — платформы немного разные (поэтому мы выше избегали такого сравнения). Однако качественно оценить ситуацию можно. Если просто перейти с TLC на QLC, получаем снижение цены, но и резкое падение скорости, особенно заметное в «неудобных» для SLC-кэширования условиях — когда свободного места мало. Добавление 3D XPoint с собственным контроллером «съедает» немалую часть экономии на памяти, но и «возвращает» скоростные характеристики на тот же уровень — или даже более высокий. В вопросе цены нужно просто соблюдать баланс: стоимость «оптанизации» от емкости не зависит, а вот цена флэш-памяти связана с ней непосредственно. Таким образом, в моделях небольшой емкости лучше все-таки сохранять TLC-память — оно и проще, и дешевле. Но начиная с определенного порога — наоборот.

Intel в последнее время явно делает ставку именно на QLC NAND. TLC-линейка компании 760p появилась более трех лет назад и с тех пор не меняется. За меньший срок выпущено уже три семейства SSD на QLC-памяти (660p, 665p и вот уже 670p). За еще меньший — целых две гибридных линейки из QLC и Optane Memory. Из чего не следует безальтернативность данного подхода — в конце концов, у остальных производителей ничего подобного 3D XPoint пока нет, так что они вынуждены балансировать между «чистыми» TLC и QLC. При этом и представления о «необходимом» уровне маржи у всех разные. Так что, если говорить только о рознице и о покупке одного-двух устройств, иногда можно найти «приличный» SSD на TLC немногим дороже, чем 660p/665p (а если не ограничиваться только лишь NVMe, то задача вообще сильно упрощается). И в таких условиях полезность «гибридности» начинает казаться натянутой. Но она все равно не пропадает полностью. Просто это еще один возможный подход, вполне работающий на практике — в чем мы сегодня убедились.

Полный текст статьи читайте на iXBT

Опубликовано: 5 февраля 2021
↓