Главная » Статьи » Твердотельный накопитель Kioxia CM6-V емкостью 3,2 ТБ: SSD enterprise-сегмента с поддержкой интерфейса PCIe 4.0 в новом форм-факторе U.3

Твердотельный накопитель Kioxia CM6-V емкостью 3,2 ТБ: SSD enterprise-сегмента с поддержкой интерфейса PCIe 4.0 в новом форм-факторе U.3

Методика тестирования накопителей образца 2021 года

Продажи SSD с SATA-интерфейсом до сих пор остаются неплохими, однако топовый сегмент такие устройства безвозвратно покинули. В общем, можно уже утверждать, что по крайней мере энтузиасты NVMe переварили. Но есть нюансы — пока еще в оригинальной версии, т. е. на базе PCIe 3.0. А внедрение следующей версии спецификации идет со скрипом — и не очень охотно. Что понятно — до сих пор с массой запросов справляется и SATA. А если хочется чего-то эдакого — достаточно NVMe на базе PCIe 3.0. 4.0 ускоряет некоторые сценарии — но по большей части там, где скорость и так избыточна, так что улучшения невооруженным глазом не заметишь. Если же говорить о массовом пользователе, то в его случае все это еще более выражено. Да и вообще — может не найтись подходящей системы: хоть такие появились еще два года назад, но и среди продаваемых сейчас компьютеров их доля далека от 100%. Есть, конечно, и обратная совместимость — но не так уж и нужна: поскольку за поддержку PCIe 4.0 берут дополнительные деньги, лучше не платить за то, чем не удастся воспользоваться. Вот по мере исчезновения из продажи быстрых накопителей под старый интерфейс это станет более актуальным. Да и инсталляционная база к тому моменту увеличится. Впрочем, к тому моменту особо нетерпеливые уже и PCIe 5.0 получат, так что нельзя сказать, что положение упростится до состояния трехлетней давности — так уже не будет никогда.

А вот корпоративный рынок PCIe 5.0 встретит очень тепло — точно так же, как сейчас бодро мигрирует на PCIe 4.0. Но в этом тоже нет ничего удивительного — по большому счету для него все и затевалось (равно как и вообще протокол NVMe придумывали). Там в ходу накопители высокой емкости — в результате и пиковые скорости выше, так что и ранее для подключения накопителей или контроллеров приходилось использовать 8-16 линий. А их вечно не хватает! Увеличение же скорости каждой позволяет кратно уменьшить потребности в количестве — вместо PCIe 3.0 х16 можно будет использовать PCIe 5.0 x4. Со временем — сейчас пока это не доступно, но х4 4.0 вместо х8 3.0 уже реально. Учитывая, что «основные» форм-факторы современных SSD рассчитаны как раз на четыре линии, эффект перехода к стандартным накопителям вместо «нестандартных» сложно переоценить. Тем более есть он не только тогда, когда требуются пиковые скорости — и четыре линии иногда приходится делить. Например, в двухпортовых накопителях (которые для системы представляют собой два виртуальных SSD на базе одного физического) интерфейсные линии распределяются как 2×2 вместо 1×4. Удвоение скорости каждого из портов возможно только в одном случае — если вдвое быстрее станет каждая линия, что и дает переход на PCIe 4.0. А после начала внедрения 5.0 можно будет подумать и о четырехпортовых SSD по схеме 4×1 — ведь каждая такая (уже) «четвертинка» по скорости будет сопоставима с наиболее массовыми совсем недавно NVMe-накопителями с интерфейсом PCIe 3.0 x4.

Поэтому, как уже сказано, все компании, играющие на этом сегменте рынка, воспринимают ускорение интерфейса как обязательное и безальтернативное мероприятие. К тому же, вообще повышающее привлекательность NVMe как основного протокола для высоконагруженных систем хранения данных. Так что неспроста в прошлом году на OCP Virtual Summit 2020 в очередной раз прозвучала идея отправить на свалку истории SATA и SAS, обеспечив даже жесткие диски одной-двумя линиями PCIe — что позволит использовать и для них протокол NVMe, да и вообще полностью унифицировать всю СХД. Правда такой подход имеет свои недостатки — в частности даже одна линия PCIe в современных условиях для неторопливого «механического» устройства это слишком жирно, а меньше выделить никак нельзя. Поэтому более перспективной может оказаться идея реализации NVMe поверх SATA — принципиальные возможности чего в последние версии стандарта заложены. Но, может быть, и вовсе сохранится старая система — с использованием NVMe между специальным дисковым контроллером, к которому уже подключаются SAS и SATA-устройства, и хост-системой. Благо таковая хороша ценой и сохранением совместимости с уже имеющимся оборудованием — производителям тех же жестких дисков вообще ничего менять не придется. Значит, и тратить на это деньги тоже — немаловажно, учитывая, что эти накопители давно уже превратились в первую очередь в недорогие хранилища «холодных данных», так что любые нецелевые затраты вредны. Но для лучшей реализации такой схемы производителям пришлось немного поработать над SSD.

Форм-факторы SSD: прощаемся с U.2 — встречаем U.3

Твердотельные накопители в свое время пришли вовсе не на пустой рынок — в системах хранения данных от мала до велика на тот момент много лет уже царили жесткие диски. В таких условиях единственным шансом закрепиться было использование существующей инфраструктуры — чтобы можно было просто поменять механический накопитель на твердотельный, но больше не менять ничего. Отсюда и типичное исполнение в корпусах, унаследованных от 2,5″ винчестеров (были эксперименты и с 3,5″, но таковые оказались слишком большими и не универсальными). Массовые SATA-накопители получили толщину 9,5 мм, а потом и 7 мм. В корпоративном сегменте было немалое количество SAS-моделей толщиной 15 мм — и для SSD это тоже приспособили. Вместе с интерфейсом.

Первые же попытки использования PCIe обычно ограничивались форматом карт расширения — AIC. Для накопителей это не слишком удачный форм-фактор — но для экспериментов он прекрасно подходил и в бытовом, и в корпоративном сегменте. Однако внедрение NVMe в середине 10-х предполагало как раз массовость. Для бытовых моделей подходящий форм-фактор был — разнообразные версии M.2. Сильным местом которого, в частности, является компактность — в персональных компьютерах и ноутбуках большие платы не нужны, поскольку для типичных SSD емкостью до 1-2 ТБ достаточно и маленькой. Но есть и недостатки — являющиеся продолжение достоинств. В частности, большое количество флэш-памяти (а в корпоративном сегменте емкости в 8-16 ТБ давно уже не экзотика) на плате M.2 не разместишь. Большой и мощный контроллер — тоже сложно. И для конденсаторов нужно место предусмотреть — для реализации защиты от сбоев питания. Кроме того, M.2 (как и AIC) на горячую замену накопителей просто не рассчитан.

Поэтому пришлось изобретать что-то новое — но для сохранения какой-никакой совместимости не слишком новое. В частности, формат U.2 унаследовал от жестких дисков тот же корпус 2,5″ 15 мм (хотя в последнее время появилось уже много устройств высотой 7 мм), что позволяло использовать те же дисковые корзины. Разве что коммутационную панель пришлось заменить, поскольку другими стали разъемы. Но не принципиально другими — разъем SFF-8639 получился из традиционного для SAS SFF-8680 путем увеличения количества контактов с 29 до 68. И для подключения NVMe-накопителей используются как раз добавленные контакты, т. е. при механической совместимости самих устройств, подключаются они все-таки к разным контроллерам. NVMe — как правило к непосредственно поддерживаемым процессором линиям PCIe (что позволяет минимизировать задержки), SAS — именно к контроллеру. Или к расширителям.

Почему это схему потребовалось менять? Гибкости недостаточно. Если у нас, например, есть 10 отсеков для SAS и 10 — U.2, то, несмотря на их механическую идентичность, мы можем установить в систему не более 10 SAS и 10 U.2. Нельзя, например, на первом этапе для экономии поставить 16 SAS-накопителей и 4 NVMe, а потом при необходимости увеличения производительности менять первые на вторые. К тому же, для подключения большого количества NVMe-накопителей нужно и большое количество линий PCIe — а их уже давно не хватает. Нужно использовать экспандеры — что, в общем-то, тоже вовсе не недавнее изобретение. Фактически в каждом персональном компьютере такой есть, хотя пользователи об этом не задумываются — ибо жить обычно не мешает. Да-да — речь о чипсете, соединяющимся с процессором интерфейсом, эквивалентным 4-8 линиям PCIe, но «наружу выставляющим» уже до 30 высокоскоростных портов. Задержки немного выше, чем при непосредственном подключении к процессору, да и в части сценариев может страдать скорость передачи данных (если несколько устройств решат передавать их в одном направлении одновременно, все «упрется» в ширину внешнего интерфейса) — это недостатки схемы. Достоинство — она работает.

Подобную же производители решили реализовать и в системах хранения данных. Тем более, что частично она там уже… была: SAS/SATA-накопители всегда подключались к отдельным контроллерам. Во времена их «параллельных» предшественников (IDE и SCSI) совместимости вообще не было, при переходе к последовательным версиям «однорежимными» остались только (дешевые) SATA-контроллеры, но SAS — по определению «двухрежимный», поскольку поддерживает и SATA. Следующий шаг — три режима в одном контроллере: и SATA, и SAS, и NVMe. Итог — универсальное хранилище, которое можно «набивать» чем угодно: в зависимости от потребностей. И необходимое количество линий PCIe сокращается благодаря наличию промежуточного слоя.

blank

Для того, чтобы избежать неизбежного в таком случае снижения производительности, часть дисковых отсеков, все-таки, придется продолжать подключать непосредственно к процессорным линиям. Для этого достаточно и старого U.2 — но на U.3 с него можно перейти безболезненно. Просто для этого и контроллер SSD должен стать двухрежимным — гибко переключая порты данных в зависимости от того, куда накопитель подключен. По сути, критичными являются только 0 и 1 — остальные два остаются на своих местах. Проблема совместимости производителями полностью решена — поэтому от U.2 SSD можно безболезненно отказываться. Новые SSD формата U.3 будут работать и с «трехрежимными» контроллерами, и при непосредственном подключении — в том числе, и в существующих системах, рассчитанных на U.2. Такое эволюционное развитие — большой плюс формата. Что важно на фоне того, что часть разработчиков будущего для 2,5″ не видят — считая необходимым перевод корпоративных SSD на форматы семейства EDSFF. У последних есть масса достоинств, облегчающих продвижение: благодаря отказу от груза совместимости, они лучше учитывают особенности как SSD, так и систем охлаждения серверов. Но есть и недостаток — коренная ломка сложившейся и отточенной за долгие годы инфраструктуры: все нужно проектировать по-новому. Так что в будущем (особенно в системах с небольшим количеством накопителей) EDSFF может стать основным стандартом. Однако сейчас U.3 выглядит куда более актуальным. Хотя бы потому, что его можно использовать прямо сейчас — переход менее болезненный.

Все, что требуется для его осуществления — новые накопители. Которые, как уже сказано, смогут работать и со старыми системами. Но, разумеется, в полной мере «развернутся» в новых. Где мы увидим универсальные кабели, панели, поддержку одно-, двух- и четырехпортовых NVMe- и SAS-накопителей (причем выбор режима в новом стандарте тоже может быть гибким) и т. п. А посмотреть на работу в режиме совместимости, причем совместимости даже с обычной бытовой техникой — можно и прямо сейчас. Что мы и сделаем на примере нового SSD Kioxia CM6-V.

CM6 и CD6 — новые линейки корпоративных SSD Kioxia с поддержкой PCIe 4.0

Kioxia на рынке SSD занимает немного двойственное положение — это один из немногих производителей непосредственно флэш-памяти, но почти не уделяющий внимания потребительским накопителям. Точнее, в ассортименте компании они были практически всегда — но до последнего времени создавались в тесном партнерстве с Phison и, чаще всего, не слишком отличались от подобных же розничных накопителей… других партнеров Phison. Поэтому всегда не покидало ощущение, что компания просто старалась не портить бизнес покупателям своей памяти. В перспективе ситуация может измениться, но пока так.

Корпоративный же рынок — классическое это другое. Игроков здесь мало — фактически только те, кто способен самостоятельно работать с контроллерами и прошивками для них. Качественно же такую работу можно выполнять только в тех случаях, когда и память не где-то закупается (какая получится), а производится самостоятельно — или, хотя бы, на процесс ее разработки и производства можно влиять. Вот тогда и выходит идеальное сочетание всех компонентов для производства лучших устройств. Покупатели которых редко гоняются за модой и новизной — только если новые технологии практически оправданы. А уж пиковые попугаи в низкоуровневых бенчмарках и вовсе никого не волнуют. Во главе угла — совсем другие критерии. От стабильности поставок до стабильности скоростных характеристик — причем не пиковых, а выдерживаемых при действительно тяжелой постоянной нагрузке. И условия гарантии должны такому применению соответствовать, что без технических средств не слишком хорошо реализуется. В общем, специфический рынок со своими законами. В которых, опять же, нет ничего такого уж иррационального — разобраться несложно. Просто надо понимать, для чего то или иное делается.

В частности, как уже было сказано в начале, переход на PCIe 4.0 (а позднее — и 5.0) в корпоративном сегменте не какая-то погоня за модными тенденциями, а практическая необходимость. Поэтому, естественно, Kioxia разработала и соответствующий контроллер — скорее даже семейство таковых, поскольку в новых линейках CM6 и CD6 используются немного разные чипы. Вторая побюджетнее — так что обходится 16-канальным контроллером. По меркам потребительского сегмента — и это много: в нем и топовые SSD ограничиваются всего восемью каналами. Но 16 каналов в CD6 или и вовсе 18 в CM6 — тоже не желанием показать красивые цифры продиктовано и даже не погоней за пиковыми скоростями: без этого очень сложно выпускать накопители высокой емкости, а таковые очень нужны покупателям (не всем, но многим). В итоге в CD6 может быть установлено до 16 ТБ 96-слойной 3D NAND TLC, а CM6 существует и в модификации с 32 ТБ полной емкости — это почти вдвое больше, чем у самых емких жестких дисков! Так что и этот раунд последними давно проигран — спасает только то, что флэш стоит намного дороже. Однако в дата-центрах зачастую все равно деваться некуда — требуется такой уровень производительности, которые жесткие диски ни поодиночке, ни большими массивами в принципе не обеспечивают.

Распределение памяти — разное: в зависимости от целевого назначения. В обоих семействах есть по две линейки: -R для преимущественно чтения и -V для смешанных операций. Как обычно, достигается это разным соотношением пользовательской и резервной областей. Т. е. первый вариант рассчитан на нагрузку записи не более 1 DWPD (грубо говоря, для сохранения гарантии достаточно перезаписывать весь SSD целиком не чаще раза в день) и из каждого установленного терабайта флэша пользователю доступно 960 ГБ — а для второго допустимо 3 DWPD, обеспечивается более высокая скорость в устоявшемся режиме, но лишь 800 ГБ на каждый терабайт. Схема абсолютно стандартная — применяемая давно всеми производителями. Почему нельзя обойтись всего одним «лучшим» вариантом? Поскольку «лучший» для всех разный — платить в любом случае приходится за весь физический терабайт, так что более выносливая конструкция почти на 20% дороже. На что без явной необходимости никто из покупателей не пойдет. 

По этой же причине компания вообще выпускает две линейки, а не одну. Так-то CM6 умеет все, что CD6 — и даже больше, но дается это не бесплатно. В частности, контроллеры различаются не только количеством каналов — только CM6 поддерживает двухпортовый режим, т. е. может работать и как 1×4, и как 2×2. Для CD6 же доступен только первый вариант. Но если нужен именно он, доплачивать за (невостребованную) гибкость не имеет смысла.

В остальном же линейки очень похожи. Кроме сказанного, присутствуют модификации с расширенной функциональностью, так что для любой емкости найдутся четыре модели: «базовая», с поддержкой Instant Secure Erase (для более надежного удаления конфиденциальных данных при выводе дисков из оборота), с самошифрованием или сертификацией под FIPS 140-2 Level 2 (что актуально для некоторых рынков). Общим также является наличие аппаратной защиты от сбоев питания. И, разумеется, интерфейс PCIe 4.0 — и форм-фактор U.3.

Kioxia CM6-V 3,2 ТБ

В принципе, с учетом вышесказанного, нам для близкого знакомства с новым семейством вполне подошел бы и самый простой в новой коллекции CD6-R — все равно при использовании рассчитанной на обычные потребительские накопители методики тестирования преимуществ CM6-V «увидеть» не получится. Впрочем, и пиковые скорости у него при такой емкости повыше, да и вопрос покупки не стоял — поэтому взглянем пристальнее именно на такую модель.

blank
blank

И… почти ничего не увидим: перед нами типичный 2,5″ корпоративный SSD толщиной 15 мм — поскольку, как уже было сказано, внешне U.3 остались такими же, как U.2.

blank

Внутри тоже никаких неожиданностей — контроллер, DRAM, флэш, конденсаторы. Любые SSD — в общем-то достаточно скучные устройства, поскольку вся магия сосредоточена внутри полупроводниковых приборов. Никакого сравнения с жесткими дисками — где и точнейшая механика, и много других изящных точек приложения человеческого гения. Но вся сложность и красота играет вовсе не в их пользу — твердотельные накопители развиваются быстрее. Результатом чего являются и скорости, о которых когда-то невозможно было мечтать — да и темпы снижения стоимости хранения информации куда более высокие. Правда направление прогресса на все более плотную «упаковку» данных нравится не всем, поскольку некоторые характеристики памяти при этом при прочих равных ухудшаются, но корпоративный сегмент «страдает» от этого в меньшей степени, нежели потребительские модели. Хотя бы потому, что здесь востребованы намного большие емкости — следовательно, и больший внутренний параллелизм, который, напротив, производительность увеличивает. Поэтому применение TLC NAND давно уже ничему не мешает — и не нуждается в какой-то сложной программной маскировке недостатков, типа SLC-кэширования.

blank

Например, скорость записи практически стабильна по всему объему. Не неожиданна — как мы уже видели, подобные модели на пару терабайт емкости гарантировано способны на 2 ГБ/с в этом тесте — а тут вдвое больше. Потребительские модели сегодня «умеют» писать и 5 ГБ/с даже при меньшем объеме, но только в кэш, т. е. недолго. При длительных же нагрузках технология кэширования больше мешает, чем помогает — почему в рассчитанных на подобное использование SSD ее и не используют. Можно не заботиться о том, что скорость в какой-то неудачный момент времени просядет.

Если, конечно, соблюдены условия эксплуатации. Проблема тепловыделения существует и для потребительских скоростных SSD: поскольку быстрая обработка больших объемов информации — это солидная работа. Там она усугубляется компактным исполнением. На него многие грешат — считая корнем проблем. И тут, казалось бы, большие габариты 2,5″ форм-факторов должны проблему убрать — тепло отводить проще, да и других источников его рядом нет. Хотя верно это только если его действительно отводить. На деле никто из производителей серверных SSD не заботится о том, как устройство будет вести себя в неподобающих условиях. В отличие от потребительских моделей — где по возможности применяется правило думай за дурака. В данном же случае предполагается, что дураков среди покупателей нет, так что все компоненты системы нормальным образом охлаждаются. В серверных шума не боятся, где не хватает принудительного воздушного охлаждения — используют жидкостное.

blank

Поэтому CM6-V даже на открытом стенде без обдува ведет себя так — несмотря на то, что о теплоотводе на корпус производитель позаботился, этого еще недостаточно. Буквально после первых 650 ГБ записи контроллер разогревается до троттлинга, снизив скорость примерно до 2,2 ГБ/с. Поскольку поток данных на этом не прекращается, а окружающие условия не улучшаются, еще через 300 ГБ скорость падает уже до 800 МБ/с. В таком состоянии процесс может продолжаться долго — просто мы решили прекратить издевательства 🙂 Так что большой корпус — сам по себе не панацея. А топовые современные потребительские SSD склонны к перегреву не из-за того, что маленькие — высокая производительность автоматически приводит к росту тепловыделения. CM6-V на 3,2 ГБ совершенно официально способен потреблять в активном режиме до 19 Вт, что больше, чем у любых жестких дисков. Хотя когда-то считалось, что использование SSD позволяет повысить экологичность компьютерных систем, верно это только при небольших емкостях и при невысоких скоростях. Еще одна причина, по которой nearline-винчестеры в ближайшее время останутся на плаву: это не только дешевые, но и экономичные терабайты. Но очень медленные — так что, когда нужны быстрые, деваться некуда.

Насколько быстрые? А вот сейчас и проверим в разнообразных сценариях.

Тестирование

Методика тестирования

Методика подробно описана в отдельной статье, в которой можно более подробно познакомиться с используемым программным и аппаратным обеспечением. Здесь же вкратце отметим, что мы используем тестовый стенд на базе процессора Intel Core i9-11900K и системной платы Asus ROG Maximus XIII Hero на чипсете Intel Z590, что дает нам два способа подключения SSD — к «процессорным» линиям PCIe 4.0 и «чипсетным» PCIe 3.0.

Основным сегодня для нас будет первый — главного героя в устаревшую систему никто устанавливать не будет, поскольку для них есть в ассортименте Kioxia предыдущие линейки. Пока же за PCIe 4.0 приходится платить в явной форме, а на серверном рынке делать это «на будущее» не принято.

Есть ли смысл тестировать такие модели в обычных бытовых сценариях? А почему бы и нет. Принципиальные различия кроются не в количестве попугаев — тем более, что пиковые у бытовых SSD выше. Во-первых, благодаря SLC-кэшированию — которое в корпоративных моделях не используется. Во-вторых, для скорости декларируются в разных условиях: для пустого потребительского SSD и полностью распределенного корпоративного. Откуда и получаются разные априорные результаты — что смущает некоторых пользователей. Особенно тех, кто собирается купить такой SSD для персонального использования — делать это на самом деле иногда приходится, поскольку бытовые модели в большинстве своем имеют меньшую емкость, так что, если нужно 8-16 ТБ одним кусочком, выбора и не остается. Впрочем, в таких случаях как правило используются модели попроще: применительно к продуктам Kioxia новой линейки это будет не CM6-V, а CD6-R — без наценки за потенциальную «двухпортовость» (которой все равно невозможно воспользоваться в персональной системе), да и с меньшим количеством «резервного флэша» (платить за который все равно приходится — что увеличивает стоимость «пользовательского» гигабайта). Но сравнить быстродействие мы можем и применительно к данной модели. Просто потому, что абсолютные результаты в вакууме куда менее интересны, чем «рядом» с другими более массовыми накопителями.

Главное, что при таком раскладе нам удалось протестировать и совместимость. Непосредственной поддержки U.2 или U.3 в обычных персональных компьютерах на данный момент нет, так что необходимо использовать переходники: либо со слота M.2 (с установкой SSD в штатную корзину), либо на «большой» PCIe. Последний у нас как раз «под рукой» был, причем абсолютно «безродный» — и продавался еще как «U.2 к PCIe 3.0 х4». Никаких проблем ни первое, ни второе не вызвало — устанавливали мы U.3, а работали в режиме PCIe 4.0 x4. Возможно, что кто-то из производителей переходников все равно когда-то умудрился «накосячить» из экономии так, что их продукция нормально работать с современными SSD не сможет, но вероятность такого вообще исключать никогда нельзя. Мы же просто констатируем факт, что все обещания производителей SSD по сохранению совместимости выполнены. И это главное.

Образцы для сравнения

На данный момент по текущей версии методики мы протестировали уже четыре топовых бытовых SSD с поддержкой PCIe 4.0: Corsair Force MP600 2 ТБ (на контроллере Phison E16 — долгое время весь ассортимент SSD под новый интерфейс только такими и ограничивался), PNY XLR8 CS3140 1 ТБ (более новая разработка на Phison E18), WD Black SN850 2 ТБ (очень быстрое решение на собственной платформе компании) и XPG Gammix S70 Blade 2 ТБ (многообещающий новичок на базе контроллера InnoGrit IG5236). Corsair и WD кроме всего прочего используют и идентичную Kioxia память. А вот контроллеры у всех разные — так что в первую очередь их сравнение нас и интересует.

И для полноты картины возьмем не новый уже Intel Optane SSD 905P 1,5 ТБ. Эти накопители и по сей день остаются единственными массовыми (хотя бы относительно) SSD, не использующими флэш-память — со всеми ее недостатками. Впрочем, и достоинствами тоже — недаром Intel так и не удалось до сих пор повысить продажи 3D XPoint до сколь-нибудь сопоставимого уровня. Сейчас компания пробует это сделать уже на базе обновленных контроллеров — тоже поддерживающих PCIe 4.0. А 905P — решение более старое. Которое, тем не менее, имеет смысл сопоставить с современными скоростными и емкими SSD. Тем более, что и «пришла» эта линейка тоже с корпоративного рынка — просто немного ценили, урезали резервные области и ограничили гарантию.

Предельные скоростные характеристики

Низкоуровневые бенчмарки в целом и CrystalDiskMark 8.0.1 в частности давно уже пали жертвой в неравной борьбе с SLC-кэшированием — так что ничего, кроме самого кэша, протестировать и не могут. Однако и публикуемая производителями информация о быстродействии устройств тоже ограничена его пределами, так что проверить их всегда полезно. Тем более, что вся работа над кэшированием как раз и ведется для того, чтобы и в реальной жизни как можно чаще «попадать в кэш». И демонстрировать высокие скорости, несмотря на снижение стоимости памяти. А среди сегодняшних испытуемых есть пара устройств, SLC-кэширование вообще не использующих. Это делает тесты в CDM еще более интересными и показательными — можно также оценить и «полезность» (или ее отсутствие) самой по себе технологии.

Начнем с линейных скоростей. Хотя некоторые пользователи и считают их совсем не важными, на практике это не совсем так. Да и, вообще говоря, это основная причина увеличения скорости интерфейсов — прочие сценарии практически никогда не упираются и в PCIe 3.0, а многим более чем достаточно пропускной способности SATA600 (одна из причин наличия вау-эффекта при смене жесткого диска на SSD — и отсутствия таковых при дальнейшей модернизации).

Последовательные операции (128К Q8T8), МБ/с
  Чтение Запись Смешанный режим
Corsair Force MP600 2 ТБ 5013,1 4261,2 4503,6
Intel Optane SSD 905P 1,5 ТБ 2631,0 2316,2 2487,3
PNY XLR8 CS3140 1 ТБ 7065,4 5368,0 4403,3
WD Black SN850 2 ТБ 6597,3 5065,3 6059,1
XPG Gammix S70 Blade 2 ТБ 7075,2 6732,9 6216,7
Kioxia CM6-V 3,2 ТБ 6971,7 4261,8 5165,0

Однозначным аутсайдером, как и ожидалось, оказывается Intel Optane SSD — мало того, что PCIe 3.0, так и потенциальные возможности последнего утилизированы далеко не в полной мере. Не быстры с точки зрения сегодняшнего дня SSD на Phison E16 — компания так торопилась первой успеть занять место на рынке, что сделала «компромиссную» платформу для начала. Современные же накопители могут читать данные на скорости до 7 ГБ/с. А вот скорость записи сильно зависит от организации работы. Большая емкость позволяет корпоративным моделям вытягивать более 4 ГБ/с даже без каких-либо ухищрений, типа SLC-кэширования. А его наличие позволяет бытовым моделям «разгоняться» и до тех же 7 ГБ/с. Но недолго 🙂 Что лучше — реактивный спринтер или в меру быстрый, но выносливый тяжеловоз — зависит от конкретных задач. Для обычного персонального компьютера полезнее первый подход — тем более, что высокую скорость он позволяет получить и при относительно небольшой емкости. В серверах — второй. Почему они оба и живут на рынке параллельно — в строгом соответствии с Евклидом не пересекаясь.

Чтение 4К-блоками по произвольным адресам с разной глубиной очереди, IOPS
  Q1T1 Q4T1 Q4T4 Q4T8 Q32T8
Corsair Force MP600 2 ТБ 15194 54316 174571 260929 671473
Intel Optane SSD 905P 1,5 ТБ 65869 173049 387283 568400 568286
PNY XLR8 CS3140 1 ТБ 18515 54115 173890 253425 355581
WD Black SN850 2 ТБ 19404 68471 220798 417082 792941
XPG Gammix S70 Blade 2 ТБ 18472 71377 154534 381627 687159
Kioxia CM6-V 3,2 ТБ 12223 48306 172856 309083 716992

На коротких очередях определяющими являются задержки самой памяти — поэтому Optane безальтернативен для получения максимальной скорости. Но по мере роста нагрузки появляется все больше возможностей для оптимизации процесса — так что современные накопители на флэше оказываются уже и быстрее. Включая и CM6-V — который при «лайтовых» нагрузках проигрывает бытовым устройствам все из-за того же отсутствия SLC-кэширования. Которое в современном мире используется уже для ускорения не только записи, но и чтения.

Запись 4К-блоками по произвольным адресам с разной глубиной очереди, IOPS
  Q1T1 Q4T1 Q4T4 Q4T8 Q32T8
Corsair Force MP600 2 ТБ 66271 123260 276530 298253 279804
Intel Optane SSD 905P 1,5 ТБ 57806 155394 322943 472946 509044
PNY XLR8 CS3140 1 ТБ 82489 126330 370276 493161 503393
WD Black SN850 2 ТБ 75491 172322 339679 550253 594869
XPG Gammix S70 Blade 2 ТБ 70237 161587 268158 374477 496876
Kioxia CM6-V 3,2 ТБ 73485 142626 348781 548413 547005

А вот при записи по произвольным адресам SLC-кэширование вовсе не нужно. Нужен «запас» свободных блоков — и динамическое назначение им адресов, что позволяет по сути «линеаризовать» такие операции. Во всяком случае, пока этот самый запас блоков есть — но для низкоуровневых утилит это всегда выполнено. Да и паспортные значения для бытовых SSD озвучиваются именно в таких условиях. Для корпоративных — при полной занятости «пользовательской» области. Именно поэтому ее и ограничивают еще на заводе — как уже было сказано выше, в нашем экземпляре CM6-V флэша на самом деле 4 ТБ, а занять можно лишь 3,2 ТБ. Оставшиеся 20% как раз и нужны для того, чтобы подобные результаты можно было стабильно получать при любых условиях эксплуатации. Но ставить какие-то рекорды на коротких забегах это не помогает — поэтому просто хороший уровень производительности. На современном уровне. Причем (побочный эффект) хорошо видно, что в этих сферах отказываться от флэш-памяти не нужно: меньшие задержки 3D XPoint ничего не дают. В том числе, и в плане стабильности скоростных характеристик — за те же деньги NAND-флэш можно поставить намного больше. И увеличить как пользовательский объем, так и запас на черный день.

Чтение по произвольным адресам блоками разного размера с единичной очередью, МБ/с
  16К 64К 256К
Corsair Force MP600 2 ТБ 62,2 192,9 525,5 1742,1
Intel Optane SSD 905P 1,5 ТБ 269,8 776,4 1624,0 2155,6
PNY XLR8 CS3140 1 ТБ 75,8 153,4 473,2 1588,2
WD Black SN850 2 ТБ 79,5 222,9 639,5 2191,9
XPG Gammix S70 Blade 2 ТБ 75,7 180,6 366,2 1328,7
Kioxia CM6-V 3,2 ТБ 50,1 194,1 705,2 2120,1

В серверном окружении (в отличие от персонального) «длинные» очереди хотя бы встречаются — но большинство нагрузок, все-таки, выстроить их не успевает. Поэтому на (совсем) мелких блоках Optane по-прежнему на коне (хотя модель, напомним, уже старая и по многим параметрам ограниченная), а вот при их увеличении «умный» контроллер может многое выжать и из флэша. Самые умные здесь у Kioxia и WD. Но ничего неожиданного — «старшие» собственные разработки второй компании, по сути, имеют двойное назначение: на их базе выпускаются и топовые клиентские SSD, и серверные решения, так что они обязаны быть более универсальными. А проигрыш CM6-V на 4К в очередной раз объясняется отсутствием SLC-кэширования — на деле и у всех прочих за пределами кэша скорость мелкоблочки также упадет. И примерно до тех же значений.

Запись по произвольным адресам блоками разного размера с единичной очередью, МБ/с
  16К 64К 256К
Corsair Force MP600 2 ТБ 271,4 917,8 2270,2 3779,2
Intel Optane SSD 905P 1,5 ТБ 236,8 681,0 1388,3 1833,1
PNY XLR8 CS3140 1 ТБ 337,9 1105,5 2704,7 4646,8
WD Black SN850 2 ТБ 309,2 1041,5 2615,3 4375,1
XPG Gammix S70 Blade 2 ТБ 287,7 1061,8 2847,7 4803,9
Kioxia CM6-V 3,2 ТБ 301,0 1032,4 2694,8 4261,0

Благодаря динамической трансляции адресов разница между последовательной и произвольной записью может и полностью стереться. Происходит это только при достаточно большом размере блока — но возможно на практике. А в этих случаях, естественно, очень важен контроллер — и поддержка им быстрого интерфейса тоже. Современные топовые модели в этом плане практически эквивалентны — откуда и почти полная идентичность результатов. С одним нюансом — для бытовых SSD это верно только при ограниченном объеме работы, а вот серверные модели должны тянуть тяжелые нагрузки неограниченное (в идеале) количество времени. Откуда и немного другое распределение памяти — чего на практике и достаточно: более дорогие мероприятия (как-то полная ее замена на более быструю, но и дорогую), не требуется.

Чтение и запись по произвольным адресам блоками разного размера с единичной очередью, МБ/с
  16К 64К 256К
Corsair Force MP600 2 ТБ 77,5 228,3 613,4 1526,5
Intel Optane SSD 905P 1,5 ТБ 256,9 741,5 1503,0 2014,6
PNY XLR8 CS3140 1 ТБ 95,1 196,5 546,7 1408,5
WD Black SN850 2 ТБ 88,9 270,0 769,0 1982,4
XPG Gammix S70 Blade 2 ТБ 94,2 229,7 436,4 1374,7
Kioxia CM6-V 3,2 ТБ 65,8 248,7 827,8 1964,4

Впрочем, очевидно, что на длинных дистанциях ситуации с чистым чтением или чистой записью случаются не слишком часто — скорее будет смесь в тех или иных пропорциях. Но для современных контроллеров SSD это нормально (во всяком случае, если речь идет о продуктах такого уровня). А как-то разделить их по сферам применения уже не выходит — мощный контроллер нужен и топовому клиентскому SSD, и приличному серверному. Поэтому как уже сказано нередко и там, и там используются вообще одинаковые. И в сходных условиях ведут они себя тоже одинаково.

Работа с большими файлами

Но, как бы хороши не были показатели в низкоуровневых утилитах, достигнуть таких скоростей на практике удается далеко не всегда. Хотя бы потому, что это всегда более сложная работа — тот же CrystalDiskMark работает с небольшими (относительно) порциями информации, причем внутри одного файла. Во-первых, таковой в современных условиях практически всегда и гарантировано располагается в SLC-кэш (при его наличии) все время тестирования, во-вторых, не нужно отвлекаться на служебные операции файловой системы — реальная запись одного файла это еще и модификация MFT, и журналы (основные используемые в работе файловые системы журналируемые — и не только NTFS), так что писать приходится не в одно место последовательно, а в разные (и частично — мелким блоком). В общем, большую практическую точность дает Intel NAS Performance Toolkit. При помощи которого можно протестировать не только кэш. И не только на пустом устройстве, где он имеет максимальные размеры — а и более приближенный к реальности случай, когда свободного места почти нет. Что мы всегда и делаем.

Чтение 32 ГБ данных (1 файл), МБ/с
  Пустой SSD Свободно 100 ГБ
Corsair Force MP600 2 ТБ 2534,5 2524,1
Intel Optane SSD 905P 1,5 ТБ 2153,3 2130,9
PNY XLR8 CS3140 1 ТБ 3470,5 3140,5
WD Black SN850 2 ТБ 4013,4 3808,0
XPG Gammix S70 Blade 2 ТБ 2933,3 2842,0
Kioxia CM6-V 3,2 ТБ 2851,9 2790,6

Работа в один поток — самый частый в персональном компьютере случай, но в сервере достаточно редкий. Поэтому в накопителях корпоративного сегмента о нем не слишком-то заботятся. Впрочем, и не требуется — с учетом высокой емкости (а она даже в младших моделях таких линеек по меркам бытовой техники высокая — не говоря уже об остальных) скорость и сама по себе оказывается высокой. Может и немногим хуже, чем у потребительских топов — но и то не всех.

Чтение 32 ГБ данных (32 файла), МБ/с
  Пустой SSD Свободно 100 ГБ
Corsair Force MP600 2 ТБ 4428,5 4398,6
Intel Optane SSD 905P 1,5 ТБ 2617,2 2626,0
PNY XLR8 CS3140 1 ТБ 6957,9 6499,8
WD Black SN850 2 ТБ 6856,3 5981,6
XPG Gammix S70 Blade 2 ТБ 5095,5 5080,6
Kioxia CM6-V 3,2 ТБ 4443,8 4542,5

В многопоточном режиме картина чуть хуже. Впрочем, CM6-V тут не единственный, кто не смог повторить результаты низкоуровневых тестов. Да и вообще часть проблемы можно списать на то, что емкость высокая в среднем по рынке — но для этой линейки как раз низкая. 18-канальный (напомним) контроллер «заточен» под большее количество кристаллов флэша, чем то, которое установлено в данной модификации. Недаром же на плате осталось очень много пустых площадок — фактически такая конфигурация работает далеко не в полную силу. Хотя и такой достаточно, чтобы спокойненько выйти за рамки PCIe 3.0 x4 — или обогнать некогда старший в своей линейке Optane SSD, что еще более показательно.

Запись 32 ГБ данных (1 файл)
  Пустой SSD Свободно 100 ГБ
Corsair Force MP600 2 ТБ 4084,9 4039,1
Intel Optane SSD 905P 1,5 ТБ 2090,5 2086,7
PNY XLR8 CS3140 1 ТБ 4783,3 4689,3
WD Black SN850 2 ТБ 4693,0 4496,7
XPG Gammix S70 Blade 2 ТБ 4952,8 4559,4
Kioxia CM6-V 3,2 ТБ 4265,1 4209

Получению высокой скорости записи, как уже было сказано выше, мешает отсутствие SLC-кэширования. Поэтому с самого начала используется прямая запись во флэш — в трехбитном режиме, который медленнее однобитного. Зато и по времени практически не ограничен в то время, как SLC-кэш чисто физически не может превышать 1/3 емкости при использовании TLC-памяти или 1/4 для QLC. Даже на MLC-памяти «скоростной режим» доступен лишь для половины емкости — после чего наступает неизбежное похмелье. В данном же случае можно писать хоть 30 гигабайт, хоть 300 — хоть все 3 ТБ. Скорость останется «честной».

Запись 32 ГБ данных (32 файла), МБ/с
  Пустой SSD Свободно 100 ГБ
Corsair Force MP600 2 ТБ 4114,9 4150,8
Intel Optane SSD 905P 1,5 ТБ 2298,7 2293,8
PNY XLR8 CS3140 1 ТБ 4542,7 4548,7
WD Black SN850 2 ТБ 4706,9 4522,6
XPG Gammix S70 Blade 2 ТБ 4693,5 4379,6
Kioxia CM6-V 3,2 ТБ 4134,2 4140,7

Ну а поскольку скорость процесса записи лимитируют исключительно собственные возможности флэша и только они, многопоточный режим ничем не отличается от однопоточного.

Чтение и запись 32 ГБ данных (последовательный доступ), МБ/с
  Пустой SSD Свободно 100 ГБ
Corsair Force MP600 2 ТБ 3118,3 3048,2
Intel Optane SSD 905P 1,5 ТБ 2504,2 2510,5
PNY XLR8 CS3140 1 ТБ 4281,3 3715,1
WD Black SN850 2 ТБ 4599,6 4213,9
XPG Gammix S70 Blade 2 ТБ 4140,5 3860,6
Kioxia CM6-V 3,2 ТБ 3419 3407,7

А вот смешанный последовательный режим мог бы быть и более быстрым. В старших по емкости модификациях — возможно, и будет: поскольку тут верно сказанное выше про чтение.

Чтение и запись 32 ГБ данных (произвольный доступ), МБ/с
  Пустой SSD Свободно 100 ГБ
Corsair Force MP600 2 ТБ 2099,8 2089,4
Intel Optane SSD 905P 1,5 ТБ 1643,6 1681,4
PNY XLR8 CS3140 1 ТБ 2810,5 2518,8
WD Black SN850 2 ТБ 3054,7 2535,7
XPG Gammix S70 Blade 2 ТБ 2604,0 2482,0
Kioxia CM6-V 3,2 ТБ 2453,5 2409,9

Произвольный доступ у топовых SSD не слишком отличается от последовательного. Так что, опять же, верно сказанное выше. И, в любом случае, показательно сравнение не с современными топовыми потребительскими моделями (в конце концов, их на высокие пиковые показатели натаскивают специально — и с разными ухищрениями) — а с Optane SSD. Как уже было показано весной, при обработке больших объемов информации дорогая память уже особо ничего не дает и при сравнении с SSD аналогичной емкости и с тем же интерфейсом. А вышедшие с тех пор накопители вообще уже ушли дальше. Понятно, что для Optane эти сценарии — вовсе не то, ради чего такая память создавалась, да и модели новой коллекции (тоже обзаведшиеся мощным контроллером с поддержкой PCIe 4.0) стали работать существенно быстрее. Но они и существенно дороже. Поэтому темпы наращивания количества флэша в дата-центрах были и останутся более высокими. И торопиться менять его на что-то другое пока вовсе не требуется.

Комплексное быстродействие

blank
Краткое знакомство с новым тестовым пакетом PCMark 10 Storage

На данный момент лучшим комплексным бенчмарком для накопителей является PCMark 10 Storage, с кратким описанием которого можно познакомиться в нашем обзоре. Там же мы отметили, что не все три теста, включенных в набор, одинаково полезны — лучше всего оперировать «полным» Full System Drive, как раз включающим в себя практически все массовые сценарии: от загрузки операционной системы до банального копирования данных (внутреннего и «внешнего»). Остальные два — лишь его подмножества, причем на наш взгляд не слишком «интересные». А вот этот — полезен в том числе и точным измерением не только реальной пропускной способности при решении практических задач, но и возникающих при этом задержек. Усреднение этих метрик по сценариям с последующим приведением к единому числу, конечно, немного синтетично, но именно, что немного: более приближенных к реальности оценок «в целом», а не только в частных случаях, все равно на данный момент нет. Поэтому есть смысл ознакомиться с этой.

PCMark 10 Storage Full System Drive
  Пустой SSD Свободно 100 ГБ
Corsair Force MP600 2 ТБ 2277 2272
Intel Optane SSD 905P 1,5 ТБ 4544 4668
PNY XLR8 CS3140 1 ТБ 2557 2012
WD Black SN850 2 ТБ 3009 2771
XPG Gammix S70 Blade 2 ТБ 2444 2332
Kioxia CM6-V 3,2 ТБ 2992 2948

Что забавно, в бытовом окружении «перспективность» Optane SSD просматривается куда отчетливее. Когда-то подобный вау-фактор запустил лавину смены «механики» на флэш. Можно ли рассчитывать на повторение данной ситуации? Три года назад было можно (и в Intel явно об этом подумывали) — однако фокус явно не удался. Во-первых, размер этого самого «вау» оказался недостаточным. Во-вторых, в отличие от ситуации десятилетней давности, ему не поспособствовали цены. Тогда-то флэш дешевел быстрее «механики», что вовлекало в процесс все новых и новых пользователей. А последние годы он дешевел быстрее не только ее — но и Optane. Да еще и производительность топовых SSD на NAND постоянно росла, сокращая отставание.

Особенно интересно последнее выглядит как раз на примере CM6-V. Для него, все-таки, бытовые сценарии вовсе не целевое назначение, так что никто и никогда не занимался их специальной оптимизацией. Ну и что, собственно? Сила солому ломит. Такое сочетания контроллера и памяти (в том числе, и ее количество) привело к появлению очень быстрого и при таких нагрузках накопителя. С год назад таких (среди флэшовых моделей) и близко не было — да и сейчас сопоставимых очень немного. Хотя затевалось все совсем для другого.

Итого

Как уже не раз было сказано, иногда знакомиться с процессами, происходящими в сегменте корпоративных SSD, интересно и полезно. И с представителями таковых — тоже. Включая и тесты по унифицированной методике — пусть и заточенной под потребительские модели. Вовсе не потому, что корпоративные SSD могут как-то конкурировать с потребительскими за внимание… потребителя. Хотя иногда и такое тоже бывает — например, если нужен накопитель высокой емкости, причем именно одиночный, а не несколько поменьше, то альтернативы таким устройствам нет: «бытовуха» и сейчас чаще всего ограничивается хорошо если 4 ТБ (а 8 ТБ на QLC — и вовсе очень специфический товар).

При этом общего между устройствами этих классов намного больше, чем существенных различий. А эволюционируют они по-разному просто потому, что решают разные задачи. Емких потребительских моделей практически нет именно потому, что большим спросом они пользоваться не могут: дорого очень. Отсюда и задача увеличить производительность при небольшой емкости — любыми программными средствами. Компактные форм-факторы — поскольку нет нужды в лишнем текстолите. Развитые функции энергосбережения — потому что все равно бо́льшую часть времени SSD спит, ожидая запросов системы, так пусть при этом и энергию зря не потребляет. Что из этого верно для серверных устройств? Практически ничего. Разве что сэкономить их покупатели тоже не против — но прекрасно понимают, что не всегда это возможно. Поскольку нужна высокая емкость и интеллектуальные контроллеры, чтобы с ней эффективно управляться. А от производительности требуются не высокие пиковые показатели, а стабильность: чтоб задержки не росли и скорость передачи данных не падала неожиданно при любой нагрузке и в любом состоянии. Впрочем, в немалой степени этого помогает достичь как раз высокая емкость, она же и среднее быстродействие повышает до уровня потребительских накопителей, причем сама по себе — дополнительные ухищрения уже не требуются. Требуются лишь мощные контроллеры — с поддержкой современных интерфейсов и возможностью немного заглянуть за горизонт: чтобы и к завтрашнему дню сегодняшние разработки были готовы уже сегодня.

Как раз поставленные задачи «шестая» линейка корпоративных SSD Kioxia и решает, причем решает очень хорошо. Здесь мы видим и поддержку PCIe 4.0, и реализацию форм-фактора U.3, и емкости до 30 ТБ. То есть все, что должен уметь современный SSD такого уровня. При этом компания предлагает не одно решение для всех (часто в итоге оказывается, что кому-то лишнее — а кому-то не хватает), а гибкий ассортимент из разных моделей. Можно выбрать именно необходимую функциональность и не платить за избыточные возможности.

↓