Вычислительный SSD ScaleFlux CSD 2000 Series

Компания ScaleFlux представила второе поколение вычислительных накопителей CSD 2000 Series.
Вычислительные хранилища, в отличие от обычных SSD, могут взять на себя частичную обработку хранимых данных за счет собственного микрокомпьютера.

Вычислительные флеш-накопители ScaleFlux CSD 2000 увеличивают емкость в четыре раза, повышают производительность вдвое и вдвое сокращают расходы на флэш-память по сравнению с обычными твердотельными накопителями.

ScaleFlux CSD 2000 в исполнении U.2. Источник: https://blocksandfiles.com

Техническая реализация

CSD 2000 ScaleFlux включает в себя микрокомпьютер на базе ПЛИС Xilinx в паре со стандартным 2-8 ТБ флэш-накопителем 3D NAND. Он использует готовые пакеты кода для ускорения Aerospike, Apache HBase, Hadoop и MySQL, OpenZFS и Ceph.

Компоненты ScaleFlux CSD 2000. Источник: https://blocksandfiles.com

Микрокомпьютер CSD 2000 производит сжатие/распаковку данных GZIP «на лету», без дополнительных задержек. Это удваивает эффективную емкость — емкость 4 ТБ и 8 ТБ накопителей увеличивается соответственно до 8 и 16 ТБ.

Преимущества CSD 2000

Производительность приложения также улучшается.
В частности:
Aerospike ACT 3.2 — количество транзакции в секунду (tps) увеличиваются в 1,5 раза;
MySQL SysBench — количество транзакции в секунду (tps) увеличиваются в 1,5 раза;
PostgreSQL SysBench — производительность операции update_non_index увеличивается в 28 раз.

По данным ScaleFlux, CSD 2000 обеспечивает на 40-70 процентов больше операций ввода-вывода в секунду, чем обычные NVMe SSD при смешанных нагрузках чтения и записи.
Производительность твердотельных накопителей NVMe обычно снижается по мере увеличения доли операций записи в любой рабочей нагрузке. CSD 2000 поддерживает производительность SSD на постоянном уровне независимо от сочетания операций чтения и записи.
Помимо прочего, за счет сокращения объема записываемых данных, выносливость накопителя может увеличиться в три-шесть раз.

Некоторые цифры:
«Для случайного чтения мы не можем улучшить среднюю задержку, потому что задержка и скорость получения данных определяются задержками чтения с носителя NAND. Но для случайной записи мы имеем улучшаем характеристики от 200% до 600%».
«Если вы говорите о сравнении со средними твердотельными накопителями — скажем, с диском QLC от Intel — у них 34000 операций ввода-вывода в секунду при произвольной записи. Мы можем разогнать его до 180000. Это почти в шесть раз, то есть, почти на 600 процентов больше, чем у Intel».

CSD 2000 компонуется в двух форм-факторах — 2,5″ U.2 и плата расширения PCIe HHHL.

ScaleFlux CSD 2000 в исполнении AIC HHHL и U.2. Источник: https://blocksandfiles.com

Следующее видео показывает эффективное решение для Hadoop кластера на базе twin платформ Supermicro. Связь тут с ScaleFlux не очевидна, но если речь идет о паре Hadoop + MySQL — да, присутствие ее становится оправданным.

Не за горами уже третье поколение!

ScaleFlux уже разрабатывает собственную SoC на базе Arm (System-on-Chip) для накопителей третьего поколения. Они будут иметь гораздо более высокую скорость, меньшее энергопотребление, меньшую стоимость и значительно больше функций, чем включается в FPGA Xilinx.
Привод третьего поколения (возможно, CSD 3000), может появиться позже во второй половине 2021 года.

О компании ScaleFlux.
Над стандартом вычислительных хранилищ (Computational Storage) работают две отраслевые организации — SNIA и NVMe. 
В 2018 году в SNIA была создана рабочая группа, и ScaleFlux была одним из основателей этой рабочей группы. Компания ScaleFlux стала первым участником, который смог придумать продукт и начать его поставки с июня 2019 года.

ScaleFlux работает не только с заказчиками центров обработки данных, но и с OEM-производителями серверов, например: HPE, Dell, Lenovo и Inspur.


Ссылки по теме:
https://blocksandfiles.com/2020/04/20/scaleflux-csd-hardware-compression-computational-storage/
https://blocksandfiles.com/2021/02/22/scaleflux-ceo-hao-zhong-interview/