16 сентября 2020 г.

Сегмент СХД уверенно растет, но внутри него происходит разное. Совокупная емкость хранения в СХД по выросла на 5,1% за год, по данным IDC за второй квартал текущего года — с 16,3 до 17,1 Эксабайт. Однако эта цифра описывает далеко не все, происходящее в сегменте. Начнем с того, что объем данных, производимых в мире, и много больше этих Эксабайт, и растет быстрее, чем совокупная емкость систем хранения.

В мире было произведено 33000 Эксабайт информации в 2018 году, а в 2025 году соответствующий объем будет 175000 Эксабайт (то есть 33 и 175 Зеттабайт, соответственно), по прогнозам совместного исследования IDC и Seagate. Очевидно, что емкости хранения драматично — на порядки — отстают от объемов данных, генерируемых человечеством, причем это отставание нарастает. Получается, что большинство получаемых данных будут утеряны безвозвратно, в BigData не попадают и для последующего анализа будут недоступны.

Часть данных обрабатывают «на границе сети», а в хранилища попадает только «дайджест», полученный на основе EDGE-вычислений. Часть данных хранят ограниченное время, например, записи систем видеонаблюдения. Часть данных вообще «для однократного использования» — например, «прикольную фотку» получили, переслали, посмотрели и стерли, IIoT-датчик передал данные, система управления на их основании приняла определенные решения и т. д. Но все эти данные в хранилище не попали, соответственно, для последующего анализа недоступны, для обучения AI-систем неприменимы, как для ряда других задач, а утеряны навсегда.

Как видно, в современных условиях использование «новой нефти» оказывается удивительно нерациональным. Однако из этих общих, почти философских замечаний можно сделать несколько вполне практических выводов для игроков российского ИТ-рынка, имеющих бизнес-значение в современном мире, который становится все более data-driven.

  • Акцент на EDGE — ключевой тренд. Подавляющее большинство данных должно быть обработано «по месту», потому что хранить их негде, а поэтому передавать куда-то попросту незачем. Тут следует напомнить, что пропускная способность коммуникационных каналов не беспредельна, поэтому данный ресурс тоже требует рачительного отношения. На границе сети данные получили, тут же их обработали, на основе полученной информации сделали оперативные выводы, и данные стерли. В лучшем случае «наверх» для размещения в СХД будет передана информация, полученная в ходе EDGE-вычислений (дайджест от полученных, обработанных, но несохраненных полных данных), а сами данные в некоторых случаях будут размещены для временного хранения (упомянутый выше пример с системами видеонаблюдения, данные с которых хранят какое-то время, на протяжении часов или недель, в зависимости от ситуации).
  • Увеличение объемов СХД идет, причем довольно быстро. Но тут важно помнить, что новые СХД приходится покупать не только под новые данные, но и под другие актуальные задачи. Во-первых, под хранение резервных копий, причем как критически важных данных, так и бэкапа программной составляющей ИТ-инфраструктуры — это необходимо для быстрого восстановления после аварии (аппаратных сбоев, хакерских атак, некорректных действий персонала и т.д.), что является важным для обеспечения непрерывности бизнеса. Во-вторых, новые системы нужны в замену старых СХД, отработавших свой срок. Legacy-данные тоже надо хранить, а их размещение на винчестерах десятилетней давности или даже на ленточных библиотеках — а местами есть и такое! — создает очевидные проблемы с оперативным доступом к данным, размещенным таким образом, а также понятные риски потери последних. Винчестеры как устройства, содержащие механику, имеют довольно ограниченный срок эксплуатации, да и магнитные ленты тоже не вечны — со временем с их подложек начинает осыпаться магнитный слой.
  • Увеличение вычислительных мощностей — как в EDGE, так и в ЦОДах — чтобы возможно большее количество данных успеть обработать «на лету», прежде чем они будут утрачены окончательно.
  • Учитываем локальные специфики. Например, если во втором квартале пятерка глобальных лидеров в поставках СХД на глобальном рынке выглядела как Dell EMC, Hewlett Packard Enterprise, NetApp, IBM и Huawei, по данным IDC, то на российском рынке все совершенно иначе: Huawei, YADRO, Dell, HPE и Hitachi. Кроме того, если глобальный рынок по результатам квартала показал падение, то российский — рост.
  • Software-definition — одно из ключевых требований, актуальное как к вычислительной составляющей инфраструктуры, так и к СХД. Такой подход обеспечивает нужную эластичность, иначе инфраструктура устареет довольно быстро, что неприятно для финансовых показателей, описывающих инвестиции в инфраструктуру.

Если мы посмотрим на комментарии аналитиков IDC к данным второго квартала на рынке СХД, то там особый акцент сделан именно на программно-определяемые системы. Например, говоря об успехах IBM в сегменте СХД — а у вендора ситуация гораздо лучше средней по рынку — аналитики отметили ориентацию компании на разработку софта и услуг, построенных на базе семейства программно-конфигурируемых решений IBM Spectrum Storage. Отмечая серьезные проблемы у HPE, квартальный отчет IDC подчеркивает особые успехи в росте заказов на HPE Primerа, интеллектуальных платформ хранения нового поколения. А про успехи Dell EMC в области развития программно-определяемых хранилищ данных — в PowerStore и в других линейках — мы поговорим отдельно.

Остальные тренды в СХД известны. Во-первых, это популяризация all-flash-решений, которые заняли 40% в объеме продаж и сравнялись по этому параметру с гибридными flash/HDD-системами, а на «старые добрые» системы хранения на винчестерах все еще приходится около 20% новых продуктов в рассматриваемом сегменте. Во-вторых, активное использование софтверных решений — в том числе, на AI — чтобы увеличивать надежность и эффективность работы СХД в реальных условиях эксплуатации. Но про AI и другие софтверные решения для оптимизации работы аппаратных систем мы поговорим в следующий раз.

Источник: Александр Маляревский, внештатный обозреватель CRN/RE