Формат вебинаров в последние несколько месяцев недвусмысленно доказал свою эффективность. Хотя у привычных офлайновых мероприятий немало бесспорных преимуществ, онлайн-семинары и лекции вполне адекватны как средство налаживания коммуникаций между продуктовыми экспертами вендоров и дистрибьюторов, с одной стороны, и ИТ-специалистами партнёров и заказчиков — с другой. Компания Lenovo на специализированном сайте lenovogames.ru предлагает доступ ко множеству проведённых ранее вебинаров, посвящённых современным технологиям для центров обработки данных.

Вебинары рассчитаны на широкую аудиторию ИТ-специалистов, как на тех, кто пока мало знаком с предложениями Lenovo для ЦОДов, так и на действующих заказчиков и партнёров компании. Читателям CRN/RE наверняка будет интересно ознакомиться с представленной в этой серии презентацией Антона Котцова, менеджера по продукту СХД, в которой он рассмотрел некоторые технологии ONTAP в устройствах серии Lenovo DM. Системы хранения в последние годы коренным образом трансформируются; традиционные инструменты накопления и анализа данных перестают справляться с актуальными задачами современности. Необходимы более мощные аппаратно-программные средства и стандартизированное, централизованное управление данными. Именно такие средства предлагает Lenovo в своих СХД серии DM.

Аппаратная архитектура

В модельном ряду Lenovo присутствуют две серии СХД, и одна из них — DM — базируется на технологиях ONTAP стратегического партнёра Lenovo, компании NetApp. Суть подхода ONTAP — в том, чтобы разделить физический и логический уровни хранения данных, обеспечив для конечного пользователя и приложений удобный и простой доступ к ним, одновременно предоставляя администраторам возможность расширять доступные объёмы хранения без необходимости приостанавливать работу СХД и даже без сколько-нибудь заметного влияния на её производительность. Иными словами, ONTAP для систем хранения представляется неким аналогом серверной виртуализации, но с выраженным акцентом на надёжность хранения данных и их гарантированную доступность.


Рис. 1. Контроллер СХД Lenovo серии DM

По своей внутренней архитектуре система на базе ONTAP отличается от прочих двухконтроллерных систем хранения, доступных на рынке. СХД Lenovo серии DM строятся по кластерному принципу начиная уже с отдельного узла. С точки зрения СХД на базе ONTAP эти узлы составляют один большой кластер. В рамках одного кластера можно на текущий момент объединить до 24 узлов, если этот кластер файловый. Если же требуется работать с СХД как с универсальным кластером, если нужна поддержка различных протоколов, блочного доступа, iSCSI, FC и т. п., то в таком режиме кластер можно наращивать до 12 узлов.

В самом контроллере помимо необходимых компонентов, таких как процессор, кэш, порты, слоты расширения, присутствует важнейший элемент, который является отличительным признаком ONTAP-систем, — модуль NVRAM, энергонезависимой памяти. Именно её применение позволяет надёжно защищать данные от всевозможных сбоев, включая потерю питания, недоступность или перезагрузку контроллера.


Рис. 2. Принципиальная схема НА-пары и её реализация в стойке

Два ONTAP-контроллера с коммуникационными шинами между ними образуют так называемую НА-пару (от high availability, «высокая доступность»). В современных СХД минимально монтируются два контроллера, и дальнейшее наращивание их количества также идёт попарно. Каждый контроллер из состава НА-пары имеет непосредственный доступ не только к «своим» накопителям, но и к дискам, находящимся под прямым управлением второго контроллера из пары. Этот принцип организации НА-пары — переключение при отказе, failover, — подразумевает, что в любой момент в случае какого-то сбоя узел-партнёр примет на себя контроль над дисками своего соседа. Коммуникации между узлами НА-пары обеспечивает шина HA-interconnect. Кроме того, имеются ещё и межкластерные соединения на основе сети, которая оперирует в пределах ONTAP-систем.

Для служебных операций — при настройке или в ходе техобслуживания — доступ к контроллерам возможен по их собственным выделенным IP-адресам. Во всех же остальных случаях доступ к узлу хранилища данных производится исключительно через единый кластерный IP. Именно так реализуется полноценная кластерная ONTAP-система: через выделенную сеть, предназначенную для доступа к данным, пользователи и приложения получают доступ к информации на СХД по различным протоколам (Ethernet, FC и т. п.). Контроллеры в Lenovo DM соединяются друг с другом через выделенные порты отдельными кабелями, которые всегда входят в комплект поставки СХД: это так называемая switchless-схема соединения. Для системы хранения с двумя контроллерами этого вполне достаточно. Если же контроллеров в системе больше двух, необходимо реализовывать уже switched-схему, когда внешние по отношению к контроллерам коммутаторы используются для организации межкластерного соединения.


Рис. 3. Организация межкластерных соединений посредством внешних коммутаторов (switched)

Важная отличительная черта ONTAP-системы — её конструктивная гибкость. В рамках одного кластера можно совместить СХД разного уровня и даже разных поколений. Именно межкластерные соединения позволяют сформировать единое пространство имён, организовать единую адресацию и единое управление. В частности, в пределах ONTAP-систем обеспечивается отличная совместная работа СХД разных моделей, разных поколений, даже с различными типами накопителей, — это могут быть и дисковые, и all-flash, и гибридные модели.

Физический и логический уровни

В ONTAP-системах используются не самые широко распространённые типы RAID. Дело в том, что запись, которую организует ONTAP на диски, производится т. н. единым страйпом на уровне блоков (block-level stripe). В кэше формируется единая порция данных (страйп) для всех дисков системы, и эта порция разом записывается на весь набор представленных в конфигурации накопителей. Ради повышения производительности и прозрачности этой операции и были разработаны особые типы RAID.


Рис. 4. Разновидности RAID-технологий, применяемых в системах ONTAP

Первым таким особым типом стал RAID 4 с выделенным диском для хранения контрольных сумм (pairity). По надёжности хранения данных он сопоставим с более широко применяемым в системах хранения RAID 6, но в плане накладных расходов — дополнительной нагрузки на аппаратную часть контроллера — он гораздо производительнее, практически на уровне RAID 10. По мере наращивания числа накопителей в дисковой полке встал вопрос о дополнительной защите, ответом на который было появление второго выделенного диска для хранения «диагональных» контрольных сумм (doluble pairity, DP). RAID DP начали применять в 2003 г., и сегодня этот тип организации массива является основным для ONTAP-систем. Наконец, для множественных дисков большой ёмкости предназначен RAID TEC с тремя наборами контрольных сумм, линейной, диагональной и антидиагональной.


Рис. 5. Рекомендации по построению RAID-групп для ONTAP-систем

Одна или более RAID-групп (желательно, с одним и тем же числом накопителей в каждой) в ONTAP-системах объединяются в контейнер, называемый агрегатом. При этом агрегат, если он образован более чем одной группой, может подразделяться на так называемые плексы (plex): это идентичные по информационному наполнению копии. Плекс — в известном смысле, аналог массива с зеркалированием на уровне RAID-групп — оправдывает себя с точки зрения тех заказчиков, которые особенно трепетно относятся к своим данным и хотят иметь дополнительную защиту от любых непредвиденных ситуаций, например от таких, как выход из строя дисковой полки целиком. Плексы, составляющие один и тот же агрегат, могут быть физически разнесены на разные полки, усиливая тем самым надёжность СХД в целом. Та же конструкция с двумя зеркальными плексами применяется, кстати, в таком распространённом решении по защите данных, как Метрокластер.


Рис. 6. Работа с накопителями в системе ONTAP на физическом уровне

На физическом уроне агрегат может состоять из одной или нескольких RAID-групп. Дополнительно в дисковых полках присутствуют диски горячего резерва (hot spare), общие для всей НА-пары. Они не входят в рамки агрегатов и могут быть использованы в любой момент для подмены любого вышедшего из строя накопителя в пределах HA-пары. Агрегат допускает расширение за счёт добавления либо дополнительной RAID-группы целиком (предпочтительно того же размера, что и у уже имеющихся, — это оптимально с точки зрения производительности), либо путём включения в каждую группу добавочных накопителей.

Важно подчеркнуть: для переконфигурации с расширением тех типов RAID-массивов, которые используются в ONTAP, нет необходимости производить перевычисление всей их структуры, как это было бы в случае RAID 5 и 6. Чётность для RAID 4, DP и TEC высчитывается линейно, поэтому пересчёт производится крайне быстро, а данные могут быть спокойно перераспределены по всему пространству RAID-группы, так что запись на добавленные диски начинается сразу же после их установки и инициализации.


Рис. 7. Логические структуры и их физическое основание в системах ONTAP

Над физической базой систем ONTAP надстроена логическая структура: на дисковых агрегатах при помощи контроллера формируются тома (volumes), на уровне которых как раз и производятся основные операции с данными. И это очень сильно отличается от того понятия тома, которое вводится для классических блочных СХД. По сути, напрямую к ONTAP-тому не обращаются ни пользователи, ни приложения, нуждающиеся в данных, которые хранятся в этой системе. На базе тома здесь создаются либо LUN (блочные разделы), либо файловые ресурсы. И уже только они непосредственно доступны пользователям, хостам, приложениям.

Настолько недвусмысленная отвязка логической структуры размещения данных в ONTAP-системе от уровня их физического хранения на дисках и в RAID-массивах позволяет реализовывать чрезвычайно развитые средства виртуализации в пределах подобных СХД; в частности, Lenovo серии DM. Здесь на помощь приходит SVM (Storage Virtual Machine): по сути, виртуальная машина, которая работает внутри DM-системы и позволяет локализовать том, сформировать для него общее пространство имён, предоставить возможности управления собственному администратору, выделить собственные логические интерфейсы. SVM действует как виртуализованная СХД внутри DM-системы.

Интересно, что в последней версии операционной системы ONTAP, 9.7, многие моменты, связанные с созданием агрегатов, томов и прочего в значительной мере скрыты внутри системы. Начинающему администратору вовсе не надо знать обо всей этой структуре: достаточно воспользоваться программными помощниками (wizards) при создании конфигурации. Разумеется, более сведущему администратору доступны и управляющие команды глубокого уровня, которыми в последней версии интерфейса особенно легко и удобно пользоваться, — вплоть до возможности вручную создавать тома и SVM под различные задачи.

Для СХД Lenovo DM подключения можно организовывать на различных уровнях. Самый нижний — физические порты; их можно агрегировать, создавать единые интерфейсные группы. В рамках одной такой группы допустимо создание отдельных виртуальных LAN (VLAN) под разные протоколы, нужды, типы доступа. И уже в рамках этих VLAN существуют логические интерфейсы — LIF; LIF содержит IP либо WWN. Логические интерфейсы для данных (data LIF) функционируют в пределах SVМ и предназначены для доступа к хранящимся в ней данным.


Рис. 8. Структура организации сетевых интерфейсов в СХД Lenovo DM

Функциональность

На базе архитектуры ONTAP реализована богатая функциональность, наиболее важными с практической точки зрения элементами которой являются мгновенные снимки и полные копии. Мгновенные снимки (snapshots) — неотъемлемая часть самой природы ONTAP, поскольку сама технология использует такую же технологию, снимки внутри системы — consistency points применяются для собственных нужд. Эти внутренние мгновенные снимки применяются, чтобы сбрасывать состояние кэш-памяти узла СХД на накопители. И ровно такая же технология мгновенных снимков состояния системы доступна для пользовательских нужд. На один том число таких снимков может достигать 1023.


Рис. 9. Операции с мгновенными снимками в рамках архитектуры ONTAP

Мгновенные снимки на ONTAP-системах работают по технологии redirect-on-write. Суть её в том, что любой LUN или файл пользователя на логическом уровне — это набор ссылок на блоки, которые лежат внутри тома. Именно поэтому для создания мгновенного снимка нет необходимости производить какие-либо дополнительные действия: нужно просто зафиксировать карту ссылок на те блоки, с которыми работает в настоящий момент данный пользователь. Запись информации не приводит к изменению блоков: новые данные пишутся на свободное место в пределах тома, и потому не возникает дополнительных накладных расходов на то, чтобы переписать блок, пересчитать чётность, сделать перезапись контрольных сумм: запись производится в один проход. Ссылки на snapshot сохраняются, и блок, который на взгляд данного пользователя был перезаписан, на деле не изменился. Это и позволяет мгновенно восстанавливать данные, которые извне СХД рассматриваются как удалённые и перезаписанные. Только после удаления мгновенного снимка состояния системы блоки фактически помечаются как свободные, поскольку исчезают указания на них.

На базе всё того же механизма мгновенных копий построены виртуальные полные копии, FlexClone, особенно удобные с точки зрения систем, к которым предъявляют высокие требования в плане возможностей тиражирования, использования и мгновенного создания больших взаимосвязанных консистентных сред — для тестирования ПО, создания патчей, применения апгрейдов и т. п. Через snapshot пользователь получает доступ к виртуальной полной копии, и если производит с ней операции записи, то оригинальные данные не изменяются. Поэтому в любой момент можно получить полный набор данных по состоянию на любой момент времени, не беспокоясь о возможной их потере из-за доступа сторонних пользователей или приложений.


Рис. 10. Сравнение технологий кэширования Flash Cache и Flash Pool

На всю вышеописанную функциональность органично накладываются возможности кэширования, которые в ONTAP-системах представлены, в основном, технологиями Flash Cache и FlashPool. Flash Cache — это дополнительный уровень кэширования на уровне контроллера в гибридных системах, особенно востребованных рынком в последнее время. В каждом контроллере систем Lenovo DM с индексом Н обязательно реализован Flash Cache: по сути, NVMe-накопитель, взаимодействующий с контроллером на шине PCIe. Используется он только для кэширования чтения, — отсюда максимальная отдача при минимальных задержках. Другой тип кэширования, FlashPool, — уже применяется для накопителей, входящих в состав агрегатов. Реализуется FlashPool за счёт кэширующего слоя на базе SSD на уровне дисковой полки и отличается тем, что работает и на запись тоже.

Системы на базе ONTAP очень легко настраиваются, — особенно в версии 9.7. С точки зрения возможностей настройки они буквально неисчерпаемы: если есть заказчики со сложными задачами, которые требуют тонкой настройки, обеспечения гарантированной производительности на определённых задачах, — всё это возможно благодаря глубокой виртуализации и отделению логического уровня хранения данных от физического. Lenovo предлагает для своих DM-систем онлайновый инструмент подбора конфигурации, который позволяет детально распределить предполагаемую нагрузку по накопителям, по агрегатам, тщательно всё выверить и получить максимально пригодную для эксплуатации систему под нужды конкретного проекта и конкретного заказчика.

Конфигуратор этот доступен партнёрам вендора: они могут выполнить подбор конфигурации на партнёрском портале Lenovo по ТЗ своего клиента, либо заказчик сам волен обратиться к пресейл-менеджерам Lenovo со своими вопросами. Кроме того, компания подготовила учебную программу по СХД DM-серии, которая уже осенью 2020 года станет доступна для партнёров, а затем будет распространяться как на партнёров, так и на заказчиков. Узнать больше о технологических трендах и решениях для дата-центров можно на сайте lenovogames.ru где компания Lenovo собрала выступления своих ведущих экспертов по ЦОД.

Статья на правах рекламы