28 апреля 2023 г.

Увеличить
Сергей Громов
Увеличить
Рис 1. Степень пригодности отечественных СУБД для решения аналитических (OLAP) и транзакционных (OLTP) задач. Источник: отчет «СУБД-круг Громова 2023»

Вышел в свет 418-страничный отчет «СУБД-круг Громова 2023», в котором приведен обзор систем управления базами данных (CУБД), представленных на российском рынке. Он, среди прочего, содержит классификацию, сравнение, описание и детальные характеристики свыше двух десятков СУБД различной степени известности. В ряде случаев приводятся ссылки на Единый реестр отечественного ПО, где эти СУБД упоминаются.

В исследовании СУБД разделены на 5 больших классов: 1) ориентированные на OLAP-задачи, 2) основанные на PostgreSQL, 3) основанные на Hadoop, 4) являющиеся свободным (и почти свободным) ПО, не входящие в предыдущие группы, 5) остальные.

Разумеется, есть и другие классификации СУБД. Так, например, считается, что первая в мире СУБД -IDS (Integrated Data Strorage), ведущая свою историю с 1963 г. — была основана на сетевой модели данных. Следующей вехой стала выпущенная в 1968 г. иерархическая СУБД IMS (Information Management System), разработанная IBM и North American Aviation для Лунной программы. Промышленностью эта СУБД до сих пор используется на мейнфреймах.

Фундаментальным этапом стала публикация Эдгаром Ф. Коддом в 1970 г. статьи «Реляционная модель данных для больших общих банков данных», приведшая к созданию целого класса реляционных СУБД (РСУБД), которые доминируют и по сей день. В 1973 г. стартовал проект исследовательской реляционной СУБД System R, доказавшей перспективность РСУБД. В ней впервые использовался язык SQL (тогда он назывался SEQUEL — Structured English QUEry Language, позже переименован из юридических соображений, но многие продолжают произносить SQL по-старому — "сиквел«).Первой коммерческой РСУБД, реализующей язык SQL, стала Oracle, разработка которой с опорой на опыт System R началась в 1977 г., а выпущена на рынок она была годом позже.

Затем для обработки своих данных ИТ-гиганты стали создавать простые распределенные СУБД. Все эти системы стали называть NoSQL (без SQL), хотя по существу подразумевается Not Relational (нереляционные). Также их называют постреляционными СУБД.

Однако в последнее время все больше NoSQL-систем начинают поддерживать полноценный SQL (или хотя бы сильно приближенный к нему язык запросов) и давать транзакционные гарантии в тех случаях, когда это необходимо. В 2011 г. для этого класса СУБД был предложен термин NewSQL («новый SQL»). Более того, использование языка SQL вышло за пределы СУБД — поддержка SQL появилась в связующем программном обеспечении (Kafka, Flink) и в системах, предназначенных для работы с данными в кластерах Hadoop (Spark, Phoenix, Impala).

Перспективы

Так называется один из разделов данного исследования. В нем выделены 6 тенденций:

  1. Будет и дальше расти поддержка классическими СУБД новых моделей данных. В большинство реляционных СУБД (РСУБД) добавить поддержку хранения ключ-значение и графов относительно несложно, поэтому частично она уже многими поддерживается, но будет еще больше и разнообразнее.
  2. Будет нарастать конвергенция между OLTP (Online Transaction Processing) и OLAP (Online Analytical processing) системами. Она нужна и для новых внедрений, потому что важно видеть аналитику в реальном времени, и для миграции с Oracle Database, где такая поддержка есть. В первую очередь такое усовершенствование напрашивается для PostgreSQL, тем более что есть свободная OLAP-СУБД GreenPlum, основанная именно на PostgreSQL. А NoSQL СУБД будут все строже обеспечивать изоляцию транзакций, типичную для РСУБД.
  3. Будут расти возможности резервного копирования и создания кластеров высокой доступности в том числе и для классических СУБД. Из формата экзотических дополнений они будут переходить в стандартную конфигурацию, поддерживаемую «из коробки».
  4. Использование иностранных коммерческих СУБД будет уменьшаться. Больше всего будет увеличиваться использование свободного ПО и российских СУБД, основанных на свободном ПО; их доля тоже будет расти — причиной этого является уход из России западных вендоров.
  5. Количественно использование закрытых российских СУБД, написанных с нуля, также будет расти, но вот доля их будет падать — так как пользователи будут стремиться минимизировать вендор-лок; аналогично и системные администраторы будут предпочитать не привязывать свою карьеру к конкретному вендору.
  6. Будет расти популярность облачных сервисов и систем развертывания и управления, кардинально упрощающих процессы администрирования СУБД

Передовики СУБД-импортозамещения

Авторы исследования «СУБД-круг Громова 2023» отмечают, что хотя многие из отечественных продуктов и основаны на свободном программном обеспечении (то есть таком, исходные тексты которых можно использовать для создания новых продуктов), российские коммерческие организации вносят серьезные доработки, нужные для промышленного применения СУБД. Они также обращают внимание на то, что большинство российских производителей, создающих проекты на основе свободного ПО, стремятся предложить сделанные ими доработки и «родительскому» проекту. Особенно в этом плане следует отметить компанию «Постгрес Профессиональный»: она не только выпускает свою линейку продуктов Postgres Pro, но и ведет большую работу по популяризации PostgreSQL в России — в том числе переводит и свободно распространяет документацию по нему, организует коммуникации российских энтузиастов PostgreSQL, осуществляет поддержку PostgreSQL, производит обучение и консультирует даже организации, создающие свои конкурирующие продукты на основе PostgreSQL!

Упоминают они и компанию «Аренадата Софтвер», которая создает ряд своих продуктов на основе свободных решений и одновременно активно комитит свои дополнения в оригинальные продукты. Так например, она является вторым по объему вклада разработчиком свободной СУБД Greenplum, на основе которой создает собственный продукт Arenadata DB. Кроме Greenplum она работает над ClickHouse, Tarantool, а также рядом проектов, ведомых Apache Foundation. Причем для «Аренадата Софтвер» такой подход тоже отражает ее философию — не только использовать свободные продукты, но и активно развивать их совместно с другими их авторами, быть не потребителями, а соавторами. Исходный код собственной разработки Arenadata Cluster Manager открыто лежит в репозитории GitHub, а компания стремится передать свой проект под крыло Apache Foundation.

Упоминается в исследовании «СУБД-круг Громова 2023» и компания «Ред Софт». Разрабатываемая ею СУБД «Ред База Данных» (она основана на свободной СУБД Firebird) стала вообще первым продуктом, внесённым в список российского ПО при его создании в 2016-м году!

Необходимо отметить, что не все российские проекты в сфере СУБД сводятся к доработке свободного ПО. С одной стороны, на российском рынке существует компания-старожил РЕЛЭКС с уходящим еще в советские времена опытом в сфере баз данных, предлагающая на рынке проприетарную РСУБД ЛИНТЕР, ставшую коммерчески успешной еще в непростые 90-е. С другой стороны, российские ИТ-гиганты Яндекс и VK/Mail.ru разработали и сделали свободными свои собственные разработки ClickHouse, Tarantool, YDB, которые активно используются и коммерциализируются не только в России, но и за рубежом.

Резюме: отечественный рынок СУБД смотрит в сторону максимально вендоронезавсисимых решений

«В России минувший год ознаменовался началом масштабных изменений во многих бизнес-сферах, — отмечают авторы исследования „СУБД-круг Громова 2023“. — Не обошли перемены стороной и рынок СУБД. Причиной, разумеется, стал уход из страны крупнейших западных вендоров. Для российских вендоров СУБД это был серьезный вызов, но, как показало время, отечественная IT-индустрия сумела достойно ответить на него. Выделим главные тренды.

Во-первых, резко выросла активность уже давно работающих на рынке крупных игроков, которые получили дополнительное финансирование и увеличили интенсивность работ над проектами в сфере СУБД. В первую очередь здесь нужно отметить Postgres Pro.

Во-вторых, стала заметна тенденция к объединению и консолидации вендоров. Например, именно этим путем пошли VK и mail.ru, Arenadata и Picodata.

В-третьих, активизировались в продвижении своих решений и те игроки, которых можно считать новыми. Большинство из них были мало кому известны. И хотя многие из них работали над своими решениями в течение нескольких последних лет, именно срочная потребность в импортозамещении подстегнула их к выводу продуктов на рынок или переупаковке. Так, „Cборка PostgreSQL Sber Edition“ была доработана до полновесного продукта и получила собственное название Pangolin. При этом подобные решения довольно быстро набирали очки популярности на рынке, так как наблюдался высокий спрос на отечественные СУБД. К концу года стало понятно: миграция с западных решений имеет не единичный характер, а уже в значительной степени поставлена на поток».

Для ключевых сценариев применения СУБД уже существуют российские аналоги, удовлетворяющие требованиям enterprise-сегмента по удобству развертывания, управления, мониторинга, безопасности, масштабируемости и наличию соответствующих сертификатов, считают авторы исследования: «Причем сильные решения есть как для традиционных транзакционных задач, так и для относительно новых аналитических с использованием больших данных. Динамика развития рынка и отдельных решений свидетельствует: в самое ближайшее время для всех крупных опенсорсных проектов в сфере СУБД будет существовать локализованный в России продукт, отвечающий enterprise-требованиям по безопасности и сертификации».

По мнению авторов исследования, будут хорошо проработаны технологии миграции с западных систем в большинстве сценариев использования СУБД, в том числе касается это и гибридной постепенной миграции, позволяющей уменьшить риски для бизнеса: «В первую очередь эти тренды характерны для сегмента крупного бизнеса. Малые же и средние предприятия, скорее всего, будут отдавать предпочтение облачным технологиям. Последние не только решают для этого сегмента проблему импортозамещения без серьезных капитальных вложений, но и позволяют получить новое качество IT-инфраструктуры. В целом же для рынка неоспоримым является такой факт: преимущество получили вендоры открытых систем — т. е. свободного программного обеспечения или основанных на таком ПО решений. Обусловлено это тем, что бизнес, столкнувшись с санкциями со стороны западных ИТ-компаний, смотрит в сторону максимально вендоронезавсисимых решений».

На рис. 1 приведем график, который обобщает впечатление авторов исследования «СУБД-круг Громова 2023» о российском рынке СУБД. На нем приведены логотипы различных СУБД. Все характеристики — комплексные и в значительной степени субъективные. Чем правее расположен логотип, тем больше СУБД подходит для решения транзакционных задач (OLTP). В их число входят обеспечение изоляции запросов, способность обрабатывать большое количество изменяющих базу данных запросов, поддержка огромных массивов информации, уровень поддержки языка SQL и других методов работы с данными и др. Чем выше расположен логотип — тем лучше СУБД подходит для решения аналитических задач (OLAP). Сюда включены быстрая генерация агрегированных огромного количества данных, формирование срезов, и др. Чем больше размер логотипа, тем выше мы оцениваем СУБД по низкой стоимости внедрения и сопровождения (что включает в себя не только стоимость лицензии на использование СУБД, но и оплату труда обслуживающих ее сотрудников), отказоустойчивость системы, квалификацию вендора, уровень безопасности, опенсорсность и перспективы развития и т. п. Логотипы СУБД, зарегистрированных в качестве российского программного обеспечения, даны в цветном исполнении, остальных — серым цветом.

Источник: IT Channel News