18 февраля 2011 г.

Gartner назвал главные тенденции развития хранилищ данных, указав, как они повлияют на баланс затрат/результатов при внедрении систем бизнес-аналитики в организациях в период 2011-2012 гг.

Аналитики подчеркивают, что хранилища данных будут оставаться ключевым компонентом ИТ-инфраструктуры и, с ростом спроса на бизнес-аналитику (BI) и более широкую категорию средств анализа для организаций, всё большее значение будут приобретать оптимизация, структурная гибкость и альтернативные стратегии построения хранилищ.

«Хранилище данных остается одним из самых крупных - если не крупнейшим - репозиторием информации в организациях, - пишет Марк Бейер, вице-президент исследования Gartner. - Только зная основные тенденции рынка и понимая, как новые подходы в технологии будут сочетаться с уже проверенными методами, ИТ-директор сможет избежать напрасной траты бюджета из-за "дезориентации" командой внедрения и сопровождения хранилищ данных».

Gartner называет девять основных тенденций на рынке хранилищ данных в 2011-2012 гг.:

1. Оптимизация и производительность
Расширенные средства управления подсистемами ввода-вывода, хранения данных и балансирования ЦП/памяти включены теперь почти как само собой разумеющееся в платформы, использующие хранилища данных. Некоторые новые игроки нацелены на оптимизацию как фактор отличия, и почти каждый вендор хранилищ данных решает теперь задачу оптимизации ресурсов хранения, используя сжатие и стратегии структурированного хранения в зависимости от назначения данных. Вендоры прикладывают также немалые усилия, строя маркетинг на новизне технологии и цифрах производительности, что не всегда существенно для целевого применения.

2. Специализированные устройства
Если много причин, почему организации часто предпочитают покупать специализированные устройства, но главная - это простота. Вендор строит и апробирует конфигурацию, увязывает между собой аппаратные компоненты, ПО и услуги, гарантируя определенную производительность. Устройство поставляется в готовом виде и быстро устанавливается. В случае каких-либо проблем первым и естественным шагом будет звонок вендору. Есть и дополнительные преимущества: устройства помогают ускорить внедрение, не требуя долгих усилий взаимоувязки оборудования.

3. Пилотные проекты
В течение 2010 года многие организации вняли совету Gartner запустить пилотный проект с несколькими, самыми надежными вендорами, чтобы выбрать СУБД для хранилища данных. Gartner рекомендует использовать в этих проектах как можно больше реальных данных, извлеченных из операционных систем организаций, и подключить к такому опробованию как можно больше пользователей, создав нагрузку на хранилище, близкую к той, что будет иметь место в реальных условиях.

4. Смешанные рабочие нагрузки
Рабочие нагрузки хранилища данных можно подразделить на шесть категорий: массовая/ пакетная нагрузка, базовая отчетность, базовая оперативная аналитическая обработка (OLAP), непрерывная нагрузка/ в реальном времени, добыча данных и операционная бизнес-аналитика. Хранилища, обслуживающие все шесть типов нагрузок, необходимо оценить на предсказуемость производительности при смешанной рабочей нагрузке, так как неспособность нормально ее обслуживать приведет со временем к росту расходов на администрирование по мере увеличения объема обработки и добавления новых нагрузок, что потенциально может вызвать большие проблемы устойчивости.

5. Возрождение витрин данных
Согласно определению, витрина данных - это аналитический репозиторий любого размера для конкретного приложения, обычно с определенной, меньшей группой пользователей, чем у хранилища данных. Можно использовать такие витрины, чтобы оптимизировать хранилище данных, выгрузив часть рабочей нагрузки в витрину, что позволит увеличить производительность в среде хранилища.

6. Колоночные СУБД
СУБД по-колоночного хранения данных обычно демонстрируют более быстрый отклик на запросы, чем традиционные БД с построчным хранением, и могут послужить прекрасной платформой для витрин данных и даже в роли главной платформы хранилища данных. Gartner предвидит, что несколько вендоров изменят модель ценообразования для своего ПО, перейдя с более традиционной цены, зависящей от количества пользователей или ядер ЦП, к цене в зависимости от объема данных, выгруженных в базу данных.

7. СУБД-в-памяти
Технологии СУБД, выполняемых в памяти (IMDBMS), демонстрируют очень быстрый отклик на запросы и время совершения операций и увеличивают вероятность того, что аналитические и операционные системы смогут использовать одну и ту же базу данных. Аналитические модели данных, опора на основные данные, а также информационные услуги для среднего звена начнут вырисовываться как доминирующий подход, заставляя больше традиционных вендоров БД с построчным хранением переходить к по-колоночному хранению данных и выполнению в памяти одновременно. Рано или поздно появятся решения BI, и они будут использовать IMDBMS с их прекрасной производительностью и быстро становиться объектом покупки мегавендоров.

8. Хранилище данных как услуга/ «облако»
В 2011 году появятся «хранилища данных как услуга» в двух разновидностях: ПО как услуга (SaaS) и аутсорсинговое хранилище данных. Хранилище данных в облаке - это пока лишь выбор типа инфраструктуры, так как еще предстоит разработать модель данных, внедрить стратегию интеграции и обеспечить доступ пользователей BI и управление им. Некоторым организациям больше подойдет модель частного облака для создания хранилищ данных и обслуживания аналитики.

9. Использование свободных СУБД
Свободные СУБД пока еще используются в экспериментальных и более формализованных приложениях. На текущем этапе хранилища на базе open-source СУБД редки, обычно меньше традиционных по масштабу и часто требуют больше поддержки вручную. Однако некоторые решения оптимизированы именно для хранилищ данных.

Источник: Пресс-служба Gartner