В ноябре российское представительство аналитической компании IDC провело в Москве конференцию Big Data and Business Analytics Forum 2013, в которой участвовали более 150 руководителей ИТ-отделов компаний-заказчиков и системных интеграторов.

Как отметил Роберт Фариш, глава представительства IDC в России и СНГ, тематика «Больших данных» сравнительно недавно появилась в перечне исследований IDC. Это связано с существенным ростом объемов информации, накапливаемых как в компаниях, так и вне их (в социальных сетях и публичных облаках).

По оценке IDC, на мировом рынке объем генерируемых и накапливаемых данных увеличивается со скоростью более 60% в год и к 2020 г. может достичь 40 тыс. экзабайт. Причем информация, сосредоточенная вне корпоративной среды, занимает до 80% общего объема данных.

Как сообщил аналитик IDC Александр Прохоров, компания исходит из того, что ценная для бизнеса информация постоянно извлекается и используется. Например, накапливаемые компаниями данные о рынке, о клиентах, юридические и финансовые сведения анализируются и могут быть эффективно использованы в таких критически важных бизнес-приложениях как CRM, EDW, ERP.

Александр Прохоров пояснил, что в мировом масштабе IDC рассматривает рынок «Больших данных» как некую экосистему, которая складывается из затрат на создание инфраструктуры (включая облачную), на организацию (очистка, обогащение, интеграция) данных в различные виды БД, на средства аналитики, приложения и средства принятия решений, ориентированные на разные вертикальные отраслевые сегменты. Плюс к этому услуги по внедрению и сопровождению таких решений.

«Если в 2012 г. расходы на „Большие данные“ оценивались в 8,1 млрд. долл., то к 2016 г., по нашим прогнозам, они увеличатся почти в четыре раза, до 23,8 млрд. долл. При этом мы полагаем, что наибольшие темпы роста в денежном выражении (в среднем до +53% в год) продемонстрируют такие компоненты корпоративных ИТ-систем как СХД, а также инфраструктура облаков (до +51%), где также постоянно накапливаются разнообразные, подчас неструктурируемые данные.

Зато доля услуг заметно сократится (—21%), что связано с применением решений „под ключ“, которые могут быть перенесены в облака», — сказал он.

По мнению IDC, в настоящее время в России рынок «Больших данных» только зарождается. Есть несколько десятков проектов, которые находятся либо в стадии пилотного тестирования, либо на начальной стадии внедрения. Поэтому аналитики оценивали лишь масштабы работ по созданию и внедрению ПО для хранилищ данных — это порядка 340 млн. долл., из которых около 100 млн. долл. приходится на ПО SAP, а совокупные объемы затрат Oracle, Microsoft, IBM составляют около 240 млн. долл.

Как сказал Станислав Семененко, руководитель отдела Microsoft по продаже платформы приложений, в России, как и в мире, наибольший интерес к бизнес-аналитике «Больших данных» проявляют телеком-операторы, коммерческие банки и страховые компании, крупные розничные продавцы и госструктуры.

«У Microsoft в России есть целый ряд пилотных проектов по применению аналитики „Больших данных“ в таких компаниях, к этому их подталкивает усиливающаяся конкуренция. Многие технологии переходят в облака, в том числе бизнес-аналитика. В то же время „Большие данные“ связаны с развитием Интернета, мобильной связи и тенденцией „консьюмеризации“ ИТ», — сообщил Станислав Семененко.

По его мнению, вслед за первыми сотнями наиболее крупных заказчиков к этим технологиям придут тысячи средних, которые пока не готовы инвестировать в бизнес-аналитику «Больших данных». Они будут осваивать эти технологии по мере появления готовых решений и по мере усиления конкуренции на рынке.

Его выводы подтвердила Екатерина Лозовая, директор системного интегратора «Терн»: «Наша компания еще в 2001 г. начала работать с банком „ВТБ24“, который на основе системы анализа клиентов, получил новый инструмент для своей бизнес-деятельности. Мы помогли банку на основе анализа накопленной им информации исключить дублирование данных и найти средства противодействия мошенничеству».

Александр Яковлев, менеджер Fujitsu по продуктам системы UNIX и СХД обратил внимание на необходимость изменения ИТ-инфраструктуры для обработки «Больших данных»: «Лавинообразный рост данных повышает требования к производителям СХД, которые все чаще используют дедупликацию, превращая ее из „нишевой“, используемой для резервного копирования, в широко распространенную в online-хранилищах. В частности, разработчики Fujitsu применили ее в последних моделях дисковых СХД, что дало возможность параллельно обрабатывать как аналитические запросы, так и промышленные БД, которые являются критически важными для предприятий».

Бизнес-аналитика «Больших данных» распространяется на те отрасли, где анализ большого количества плохо структурированных данных позволяет реализовать новые бизнес-решения, помогающие значительно увеличить доходы и прибыль. Так, Fujitsu уже реализовала несколько проектов с интернет-магазинами и с традиционной розницей, в результате которых аналитика «глубинных» слоев информации за короткий срок позволила заказчикам на десятки процентов увеличить прибыльность и обороты.

Александр Яковлев отметил, что если бюджета на внедрение передовых технологий не хватает, то компании могут использовать и дедупликацию, и новейшие дисковые хранилища, и хранение на лентах, которые в свою очередь позволят за короткое время с помощью средств бизнес-аналитики генерировать новые решения для бизнеса.

В свою очередь Борис Буланов, руководитель направления «Решения для телекоммуникационных компаний» компании Informatica, отметил одно из существенных препятствий на пути внедрения технологий «Больших данных» и бизнес-аналитики: «Не хватает так называемых data-scientists, то есть специалистов в области математической статистики (позволяет выявлять взаимосвязи между различными факторами), хорошо разбирающихся в бизнесе».