5 декабря 2013 г.
В ноябре российское представительство аналитической компании IDC провело в Москве конференцию Big Data and Business Analytics Forum 2013, в которой участвовали более 150 руководителей ИТ-отделов компаний-заказчиков и системных интеграторов.Как отметил Роберт Фариш, глава представительства IDC в России и СНГ, тематика «Больших данных» сравнительно недавно появилась в перечне исследований IDC. Это связано с существенным ростом объемов данных, накапливаемых как в компаниях, так и вне их (в социальных сетях и публичных облаках), что породило сам термин Big Data. В то же время компании начинают все чаще обращаться к «Большим данным», пытаясь на основе их анализа найти новые решения для развития своего бизнеса.
По оценке IDC, на мировом рынке объем генерируемых и накапливаемых данных увеличивается со скоростью более 60% в год и к 2020 г. может достичь 40 тыс. экзабайт. Причем информация, сосредоточенная вне корпоративной среды, занимает до 80% общего объема данных.
Как сообщил аналитик IDC Александр Прохоров, компания исходит из того, что информация, ценная для бизнеса, постоянно извлекается и используется. Например, накапливаемые компаниями данные о рынке, о клиентах, юридические и финансовые сведения анализируются и могут быть эффективно использованы в таких критически важных бизнес-приложениях как CRM, EDW, ERP. При этом, по оценке IDC, технологии и архитектуры нового поколения все чаще используются для экономичного извлечения ценности из разноформатных данных большого объема путем быстрого захвата, обработки и анализа данных.
Александр Прохоров пояснил, что в мировом масштабе IDC рассматривает рынок «Больших данных» как некую экосистему, которая складывается из затрат на создание инфраструктуры (включая облачную), на организацию (очистка, обогащение, интеграция) данных в различные виды БД, на средства аналитики, приложения и средства принятия решений, ориентированные на разные вертикальные отраслевые сегменты. Плюс к этому услуги по внедрению и сопровождению таких решений.
«Если в 2012 г. расходы на “Большие данные” оценивались в 8,1 млрд. долл., то к 2016 г., по нашим прогнозам, они увеличатся почти в четыре раза, до 23,8 млрд. долл. При этом мы полагаем, что наибольшие темпы роста в денежном выражении (в среднем до +53% в год) продемонстрируют такие компоненты корпоративных ИТ-систем как СХД, а также инфраструктура облаков (до +51%), где также постоянно накапливаются разнообразные, подчас неструктурируемые данные.
Зато доля услуг заметно сократится (-21%), что связано с применением решений “под ключ”, которые могут быть перенесены в облака, облачные провайдеры смогут обеспечивать большую часть таких сервисов», - сказал он.
По мнению IDC, в настоящее время в России рынок «Больших данных» только зарождается. Есть несколько десятков проектов, которые находятся либо в стадии пилотного тестирования, либо в начальной стадии внедрения. Поэтому аналитики оценивали лишь масштабы работ по созданию и внедрению ПО для хранилищ данных – это порядка 340 млн. долл., из которых около 100 млн. долл. приходится на ПО SAP, а совокупные объемы затрат Oracle, Microsoft, IBM составляют около 240 млн. долл.
Как сказал Станислав Семененко, руководитель отдела Microsoft по продаже платформы приложений, в России, как и в мире, наибольший интерес к бизнес-аналитике «Больших данных» проявляют крупные телеком-операторы, коммерческие банки и страховые компании, большие розничные продавцы и госструктуры.
«У Microsoft в России есть целый ряд пилотных проектов по применению аналитики “Больших данных” в таких компаниях, к этому их подталкивает усиливающаяся конкуренция. Многие технологии переходят в облака, в том числе бизнес-аналитика. В то же время развитие технологий “Больших данных” связано с развитием Интернета, мобильной связи и тенденцией “консьюмеризации” ИТ», - сообщил Станислав Семененко.
Он также отметил, что банки, телеком и розничная торговля занимаются такими проектами потому, что работают с большим числом клиентов, использующих Интернет. Причем усилия таких заказчиков по внедрению аналитики данных поддерживают системные интеграторы, которые в свою очередь накапливают опыт работы с «Большими данными».
По мнению Станислава Семененко, вслед за первыми сотнями наиболее крупных заказчиков к этим технологиям придут тысячи средних, которые пока не готовы инвестировать в бизнес-аналитику «Больших данных». Они будут осваивать эти технологии по мере появления готовых решений и по мере усиления конкуренции на рынке. Те компании, которые ограничатся небольшим объемом бизнес-информации, на основе которой они принимают решения сегодня, в конце концов окажутся неконкурентоспособными.
Его выводы подтвердила Екатерина Лозовая, директор компании – системного интегратора «Терн»: «Мы длительное время сотрудничаем с крупными заказчиками, они вынуждены работать с аналитикой – внедряют средства прогнозирования, моделирования, которые позволяют найти неочевидные закономерности. Они начинают понимать за счет чего могут повысить свои доходы, а где сократить расходы. Основная проблема заключается в том, чтобы накопленную информацию почистить, преобразовать так, чтобы получить сопоставимые данные. Например, наша компания еще в 2001 г. начала работать с банком “ВТБ24”, который на основе системы анализа клиентов, получил новый инструмент для своей бизнес-деятельности. Мы помогли банку на основе анализа накопленной им информации исключить дублирование данных и найти средства противодействия мошенничеству.
Александр Яковлев, менеджер Fujitsu по продуктам системы UNIX и СХД обратил внимание на необходимость изменения ИТ-инфраструктуры для обработки «Больших данных». Он напомнил, что один из первых проектов по сбору и обработке «Больших данных» был реализован в ходе экспериментов на адронном коллайдере: там установлены тысячи датчиков, информацию с которых нужно собирать и обрабатывать.
«Сегодня эта технология выходит на качественно новый уровень, и лавинообразный рост данных повышает требования к производителям СХД, которые все чаще используют дедупликацию данных, превращая ее из “нишевой”, используемой для резервного копирования, в широко распространенную в online-хранилищах. В частности, разработчики Fujitsu применили ее в последних моделях дисковых СХД, что дало возможность параллельно обрабатывать как аналитические запросы, так и промышленные БД, с которыми постоянно работают предприятия и которые являются критически важными для их бизнеса», - пояснил он.
Бизнес-аналитика «Больших данных» распространяется на те отрасли, где анализ большого количества плохо структурированных данных позволяет реализовать новые бизнес-решения, помогающие значительно увеличить оборот, доходы и прибыль. Так, Fujitsu уже реализовала несколько проектов с интернет-магазинами и с традиционной крупной розницей, в результате которых аналитика «глубинных» слоев информации за короткий срок позволила заказчикам на десятки процентов увеличить прибыльность и обороты.
Александр Яковлев отметил, что если бюджета на внедрение передовых технологий не хватает, то компании могут реализовывать в рамках единых решений сумму технологий, дающих необходимый эффект - использовать и дедупликацию, и новейшие дисковые хранилища, и хранение на лентах, которые в свою очередь позволят за короткое время с помощью средств бизнес-аналитики генерировать новые решения для бизнеса.
В свою очередь Борис Буланов, руководитель направления «Решения для телекоммуникационных компаний» компании Informatica, эксперт по Big Data, отметил одно из существенных препятствий на пути внедрения технологий «Больших данных» и бизнес-аналитики: «Не хватает так называемых data-scientists, то есть специалистов в области математической статистики (позволяет выявлять взаимосвязи между различными факторами), хорошо разбирающихся в бизнесе. Если это страховая или финансовая компания, то он должен знать условия ее работы, способы обслуживания клиентов, законодательство. И, конечно, такой специалист должен понимать, какую информацию и откуда может компания получать. Именно такие специалисты могут формулировать новые, нетрадиционные задачи бизнес-аналитики и проекты. Они очень нужны, но в корпоративной среде их мало».
«Значение таких специалистов весьма велико, - считает он. - Ведь ценность “Больших данных” заключается в том, чтобы собрав воедино всю информацию, которой располагает компания, с помощью data-scientists соединить возможности технологий с бизнесом и сформировать новые подходы к анализу данных, построить новые модели их взаимосвязей и тем самым найти пути решения нетривиальных бизнес-задач», - подчеркнул он.
Однако, как отметил Александр Прохоров, в настоящее время российские вузы не готовят специалистов в области технологий «Больших данных» и data-scientists, для этого, возможно, необходимо создать новое специализированное учебное заведение.
Борис Буланов обратил внимание участников конференции на развитие «Интернета вещей», когда различные технологические системы и устройства снабжаются большим числом датчиков, непрерывно передающих информацию в ЦОДы, где она и анализируется. Например, показатели датчиков на теле человека позволяют кардинально изменить методы диагностики и лечения в медицине. Дополняя его, Станислав Семененко сказал, что аналогичным образом, используя данные с датчиков, можно совершенствовать электроэнергетику, условия работы транспорта в городах, планировать развитие городской инфраструктуры и т.д.
Источник: Владимир Смирнов, CRN/RE