Компания ЕМС в рамках IV Российского форума «Большие данные» представила федеративное решение, предназначенное для анализа данных и выработки новых бизнес-решений.
«По оценкам аналитиков, сегодня в мире используется около 4,4 зетабайт данных, к 2020 г. их объем возрастет в 10 раз и превысит 44 зетабайт, а с учетом Интернета вещей и того больше. Часть этого объема компании могут накапливать, анализировать, что позволит им выявлять оптимальные тренды и разрабатывать новые продукты, приложения и бизнес-решения. В связи с этим за рубежом появился новый термин „озера данных“ — это та часть накапливаемой информации, которая целенаправленно может быть использована для повышения эффективности бизнеса», — объяснил Святослав Сухов, директор дивизиона ISILON EMC в России и СНГ.
В качестве примера он привел компанию Boeing, которая начала встраивать в самолеты тысячи датчиков, фиксирующих состояние различных узлов и деталей конструкции: «Путем непрерывного съема информации с таких датчиков, накопления ее в едином хранилище и постоянного анализа этих данных можно выявлять и прогнозировать отказы тех или иных узлов самолета. Используя эти прогнозы, Boeing заранее подготавливает замену таких узлов, тем самым существенно сокращая время пребывания самолета на земле. Это позволяет компании сокращать расходы, ведь, как правило, она продает самолеты в лизинг. Таким образом, среди значительного объема информации, поступающей на самолет и используемой экипажем и пассажирами, выделяется отдельное „озеро данных“, предназначенное для решения конкретной задачи — повысить эффективность производителя».
Святослав Сухов подчеркнул, что подобные «озера данных» могут выделяться из массы информации на различных предприятиях (особенно в здравоохранении, в сфере финансовых услуг, в нефтегазовом секторе): «Необходимо разработать механизмы и способы получения данных, которые должны храниться в единой среде для перекрестного анализа с использованием эффективных алгоритмов при создании новых прогностических моделей. Естественно, такая работа должна проводиться в тесном сотрудничестве с экспертами бизнеса, что позволит формировать приложения в соответствии с их требованиями. В настоящее время ЕМС совместно с партнерами разработала и предлагает заказчикам первое в мире законченное федеративное решение, которое поможет заказчикам упростить весь процесс обработки „озер данных“ с целью повышения эффективности их бизнеса».
В этом решении в качестве программно-аппаратной части предлагается использовать семейство горизонтально высокомасштабируемых систем EMC ISILON. Компания VMware на базе ПО Cloud Suite обеспечила их виртуализацию и представляет в виде облака, доступного как приложениям, так и пользователям. В свою очередь, компания Pivotal, используя ПО Hadoop и Big Data Suite, создала возможность накапливать на EMC ISILON разнообразную информацию. В качестве ее аналитики предлагаются как решения Pivotal, так и других компаний (например, SAS), а также иных разработчиков, если заказчики в них уверены.
Святослав Сухов объявил, что первые поставки в Россию федеративных решений на базе EMC ISILON начнутся в апреле 2015 г. Однако он считает, что у нас в стране заказчики не готовы внедрять и использовать подобные системы: «Gartner, исследуя мировой рынок, подсчитала, что только 13% компаний уже вложили средства в создание систем для обработки больших данных, и 9% из них до сих пор не представляют себе достаточно ясно ценность этого. В России ситуация на корпоративном рынке, наверное, еще менее оптимистична. Поэтому ЕМС предлагает всем заинтересовавшимся предложением сначала пройти ряд семинаров по перспективным решениям в области обработки больших данных. Тем заказчикам, которых предложение ЕМС заинтересовало, предлагается принять участие в 12-недельном тестировании решений для развития бизнеса и уже после этого заказывать и разворачивать у себя федеративную платформу EMC Business для „озер данных“. Со своей стороны, EMC активно работает с российскими партнерами — крупными системными интеграторами, которые уже прорабатывают около 20 проектов внедрения решений для аналитической обработки больших данных».