Системы базового уровня
Инструменты бизнес-анализа и управления данными — наверное, самые «заметные» компоненты экосистем больших данных в организациях. А уровнем ниже лежат сложные, развернутые локально или в облаке, интегрированные системы, которые служат платформой для приложений и которые обрабатывают громадные объемы данных и предоставляют вычислительную мощь, благодаря чему работают системы Big Data.
Третья часть списка «Big Data 100» CRN/США включает 15 вендоров платформ больших данных, предлагающих локально развертываемые и облачные системы для построения систем обработки больших данных и управления этими системами. Сюда входят хранилища, склады и озера данных.
Amazon Web Services
Главный управляющий: Энди Джесси (Andy Jassy)
AWS стала системой де-факто для управления данными многих бизнес-приложений. Поэтому неудивительно, что компания остается на траектории быстрого роста, сообщив недавно, что вышла на годовой уровень дохода 15 млрд. долл.
Ее предложения на арене Big Data включают аналитические платформы Athena (сервис интерактивных запросов) и Elasticsearch (поисковый сервис), аналитику реального времени Kinesis Firehose, СУБД Amazon DynamoDB (NoSQL-типа) и Amazon Aurora (реляционная СУБД), облачное хранилище данных Redshift и систему бизнес-анализа QuickSight.
В этом году AWS анонсировала новую функцию хранилищ данных, Redshift Spectrum, которая позволит заказчикам выполнять запросы к эксабайтным объемам данных, хранимых в облаке Amazon S3 (1 эксабайт = 1000 петабайт)
BlueData Software
Главный управляющий: Кумар Шриканти (Kumar Sreekanti)
Санта-Клара, шт. Калифорния
Год создания: 2012
Платформа EPIC (Elastic Private Instant Clusters), разработанная компанией BlueData, использует технологию контейнеров Docker и предназначена для развертывания локальной инфраструктуры и приложений обработки больших данных в организациях. Она предоставляет Hadoop-как-услугу и Spark-как-услугу.
Предложенный весной новый релиз BlueData EPIC дает возможность запускать рабочие нагрузки обработки больших данных в гибридной среде, объединяя локальные ресурсы и общедоступное облако.
В январе компания сообщила, что в 2016 г. объем продаж вырос на 426% благодаря таким заказчикам, как State Farm Insurance, Barclays и Panera Bread.
Cazena
Главный управляющий: Прат Моге (Prat Moghe)
Уолтем, шт. Массачусетс
Год создания: 2014
Платформа больших данных как услуга, предлагаемая стартапом Cazena, позволяет переместить всю обработку в облако лишь несколькими щелчками мыши, автоматизируя этот обычно долгий и сложный процесс.
Cazena связывает облачные БД, механизмы аналитики, средства миграции данных, безопасности и др. в единую PaaS, работающую на базе Microsoft Azure и AWS.
Компания предоставляет также облачные услуги озера и витрины данных, а в феврале предложила облачный сервис Data Science Sandbox, позволяющий строить, тестировать и запускать в работу аналитические приложения исследования данных.
Компания привлекла к себе внимание (и финансирование), поскольку главный управляющий Прат Моге и члены правления Джит Саксена (Jit Saxena) и Джим Баум (Jim Baum) были учредителями Netezza, пионера разработки устройств-хранилищ данных (IBM купила эту компанию в 2010 г. за 1,7 млрд. долл.).
Cloudera
Главный управляющий: Том Райли (Tom Reilly)
Пало-Альто, шт. Калифорния
Год создания: 2008
Cloudera — один из ведущих поставщиков дистрибутива Hadoop и разработчик сопутствующих инструментов и технологий для управления кластерами Hadoop и их защиты.
Предложение компании включает ее флагманскую платформу Cloudera Enterprise Data Hub, базы данных Cloudera Analytic DB и Cloudera Operational DB. Только что было объявлено о релизе Cloudera Data Science Workbench, рабочего инструмента для исследователей данных с самообслуживанием.
В этом году Cloudera подала заявку на IPO, готовясь стать открытой компанией; она планирует выпустить 15 млн. обыкновенных акций по цене 15,00 долл. за акцию.
Dell Technologies
Главный управляющий: Майкл Делл
Раунд-Рок, шт. Техас
Купив EMC за 58 млрд. долл., Dell имеет теперь широкий спектр предложений на арене Big Data, включая средства управления (Dell Master Data Management Services) и интеграции данных (Dell Boomi), оснащения инфраструктуры (серверы, СХД и сетевое оборудование), а также инструменты аналитики и бизнес-анализа (благодаря альянсу с NTT Data Services).
Компания предлагает также технологии Big Data на основе соглашений с другими вендорами, в частности инструментарий Hadoop от Cloudera.
ПО прогнозной аналитики Statistica, купленное Dell с компанией StatSoft в 2014 г., было продано частным инвестиционным фирмам вместе с Quest в 2016 г.
Главный управляющий: Сундар Пичаи (Sundar Pichai)
Маунтин-Вью, шт. Калифорния
Платформа Google Cloud включает ряд инструментов управления большими данными и аналитики, в том числе аналитическую БД BigQuery, инструмент Cloud Datalab для визуального изучения и анализа больших массивов данных и управляемый сервис Cloud Dataproc для работы с Hadoop, MapReduce, Spark, Pig и Hive.
Еще один сервис — инструмент очистки и подготовки данных Cloud DataPrep — проходит сейчас закрытое бета-тестирование.
Hewlett Packard Enterprise
Президент и главный управляющий: Мег Уитман
Пало-Альто, шт. Калифорния
Предложения HPE на арене больших данных включают платформы аналитики неструктурированных данных IDOL и расширенной аналитики Vertica, средства управления информацией и руководства данными, оборудование (HPE ConvergedSystem для Big Data и HPE Apollo) и ряд сервисов для работы с большими данными.
Компания предлагает также системы обработки больших данных «под ключ»: HPE ConvergedSystem для SAP HANA и HPE ConvergedSystem 300 для Microsoft Analytics.
Hortonworks
Главный управляющий: Роб Бирден (Rob Bearden)
Санта-Клара, шт. Калифорния
Год создания: 2011
Компания предлагает ряд инструментов управления большими данными, построенных на ее платформе Hortonworks Data Platform (HDP), которая, в свою очередь, базируется на Apache Hadoop. Предлагается также ПО Hortonworks DataFlow для сбора и анализа потоковых данных в реальном времени.
В апреле стартовала версия HDP 2.6, способная предоставить оперативную аналитику реального времени с использованием информации, хранящейся в озере данных.
IBM
Президент и главный управляющий: Вирджиния Рометти
Армонк, шт. Нью-Йорк
Предложения IBM в области больших данных всё больше ориентированы на суперкомпьютер Watson: таковы ее платформа Watson Data и сервисы Watson Analytics.
Предлагаются и автономные продукты: ПО прогнозной аналитики SPSS, база данных DB2, BI-платформа Cognos Analytics on Cloud, ПО BigInsights Hadoop и технология машинного обучения.
В апреле компания расширила возможности анализа и обнаружения данных системы Watson в своем облаке IBM Cloud, предложив новый функционал в сервисе Watson Discovery и введя экспериментальную платформу Watson Company Profiler.
Infoworks
Главный управляющий: Амар Арсикере (Amar Arsikere)
Сан-Хосе
Год создания: 2014
Infoworks предлагает хранилище данных на базе Hadoop, которое можно развернуть в локальной сети, а теперь и в облаке.
В марте компания получила 15 млн. долл. во втором раунде финансирования.
MapR Technologies
Главный управляющий: Мэтт Миллз (Matt Mills)
Сан-Хосе
Год создания: 2009
Компания MapR Technologies разрабатывает конвергентную платформу больших данных, которая объединяет Hadoop, Spark и механизм SQL-запросов Apache Drill с функциями базы данных реального времени, обработки потока событий и масштабируемого хранения.
Поскольку Интернет вещей — один из главных драйверов спроса на технологии Big Data, в марте компания представила усеченную версию своей платформы, которая позволит собирать, обрабатывать и анализировать данные ближе к самим IoT-устройствам.
Oracle
Главные управляющие: Сафра Кац, Марк Херд
Редвуд-Сити, шт. Калифорния
Oracle — один из давних лидеров на арене Big Data со своей флагманской Oracle Database и реляционной базой данных MySQL, средствами управления и интеграции данных, технологией хранилищ данных и ПО бизнес-аналитики и визуализации.
Что касается платформ для больших данных, то компания предлагает специализированное оборудование: Big Data Appliance, Exadata Database Machine и Exalytics In-Memory Machine.
В апреле Oracle подписала соглашение о покупке Moat, разработчика облачной платформы сбора маркетинговых данных и аналитики, и планирует встроить эту технологию в свое облако Oracle Data Cloud.
Ryft Systems
Главный управляющий: Дез Уилсон (Des Wilson)
Роквилл, шт. Мэриленд
Год создания: 2000
Компания разрабатывает линейку устройств — ускорителей обработки, использующих x86-совместимые процессоры и программируемые логические ИС (FPGA), а также библиотеку алгоритмов обнаружения данных и другие технологии, предоставляя систему высокопроизводительной аналитической обработки. Компания заявляет, что ее системы, в хостинговом варианте или установленные у заказчика, стократно (и более) превосходят по производительности другие аналитические платформы.
Недавно компания подписала соглашение с Amazon Web Services, по которому AWS предоставит версию ее системы Ryft One для гетерогенного облака (Ryft Virtual) своим пользователям инстансов F1 в облаке Amazon EC2.
Snowflake Computing
Главный управляющий: Боб Мулья (Bob Muglia)
Сан-Матео, шт. Калифорния
Год создания: 2012
Стартап Snowflake Computing запустил свой облачный сервис Snowflake Elastic Data Warehouse почти два года назад, предложив альтернативу традиционным хранилищам данных (в организациях), которые, как правило, сложны, дорогостоящи и требуют много времени на создание.
5 апреля Snowflake получила 100 млн. долл. в четвертом раунде финансирования, общая сумма вложенных в нее инвестиций составила 205 млн. долл.
Компания сообщила, что за последний финансовый год, завершившийся 31 января, количество ее заказчиков почти удвоилось, а сохраняемый ими общий объем данных увеличился на 300%.
Teradata
Президент и главный управляющий: Виктор Лунд (Victor Lund)
Дейтон, шт. Огайо
Год создания: 1979
Teradata во многих отношениях была создателем истинных хранилищ данных, разрабатывая оборудование и ПО, специально предназначенные для этих целей, в отличие от конкурентов, которые приспосабливали свои системы обработки транзакций с тем, чтобы они могли служить такими хранилищами.
Сегодня компания предлагает линейку специализированных платформ хранилищ данных, использующих ее СУБД Teradata Database, ПО бизнес-аналитики и другие продукты для больших данных. Системы работают в локальной среде организаций и в частном облаке. В марте компания предложила также SaaS-версию Teradata IntelliCloud.
Teradata названа Лидером в «Магическом квадранте» Gartner 2017 г. в категории решений по управлению данными аналитики и занимает первое место по полноте видения.
© 2017. The Channel Company LLC. Initially published on CRN.com, a The Channel Company website, at https://www.crn.com. Reprinted with permission.