6 июня 2018 г.
Основа для проектов внедрения
Компании и организации, берущиеся за проекты в области больших данных, могут выбирать приложения, инструменты аналитики и системы управления данными от сотен вендоров. Но вероятнее всего, что их выбором будет оборудование, программное обеспечение и облачные сервисы сравнительно небольшого числа вендоров, многие из которых являются крупнейшими игроками ИТ-отрасли.
Часть 3 списка «Big Data 100», который ежегодно публикует CRN/США, включает 15 компаний, предлагающих локально развертываемые и облачные системы и платформы, служащие основой для многих инициатив в области больших данных.
Amazon Web Services
Главный управляющий: Энди Джесси (Andy Jassy)
Amazon Web Services предоставляет облачную платформу, которая служит основой обработки больших данных для многих организаций, обеспечивая хранение, управление данными и функции бизнес-анализа.
Помимо самой платформы AWS предлагает также растущий портфель облачных сервисов, благодаря которым заказчики — особенно мелкого и среднего бизнеса — получают в свое распоряжение высокопроизводительную технологию обработки больших данных, доступную прежде лишь крупным организациям.
AWS предлагает системы управления базами данных (включая реляционную СУБД Amazon RDS и базу данных NoSQL-типа DynamoDB), хранилище данных RedShift, приложение бизнес-анализа QuickSight, сервис интерактивных запросов Amazon Athena, сервис Amazon Elastic MapReduce (EMR), использующий Hadoop и Spark, а также сервисы искусственного интеллекта, машинного обучения и Интернета вещей.
BlueData Software
Главный управляющий: Кумар Шриканти (Kumar Sreekanti)
Санта-Клара, шт. Калифорния
Платформа компании BlueData, включающая технологию контейнеров Docker, используется для развертывания рабочих нагрузок больших данных в общедоступном облаке, в локальной или гибридной ИТ-среде. BlueData EPIC (Elastic Private Instant Clusters) — это платформа-больших-данных-как-услуга, обеспечивающая предоставление Hadoop, Spark, Kafka и других средств аналитики и изучения больших данных по требованию.
В последнем релизе платформы EPIC добавлена поддержка систем, построенных на GPU, а также библиотеки машинного обучения TensorFlow.
BlueData сообщила, что в 2017 году продажи выросли на 228% с приходом таких заказчиков, как Citigroup, GM Financial, GlaxoSmithKline, Детская больница Сиэтла и Tesco Bank.
Cazena
Главный управляющий: Прат Моге (Prat Moghe)
Уолтем, шт. Массачусетс
Cazena предлагает полностью управляемую платформу-больших-данных-как-услугу для хранения, анализирования и совместного использования данных без знания DevOps и других сложных вещей. На основе партнерства с Cloudera, Microsoft Azure и AWS компания предоставляет средства обработки больших данных для бизнес-анализа и исследования данных, изучения потребностей клиентов и инженерии данных.
В ноябре Cazena запустила сервис AppCloud, где заказчики могут развертывать и использовать средства машинного обучения и аналитики, такие как DataRobot, Cloudera, Data Science Workbench, StreamSets и Arcadia Data.
Cloudera
Главный управляющий: Том Райли (Tom Reilly)
Cloudera предлагает ПО и сервисы на базе Apache Hadoop и Spark, которые служат основой для систем обработки больших данных многих заказчиков. В числе предлагаемых продуктов флагманская платформа Enterprise Data Hub, Operational DB, Data Science Workbench, Cloudera SDX (Shared Data Experience) и др.
В ноябре стартовало облачное хранилище данных Altus Analytic DB, построенное на собственной платформе-как-услуге Cloudera Altus, с функциями SQL-запросов и бизнес-анализа с самообслуживанием.
Dell Technologies
Главный управляющий: Майкл Делл
Dell Technologies предлагает, конечно, обширный спектр оборудования и ПО для обработки больших данных, от высокопроизводительных серверов и СХД до инфраструктурного ПО и сетевого оборудования.
Dell поставляет также ПО управления данными, интеграции и защиты данных, дающее основу для проектов больших данных многих заказчиков. В частности, ее сервис Boomi служит для перемещения данных между облачными и локально развернутыми приложениями.
Главный управляющий: Сундар Пичаи
Платформа Google Cloud обслуживает системы обработки больших данных многих заказчиков, а также служит основой для собственных облачных сервисов больших данных Google, таких как база данных Cloud SQL, сервис потоковой и пакетной обработки Cloud Dataflow и облачное хранилище данных Google BigQuery.
Hewlett Packard Enterprise
Президент, главный управляющий: Антонио Нери
Компания Hewlett Packard Enterprise разрабатывает широкий спектр компонентов инфраструктуры ЦОДов для обработки больших данных, от мощных суперкомпьютеров (включая HPE Superdome Flex) до специализированных серверов аналитики больших данных и рабочих нагрузок Hadoop.
Также, HPE работает в партнерстве с SAP, предоставляя платформу СУБД SAP HANA для обработки коммерческих данных и задач аналитики реального времени.
Hortonworks
Главный управляющий: Роб Бирден (Rob Bearden)
Компания Hortonworks предлагает ряд программных продуктов для проектов больших данных. Ядром ее портфеля служит платформа Hortonworks Data Platform (HDP) на базе Hadoop.
Предложение включает также сервис аналитики потоковых данных реального времени Hortonworks DataFlow для сбора, классификации и анализирования «данных в движении».
Hortonworks имеет соглашение с IBM, по которому поставляет ее реляционную базу данных DB2 для задач SQL-аналитики-на-Hadoop, и совместно с IBM разрабатывает ПО исследования данных следующего поколения.
IBM
Главный управляющий: Вирджиния Рометти
IBM предлагает широкий спектр инструментов бизнес-аналитики и управления данными, а также мощное вычислительное оборудование для них.
В числе ее программных продуктов — Cognos Analytics для задач бизнес-аналитики и отчетности, SPSS для статистического и прогнозного анализа, а также гибридный SQL-процессор Db2 Big SQL for Hadoop для объединения данных из разрозненных источников, таких как реляционные СУБД и базы данных NoSQL-типа.
IBM строит свою стратегию в Big Data и аналитике на проприетарной технологии Watson, включающей такие продукты, как Watson Analytics, Watson IoT Platform и Watson Explorer.
Infoworks
Главный управляющий: Амар Арсикере (Amar Arsikere)
Направить поток данных от операционных систем и баз данных в системы управления большими данными и аналитики «в удобоваримом виде» — сложная задача, потопившая не один проект в области больших данных.
Infoworks разрабатывает ПО, которое автоматизирует процессы инженерии данных, позволяя строить сплошные рабочие потоки больших данных от источника до пользователя и управлять ими. В частности, специализированные инструменты автоматизируют загрузку, миграцию, преобразование и подготовку данных, а также синхронизацию данных/метаданных.
В сентябре стартовала ее платформа полного автоматизированного хранилища больших данных в облаке.
MapR Technologies
Главный управляющий: Джон Шрёдер (John Schroeder)
Флагманский продукт компании, MapR Converged Data Platform, упрощает обработку больших данных, осуществляя сбор данных из разрозненных источников в единую «среду хранения» (data fabric), которая позволяет хранить,, обрабатывать, анализировать, применять данные и управлять ими по мере их образования. Платформа объединяет в себе Hadoop, Spark, Apache Drill и функции БД реального времени и обработки потока событий.
Из других продуктов компании следует отметить конвергентную платформу хранения MapR-XD, базу данных NoSQL-типа MapR-DB, систему публикации и подписки MapR-ES, а также MapR Analytics и Machine Learning Engine для обслуживания аналитики реального времени.
Micro Focus
Главный управляющий: Стивен Мёрдок (Stephen Murdoch)
Этот разработчик корпоративного ПО присутствует на рынке уже какое-то время, но по сути заново родился в сентябре прошлого года после слияния с бизнесом ПО компании Hewlett Packard Enterprise, получив в свое распоряжение ряд ее продуктов в сфере DevOps, доставки и администрирования приложений, управления гибридной ИТ-средой и предиктивной аналитики.
Из числа продуктов для больших данных следует отметить передовую аналитическую платформу Vertica, платформу SIEM-аналитики ArcSight, SecureData для Hadoop, а также платформу аналитики неструктурированных данных IDOL, которая позволяет собирать и анализировать корпоративные текстовые, аудио и видеоданные.
Oracle
Главные управляющие: Марк Херд, Сафра Кац
Обширный портфель продуктов Oracle включает компьютерное оборудование и прикладное ПО, но компания предлагает также целый ряд решений для больших данных, начиная с фирменной Oracle Database, которая остается ее флагманским продуктом.
В сфере управления данными помимо Oracle Database предлагается также база данных MySQL, СУБД NoSQL-типа и ряд технологий хранилищ данных, включая новое Oracle Autonomous Data Warehouse Cloud.
В области аналитики предложение компании включает продукты Oracle Analytics Cloud, Oracle Business Intelligence, Oracle Data Visualization и Oracle Essbase Cloud.
Snowflake Computing
Главный управляющий: Боб Мулья (Bob Muglia)
Компания Snowflake Computing разработала облачную корпоративную систему SQL-хранилища данных на собственной патентованной архитектуре, которая избавляет от сложностей администрирования и задач управления, свойственных традиционным хранилищам.
Платформа Snowflake, работающая на базе AWS, позволяет осуществлять аналитическую обработку структурированных и полуструктурированных данных с функциями отчетности.
В январе компания получила 263 млн. долл. в пятом раунде венчурного финансирования, что увеличило ее общую сумму финансирования до 473 млн. долл. и повысило оценку стоимости компании до 1,5 млрд. долл.
Teradata
Президент, главный управляющий: Виктор Лунд (Victor Lund)
Teradata является создателем истинных хранилищ данных. Сегодня ее предложения включают Teradata Database, Teradata Analytics Platform, интегрированное хранилище данных Teradata IntelliFlex и облачный сервис аналитики больших данных Teradata IntelliCloud, работающий по модели SaaS.
Ключевым компонентом будущего развития компании является ее система аналитической обработки Teradata Everywhere, позволяющая развертывать ее СУБД Teradata Database с массовым параллелизмом на базе облачных платформ AWS, Microsoft Azure, Teradata Managed Cloud, виртуализированной среды VMware и платформы Teradata IntelliFlex в любом их сочетании.
© 2018. The Channel Company LLC. Initially published on CRN.com, a The Channel Company website, at https://www.crn.com. Reprinted with permission.
Источник: Рик Уайтинг, CRN/США