Полный спектр управления

Экспоненциальный рост объема цифровых данных, с которыми приходится иметь дело организациям, требует мощных средств интеграции, управления и анализа для того, чтобы повысить эффективность, лучше понимать потребности клиентов и реализовать потенциальные конкурентные преимущества.

Вторая часть списка «Big Data 100», составленного редакцией CRN/США, включает 35 вендоров технологии управления данными и интеграции данных, предлагающих всё — от БД следующего поколения и средств интеграции разрозненных источников до систем управления потоковыми данными.

Alation

Главный управляющий: Сатьен Сангани (Satyen Sangani)
Редвуд-Сити, шт. Калифорния
Год создания: 2012

Система каталогов данных, разработанная Alation, использует средства машинного обучения для понимания ситуации. Она создает «опись» всех имеющихся информационных ресурсов, что помогает организациям, работающим «в потоке данных», легче находить, понимать и использовать информацию, а также управлять ею, чтобы быстрее принимать взвешенные решения.

В минувшем году Alation активно стремилась к альянсам с другими вендорами технологий больших данных и уже интегрировала свое ПО с продуктами Trifacta, Tableau, MicroStrategy, Teradata, Hortonworks и др.

AtScale

Главный управляющий: Дейв Мариани (Dave Mariani)
Сан-Матео, шт. Калифорния
Год создания: 2013

ПО компании AtScale дает возможность популярным инструментам бизнес-анализа, таким как Tableau и Qlik, работать с данными, хранящимися в кластерах Hadoop. Эта технология создает семантический уровень между Hadoop и сторонними инструментами, по сути превращая Hadoop в сервер оперативной аналитической обработки, который можно задействовать для многомерного анализа данных.

Недавно компании был присужден патент за способность ее вычислительного механизма работать с любым BI-инструментом визуализации.

В марте стартовала версия AtScale 5.0 с оптимизатором машинного обучения, универсальным уровнем абстракции и функциями безопасности, руководства данными и управления метаданными корпоративного класса.

Attunity

Главный управляющий: Шимон Алон (Shimon Alon)
Берлингтон, шт. Массачусетс
Год создания: 1988

Компания разрабатывает ПО интеграции и тиражирования данных, которое позволяет комбинировать их из разрозненных источников, что обеспечивает доступ к данным, управление и обмен ими в гетерогенной среде корпоративных платформ и облачных систем.

В феврале стартовала новейшая версия автоматизированного хранилища данных Attunity — Compose 3.0 с 10-кратным увеличением скорости извлечения, преобразования и загрузки информации (ETL) и новыми возможностями DevOps при разработке хранилищ данных.

Bedrock Data

Главный управляющий: Тор Джонсон (Thor Johnson)
Бостон
Год создания: 2012

Компания Bedrock Data предлагает платформу интеграции данных как услугу, которая постоянно просматривает и автоматически синхронизирует данные в информационных системах, включая облачные приложения автоматизации продаж, маркетинга и поддержки. Компания подчеркивает, что ее готовые коннекторы позволяют обойтись без написания кода для достижения такой интеграции.

В январе компания сообщила, что ее годовой доход от обслуживания новых и существующих клиентов более чем удвоился в 2016 г.

Confluent

Главный управляющий: Джей Крепс (Jay Kreps)
Пало-Альто, шт. Калифорния
Год создания: 2014

Confluent предлагает платформу данных, использующую свободную систему обмена сообщениями Apache Kafka, для сбора, анализа потоковых данных в реальном времени и управления ими, что становится всё более трудной задачей в эпоху Big Data и Интернета вещей.

Компания вышла на рынок в сентябре 2014 г. с намерением поставлять технологию и услуги, помогающие организациям использовать Kafka. Ее учредителями были Джей Крепс, Неха Нархеде (Neha Narkhede) и Цзюнь Жао (Jun Rao), которые создали Kafka, работая в LinkedIn.

В марте Confluent получила 50 млн. долл. в третьем раунде финансирования, общая сумма инвестиций в компанию составила 81 млн. долл.

Couchbase

Главный управляющий: Мэтт Кейн (Matt Cain)
Маунтин-Вью, шт. Калифорния
Год создания: 2011

Компания Couchbase и другие вендоры на тесном рынке баз данных NoSQL-типа позиционируют свои продукты как альтернативу реляционным СУБД, доминирующим сегодня в большинстве ЦОДов. Эти технологии следующего поколения могут лучше справляться с громадными объемами и разными типами данных.

В апреле новым главным управляющим компании назначен бывший президент Veritas Мэтт Кейн. Он сменил Боба Видерхольда (Bob Wiederhold), который стал председателем правления с исполнительными полномочиями.

Предлагаемые компанией продукты — Couchbase Server и Couchbase Mobile. В марте Couchbase сообщила, что отмечает быстрый рост корпоративных внедрений на рынке Интернета вещей.

Databricks

Главный управляющий: Али Годси (Ali Ghodsi)
Сан-Франциско
Год создания: 2013

Databricks была основана создателями Apache Spark, популярного свободного механизма обработки больших данных. Компания разрабатывает коммерческое ПО и услуги на базе Spark; в частности, она предлагает полную хостинговую платформу Databricks Cloud, которая стартовала в июне 2015 г.

В апреле была предложена новая версия ее облачного ПО, Databricks for Data Engineering, которая позволяет создателям систем анализа данных (data engineers) объединить рабочие нагрузки SQL, ETL, потоковой передачи структурированных данных и машинного обучения, выполняемые на Spark, и вводить эти системы в эксплуатацию.

DataStax

Главный управляющий: Билли Бозуорт (Billy Bosworth)
Санта-Клара, шт. Калифорния
Год создания: 2010

Компания DataStax предлагает коммерческую версию Apache Cassandra, свободной базы данных NoSQL-типа, предназначенной для работы с громадными объемами данных, которые хранятся в разных ЦОДах и в облаке, и предоставляет также набор сопутствующих инструментов администрирования, сопровождения, разработки и анализа.

В апреле была выпущена новая версия DataStax Enterprise 5.1, а также DataStax OpsCenter 6.1 и DataStax Studio 2.0. Компания подчеркнула, что DSE 5.1 обеспечивает в три раза большую производительность оперативной аналитики, чем свободная платформа Apache Cassandra, использующая Spark. Кроме того, в ней предложено упрощенное администрирование SaaS-приложений с множественной арендой.

DataTorrent

Президент и главный управляющий: Гай Чёрчвард (Guy Churchward)
Сан-Хосе
Год создания: 2012

Компания DataTorrent предлагает платформу больших данных для объединенной потоковой и пакетной обработки, которая позволяет осуществлять мониторинг, анализировать поступающие данные и действовать, исходя из них, в оперативном режиме.

В марте компания сообщила, что достигла шестикратного роста числа заказчиков, использующих в работе ее ПО, по сравнению с прошлым годом и 105%-ного роста дохода от оформленных подписок.

Учредителями компании были создатели Apache Apex, свободного механизма пакетной и потоковой обработки.

EnterpriseDB

Президент и главный управляющий: Эд Бояджян (Ed Boyajian)
Бедфорд, шт. Массачусетс
Год создания: 2004

Компания предлагает совместимую с Oracle реляционную СУБД на основе свободной базы данных PostgreSQL наряду с расширениями, обеспечивающими безопасность и увеличение производительности, средствами администрирования и другими услугами поддержки. Продукт обеспечивает управление структурированными и неструктурированными данными в рамках одной СУБД.

В феврале компания объявила о готовности платформы EDB Postgres 2017, предложив технические расширения для поддержки более сложных нагрузок и аналитических задач и упростив управление большими массивами данных.

Informatica

Главный управляющий: Анил Чакраварти (Anil Chakravarthy)
Редвуд-Сити, шт. Калифорния
Год создания: 1993

Informatica — ветеран разработки технологий управления данными и ETL, в том числе средств управления мастер-данными, облачной интеграции данных и обеспечения их качества. Созданное компанией ПО извлечения, преобразования и загрузки информации (ETL) давно стало ключевым компонентом в практике интеграции данных многих организаций.

В марте была предложена всеобъемлющая облачная система управления озерами данных, развернутыми в облаке или в локальной ИТ-среде организаций, под названием Informatica Cloud Data Lake Management. Она построена на базе платформы Informatica Intelligent Data Lake и обеспечивает поддержку AWS Redshift и Aurora, а также Azure SQL Database и SQL Data Warehouse от Microsoft.

JethroData

Главный управляющий: Илай Сингер (Eli Singer)
Нью-Йорк
Год создания: 2012

Компания JethroData разработала механизм SQL-на-Hadoop, который действует как ускоряющий уровень бизнес-анализа-на-Hadoop, позволяя быстро обрабатывать запросы из инструментов BI, таких как Tableau, Qlik и MicroStrategy, к любым источникам больших данных, включая Hadoop и Amazon S3.

В марте была выпущена новая версия Jethro 3.0, облегчающая решение затратных и трудоемких задач построения систем анализа больших данных, таких как предварительная агрегация таблиц, построение кубов данных вручную и администрирование новых и изменившихся приложений. В версии 3.0 данные можно загрузить в Jethro непосредственно из таблиц Hadoop; имеется также расширенный пользовательский интерфейс.

MarkLogic

Президент и главный управляющий: Гари Блум (Gary Bloom)
Сан-Карлос, шт. Калифорния
Год создания: 2001

Компания предлагает корпоративную СУБД NoSQL-типа с гибкой моделью данных, позволяющую хранить структурированные и неструктурированные данные, управлять ими, делать запросы, проводить поиск, а также ускорить интеграцию разнородных данных.

Новая версия MarkLogic 9 находится пока на бета-стадии; она обещает значительные сдвиги в интеграции данных и включает новые функции безопасности.

Компания поразила отрасль в 2015 г., получив 102 млн. долл. в шестом раунде финансирования.

Matillion

Исполнительный директор: Мэттью Скаллион (Matthew Scullion)
Манчестер (Великобритания)/Нью-Йорк
Год создания: 2011

Matillion разрабатывает ПО, с помощью которого организации могут оперировать своими данными, хранящимися в облаке.

Компания предлагает два продукта: ETL for Redshift, инструмент извлечения, преобразования и загрузки информации для работы с хостинговым хранилищем данных Redshift от AWS, и Cloud Business Intelligence, инструмент бизнес-анализа и отчетности с самообслуживанием, работающий с Matillion ETL.

MemSQL

Главный управляющий: Эрик Френкиль (Eric Frenkiel)
Сан-Франциско
Год создания: 2011

Компания MemSQL предлагает распределенную СУБД-в-памяти, которая может обрабатывать транзакции и прогонять аналитику в реальном времени, используя SQL.

В апреле была представлена обновленная версия MemSQL с расширенными корпоративными функциями безопасности и опцией усиленной защиты. Она включает также новые функции высокопроизводительной загрузки данных для облачного сервиса хранения Amazon S3.

MongoDB

Президент и главный управляющий: Дев Иттикерия (Dev Ittycheria)
Нью-Йорк/Пало-Альто, шт. Калифорния
Год создания: 2007

Компания разрабатывает базу данных NoSQL-типа, позиционируя ее, подобно другим аналогичным продуктам, как альтернативу традиционным реляционным СУБД, лучше отвечающую потребностям сегодняшней среды больших данных.

В ноябре была предложена новая версия MongoDB 3.2 с новыми механизмами хранения данных и функциями руководства данными, расширяющими потенциальный рынок продукта для использования в приложениях корпоративного класса, считает компания.

В марте MongoDB расширила свою программу для OEM-партнеров, дополнив ее новыми опциями анализа проектов и поддержки разработки, которые помогают независимым поставщикам ПО (ISV) встраивать и внедрять базу данных MongoDB вместе с их приложениями.

Также в марте компания впервые предложила новый, бесплатный уровень в своей СУБД-как-услуге MongoDB Atlas.

Neo Technology

Главный управляющий: Эмиль Эйфрем (Emil Eifrem)
Сан-Матео, шт. Калифорния
Год создания: 2007

Компания Neo Technology разрабатывает графовую базу данных Neo4j. Это разновидность баз данных NoSQL-типа, которые используют структуры графов для отображения данных, хранения и осуществления запросов. Считается, что графовые БД быстрее работают с массивами ассоциативных данных и легче масштабируются для обработки больших массивов.

В ноябре компания получила 36 млн. долл. в четвертом раунде финансирования.

СУБД Neo4j получила «боевое крещение» в 2016 г., когда международный консорциум журналистов воспользовался ею для изучения «Панамского архива», который СМИ назвали крупнейшей опубликованной утечкой данных за всю историю.

Paxata

Главный управляющий: Пракаш Нандури (Prakash Nanduri)
Редвуд-Сити, шт. Калифорния
Год создания: 2012

Платформа Adaptive Information компании Paxata с функциями самообслуживания, построенная на Apache Spark и оптимизированная для среды Hadoop, предоставляет средства интеграции данных, обеспечения их качества и семантического обогащения, функции коллективной работы и полного управления данными.

Ее новый релиз Spring ’17 включает ряд новшеств и расширений для работы с облаком Microsoft Azure и новый механизм мультиоблачной интеграции InterCloud Connect.

Pepperdata

Главный управляющий: Аш Мунши (Ash Munshi)
Купертино, шт. Калифорния
Год создания: 2012

Компания Pepperdata разрабатывает программные средства, позволяющие управлять кластерами Hadoop с сотнями и даже тысячами узлов. Используя ее технологию, ИТ-отделы могут осуществлять мониторинг и контролировать использование системных ресурсов, чтобы удовлетворить условиям соглашений об уровне обслуживания (SLA), увеличить пропускную способность передачи данных и обеспечить прозрачность ИТ-среды.

В марте компания пополнила свой портфель продуктов инструментом Pepperdata Application Profiler, реализующим принципы DevOps; он поможет повысить производительность приложений, использующих Hadoop и Spark.

Podium Data

Главный управляющий: Пол Барт (Paul Barth)
Лоуэлл, шт. Массачусетс
Год создания: 2014

Компания предлагает систему Podium Data Marketplace «под ключ» для управления озером данных на базе Hadoop — централизованным репозиторием, объединяющим в себе информацию из множества хранилищ.

В сентябре Podium Data получила 9,5 млн. долл. финансирования первоначального этапа развития.

Qubole

Главный управляющий: Ашиш Тузу (Ashish Thusoo)
Санта-Клара, шт. Калифорния
Год создания: 2011

Компания предлагает унифицированный интерфейс Qubole Data Service, помогающий анализировать данные, хранящиеся в облачных системах Amazon Web Services, Google Cloud и Microsoft Azure.

В феврале компания объявила, что Qubole Data Services работает также с облаком Oracle Cloud.

В январе Qubole получила 30 млн. долл. в третьем раунде финансирования.

Redis Labs

Главный управляющий: Офер Бенгал (Ofer Bengal)
Маунтин-Вью, шт. Калифорния
Год создания: 2011

Компания Redis Labs предлагает высокопроизводительную СУБД-в-памяти NoSQL-типа Redis Enterprise для быстрой обработки транзакций и аналитики реального времени. Это коммерческая версия ее свободной базы данных Redis.

В 2016 г. более 1,3 тыс. организаций начали использовать платформу Redis Enterprise, и ее глобальная база пользователей достигла 61 тыс., в том числе 7 тыс. корпоративных клиентов.

Reltio

Главный управляющий: Маниш Суд (Manish Sood)
Редвуд-Шорз, шт. Калифорния
Год создания: 2011

Облако Reltio Cloud сочетает в себе функции управления метаданными и графовой базы данных NoSQL-типа и предоставляет платформу для создания приложений корпоративного уровня, управляемых потоком данных, и для крупномасштабной аналитической обработки.

Версия Reltio Cloud 2017.1, выпущенная в этом году, включает новые функции интеграции, коллективной работы и глобализации.

В апреле компания получила 40 млн. долл. в третьем раунде финансирования.

SAP

Главный управляющий: Билл Макдермотт
Вальдорф (Германия)

Компания SAP — крупный игрок на арене больших данных. В ее арсенале такие продукты, как линейка ПО бизнес-анализа Business Objects, СУБД-в-памяти и прикладная платформа HANA, механизм запросов Vora, хранилище данных BW/4HANA и др.

В сентябре SAP купила стартап Altiscale, разработавший облачную версию системы Hadoop для хранения, обработки и анализа данных. Платформа Altiscale была переименована в SAP Cloud Platform Big Data Services.

SnapLogic

Главный управляющий: Гаурав Диллон (Gaurav Dhillon)
Сан-Матео, шт. Калифорния
Год создания: 2006

Компания предлагает портфель продуктов для интеграции данных и приложений, в том числе для «подключения» корпоративных приложений к данным, хранящимся локально и в облаке, что ставит ее в самый центр высококонкурентного сегмента платформ-интеграции-как-услуги (iPaaS).

В декабре компания получила 40 млн. долл. в шестом раунде финансирования и общая сумма вложенных в нее инвестиций достигла 136,3 млн. долл.

Гаурав Диллон, соучредитель и главный управляющий SnapLogic, был главным управляющим и соучредителем компании Informatica.

Splice Machine

Главный управляющий: Монт Цвебен (Monte Zweben)
Сан-Франциско
Год создания: 2012

Компания Splice Machine разрабатывает свободную реляционную СУБД, использующую технологии Hadoop и Spark, предоставляя при этом знакомый SQL-интерфейс для прикладной разработки. Компания подчеркивает, что ее база данных обеспечивает поддержку рабочих нагрузок обработки транзакций и аналитической обработки.

Компания готовит также СУБД-как-услугу, которая будет работать на базе облака Amazon Web Services.

Striim

Президент и главный управляющий: Али Кутай (Ali Kutay)
Пало-Альто, шт. Калифорния
Год создания: 2012

Striim — одна из нескольких компаний в списке «Big Data 100» этого года, помогающих справиться с задачей обработки потоковых данных. Она разрабатывает ПО, объединяющее интеграцию потоковых данных и потоковую оперативную аналитику в рамках одной системы, что делает возможными непрерывную обработку запросов и потоковый анализ.

В апреле компания выпустила версию 3.7 своего ПО, которая облегчит гибридную облачную интеграцию в реальном времени и упростит администрирование приложений, работающих с потоковыми данными.

Компания Striim (произносится с долгим «и», при этом две «i» в названии означают «integration» и «intelligence») была создана бывшими руководителями из Oracle, Informatica, WebLogic и других известных компаний на арене управления данными.

Syncsort

Главный управляющий: Джош Роджерс (Josh Rogers)
Пёрл-Ривер, шт. Нью-Йорк
Год создания: 1968

Компания Syncsort предлагает широкий спектр ПО преобразования и интеграции данных для Hadoop, Microsoft Windows, Linux, мэйнфреймов и облачных систем.

В декабре Syncsort купила компанию Trillium Software, разработчика инструментов обеспечения качества данных, отметив, что эта технология поможет ее заказчикам эффективнее использовать их ресурсы данных.

Talena

Главный управляющий: Нитен Донд (Nitin Donde)
Сан-Хосе
Год создания: 2013

Стартап Talena разрабатывает ПО управления доступностью данных, сочетающее в себе методы оптимизации хранения и машинное обучение для эффективного управления рабочими нагрузками администрирования больших данных и точного прогнозирования уровня доступности данных.

В апреле компания сообщила, что за последние 12 месяцев отметила восьмикратный рост количества корпоративных пользователей Cassandra и DataStax Enterprise, начавших применять ее ПО для управления резервным копированием, восстановлением и тестированием. В настоящее время под управлением ПО Talena находится 1 петабайт данных, хранящихся в Apache Cassandra, заявляет компания.

Talend

Главный управляющий: Майк Тушен (Mike Tuchen)
Редвуд-Сити, шт. Калифорния
Год создания: 2006

Компания Talend разрабатывает ряд коммерческих и свободных программных продуктов для интеграции данных, управления мастер-данными и качеством данных, а также других задач обработки больших массивов информации.

Версия Winter’17 ее главной системы интеграции данных, Talend Data Fabric, включает новые средства подготовки и руководства данными с самообслуживанием, что облегчает доступ к данным, их очистку и использование в больших массивах и озерах.

Изначально штаб-квартира компании находилась в Париже (Франция), но в настоящее время расположена в Редвуд-Сити, шт. Калифорния.

Tamr

Главный управляющий: Энди Палмер (Andy Palmer)
Кеймбридж, шт. Массачусетс
Год создания: 2013

Компания Tamr разработала платформу унификации, которая преобразует «темные, неочищенные и разрозненные данные» из сотен и даже тысяч источников внутри и вне организации в чистые, связанные данные.

В марте компания объявила о реселлерском соглашении с Hewlett Packard Enterprise, по которому HPE будет продавать услуги унификации данных Tamr во всем мире.

Учредителями компании были ветераны разработки СУБД Энди Палмер и Майкл Стоунбрейкер (Michael Stonebraker).

Trifacta

Главный управляющий: Адам Уилсон (Adam Wilson)
Сан-Франциско
Год создания: 2012

Trifacta разрабатывает ПО «окультуривания» (data wrangling), преобразующее «сырые» данные сложного состава в чистые, структурированные форматы, помогая справиться с одной из главных трудностей анализа больших данных.

Компания заявила о четырехкратном росте объема оформленных заказов в 2016 г. и более чем утроила количество обслуживаемых корпоративных клиентов.

VoltDB

Президент и главный управляющий: Дэвид Флауэр (David Flower)
Бедфорд, шт. Массачусетс
Год создания: 2009

Компания VoltDB разрабатывает SQL-базу-данных-в-памяти, сочетающую в себе потоковую аналитику и средства обработки транзакций. Организации используют ее СУБД при создании критически важных приложений, способных обрабатывать потоковые данные в момент их поступления для принятия оперативных решений.

В марте президентом и главным управляющим компании был назначен Дэвид Флауэр, ранее занимавший пост директора по прибыли. Он намерен расширить присутствие VoltDB на определенных рынках. Прежний CEO Брюс Рединг (Bruce Reading) стал главным управляющим компании Pica9, разработчика ПО автоматизации маркетинга.

Waterline Data

Главный управляющий: Алекс Горелик (Alex Gorelik)
Маунтин-Вью, шт. Калифорния
Год создания: 2013

Компания Waterline Data предлагает систему каталогов данных, которая автоматически обнаруживает, систематизирует и выводит на просмотр ценную информацию, разбросанную по всей организации.

В феврале компания объявила о релизе версии Smart Data Catalog 4.0; она обеспечивает автоматизированный процесс тегирования метаданных, который быстро классифицирует и организует имеющиеся в организации ресурсы данных с учетом их объема, упрощая их анализ инструментами с самообслуживанием и задачи комплексного управления.

Zaloni

Главный управляющий: Бен Шарма (Ben Sharma)
Дарем, шт. Сев. Каролина
Год создания: 2007

Zaloni называет себя «компанией озер данных»; она разрабатывает ПО, позволяющее строить озеро данных гораздо быстрее, чем с помощью других технологий, и управлять им.

Предлагаемые ею продукты — платформа Bedrock Data Lake Management для комплексного управления и администрирования данных и пакет Data Lake 360, обеспечивающий управление озером данных и полную их видимость.

Компания сообщила, что утроила свою базу клиентов и доход от продуктов в 2016 г.

© 2017. The Channel Company LLC. Initially published on CRN.com, a The Channel Company website, at https://www.crn.com. Reprinted with permission.