Необходимо управлять

В прошлом году общий объем цифровой информации на планете оценивался в 4,4 Зеттабайт, согласно ежегодному отчету IDC «Digital Universe» (1 Зеттабайт = 1000 эксабайт). Ожидается, что к 2020 г. этот показатель вырастет в 10 раз и составит 44 Зеттабайт.

И всеми этими данными надо управлять. К счастью, есть также целая волна новых технологий, которые помогают организациям не просто эффективно распоряжаться всеми этими данными, но и находить способы применять их с пользой .

Редакционная команда CRN/США подготовила третий ежегодный список «Big Data 100», включив в него вендоров, которые выводили на рынок программные продукты и услуги, помогающие работать с большими данными. Ниже представлены 30 вендоров ПО управления данными, предлагающих всё, от СУБД следующего поколения и мощных технологий интеграции данных до средств разработки приложений, позволяющих извлечь максимум ценной информации из больших данных.

1010data

Соучредитель и главный управляющий: Сэнди Стейер (Sandy Steier)

Компания из Нью-Йорка, созданная в 2000 г., предлагает платформу Big Data Discovery для обнаружения данных и совместного использования приложений, особенно при работе с очень большими массивами данных. Эта платформа вызывает наибольший интерес у ритейлеров, в сфере финансовых услуг и игорном бизнесе.

В апреле была предложена версия 8 платформы Big Data Discovery с обновленным инструментарием QuickApps для разработки анализа на основе формуляров, панелей управления и сложных аналитических приложений.

Actian

Президент и главный управляющий: Стив Шайн (Steve Shine)

Компания Actian (Редвуд-Сити, шт. Калифорния) позиционирует себя как ведущего поставщика SQL-аналитики для Hadoop со своей платформой Actian Analytics. Компания предлагает также ряд баз данных для операционных приложений и программных продуктов интеграции данных. Она фигурирует в группе «Провидцы» (Visionaries) в «Магическом квадранте» Gartner в категории хранилищ данных и решений по управлению данными для аналитики.

Actifio

Главный управляющий: Аш Ашутош (Ash Ashutosh)

Созданная в 2009 г. компания Actifio (Уолтем, шт. Массачусетс)предлагает платформу управления копиями данных, устраняющую проблему «их разрастания» в организации, создавая одну копию всех рабочих данных и делая ее виртуально доступной для резервного копирования, аварийного восстановления, разработки и тестирования ПО, а также для целей бизнес-аналитики и архивирования.

В феврале компания представила платформу Actifio One — «облако отказоустойчивости бизнеса» (business resiliency cloud), которая построена на ее технологии виртуализации копий данных и предоставляет набор функций управления и защиты данных в виде единого приложения.

Aerospike

Главный управляющий: Джон Дилльон (John Dillon)

Компания Aerospike разрабатывает свободную базу данных NoSQL-типа для высокопроизводительных приложений. Эта, оптимизированная для флэш-накопителей СУБД-в-памяти отвечает требованиям ACID (атомарность, непротиворечивость, изолированность, долговечность) по надежности обработки транзакций.

В феврале Aerospike (Маунтин-Вью, шт. Калифорния), созданная в 2009 г., назначила Дилльона своим главным управляющим. Он был менеджером по продажам Oracle на заре ее существования и главным управляющим Salesforce.com с 1999 по 2001 гг., а в более поздний период — главным управляющим компании Engine Yard, поставщика технологии разработки.

Alation

Главный управляющий: Сатьен Сангани (Satyen Sangani)

Стартап Alation (Редвуд-Сити, шт. Калифорния) только что вышел из «скрытого режима». В марте компания представила технологию доступности данных, которая призвана облегчить поиск , понимание и использование нужных данных и управление ими, чтобы быстрее принимать верные решения. В числе первых заказчиков фигурируют eBay, MarketShare и Inflection.

Компания, созданная в 2012 г., недавно получила 9 млн. долл. финансирования первоначального этапа развития — деньги она планирует потратить на ускорение разработки продукта, сбыт и маркетинг.

AtScale

Учредитель и главный управляющий: Дейв Мариани (Dave Mariani)

Еще один стартап, недавно вышедший из «скрытого режима». AtScale (Сан-Матео, шт. Калифорния) разрабатывает платформу AtScale Intelligence, с которой широко используемые инструменты бизнес-аналитики получают доступ к данным, хранимым в кластерах Hadoop.

AtScale (основана в 2013 г.) намерена устранить камень преткновения для многих проектов Big Data: сегодня корпоративные данные всё чаще собираются и хранятся в Hadoop, но многие работающие с информацией и вооруженные соответствующими инструментами отчетности и бизнес-аналитики располагают лишь считанными способами прямого доступа к этим данным.

Attunity

Главный управляющий: Шимон Алон (Shimon Alon)

Attunity специализируется на обеспечении доступности информации, предлагая инструменты для тиражирования данных, сбора изменений в них, подключения к ним, корпоративной репликации и управляемого переноса файлов, доставки облачных данных.

В марте Attunity купила компанию Appfluent Technology, разработчика ПО аналитики использования данных для среды Big Data, за 18 млн. долл. Технология Appfluent помогает организациям анализировать паттерны использования данных и перемещает большие объемы и рабочие нагрузки их обработки в Hadoop.

Attunity, основанная в 1998 г., базируется в Берлингтоне, шт. Массачусетс. Компания сообщила о росте дохода в 2014 г.на 41%, до 35,7 млн. долл.

Basho Technologies

Президент и главный управляющий: Адам Рей (Adam Wray)

Компания Basho, которая создана в 2008 г. и базируется в Белвью, шт. Вашингтон, разрабатывает распределенную базу данных Riak NoSQL-типа, предназначенную для задач, требующих максимально высокой доступности, а также облачную объектно-ориентированную базу данных Riak CS, работающую на Riak.

В 2014 г. компании пришлось пережить трудные времена: уход главного управляющего Грега Коллинза и директора по технологии Джастина Шихи (Justin Sheehy). В этом году Basho получила седьмой раунд финансирования 25 млн. долл. в январе и сообщила, что объем заказов в I квартале вырос на 65% (за год).

Citus Data

Главный управляющий: Умур Кубукчу (Umur Cubukcu)

Компания Citus Data разработала столбцовую базу данных CitusDB с массовым параллелизмом, построенную на основе свободной СУБД PostgreSQL. Компания заявляет, что ее БД, ориентированная на обработку транзакций и задачи аналитики, способна обрабатывать петабайты данных за секунды.

Citus Data, созданная в 2010 г., базируется в Сан-Франциско. В марте компания выпустила версию CitusDB 4.0 с возросшей производительностью запросов и поддержкой рабочих нагрузок реального времени.

ClearStory Data

Учредитель и главный управляющий: Шармила Маллиган (Sharmila Mulligan)

ПО компании ClearStory работает над упрощением доступа к внешним и внутренним источникам данных организаций, включая корпоративные базы данных, Hadoop и Интернет, и использованием их для выявления трендов и паттернов.

ClearStory Data, которая была учреждена в 2011 г. и базируется в Менло-Парк, шт. Калифорния, недавно расширила облачный механизм обработки Intelligent Data Harmonization, предназначенный для аналитиков и бизнес-пользователей, и более тесно интегрировала свое ПО с механизмом аналитики-в-памяти Apache Spark.

Couchbase

Президент и главный управляющий: Боб Видерхольд (Bob Wiederhold)

Couchbase работает в тесном пространстве «альтернативных СУБД», соперничая с MongoDB, Cassandra и др. со своим продуктом Couchbase Server — коммерческой версией Apache CouchDB, свободной документоориентированной базы данных NoSQL-типа.

В марте была выпущена версия Couchbase Server 4.0 с многомерным масштабированием, которое, как говорит компания, повышает производительность, независимо распределяя и масштабируя службы индексирования, запросов и доступа к данным по конкретным серверам.

Couchbase была основана в 2011 г. и базируется в Маунтин-Вью, шт. Калифорния.

Databricks

Главный управляющий: Йон Стоика (Ion Stoica)

Компания Databricks из Сан-Франциско была учреждена в 2013 г. создателями Apache Spark — свободного, сверхбыстрого механизма обработки больших данных, который значительно ускоряет Hadoop, и некоторые обозреватели считают, что он может даже заменить эту платформу. Компания разрабатывает коммерческие сервисы для Spark, в частности полную хостинговую платформу данных Databricks Cloud.

DataStax

Главный управляющий: Билли Бозуорт (Billy Bosworth)

Компания (Санта-Клара, шт. Калифорния) разработала платформу данных высокой масштабируемости на основе Apache Cassandra, свободной распределенной СУБД для хранения громадных объемов данных и управления ими с охватом множества ЦОДов и облака.

В апреле DataStax сообщила, что ее база клиентов превысила 500 корпоративных заказчиков во всем мире; в их числе Netflix, Target, Comcast и ING. Компания была создана в 2010 г.

DataTorrent

Соучредитель и главный управляющий: Фу Хонг (Phu Hoang)

DataTorrent разрабатывает систему потоковой обработки в реальном времени DataTorrent RTS на базе Hadoop 2.0, которая позволяет отслеживать, обрабатывать, анализировать большие данные и сразу же действовать.

DataTorrent (Санта-Клара, шт. Калифорния), созданная в 2012 г., в апреле получила второй раунд финансирования 15 млн. долл., что довело общую сумму инвестиций до 23,8 млн. долл.

EnterpriseDB

Президент и главный управляющий: Эд Бояджян (Ed Boyajian)

Компания EnterpriseDB предлагает ПО и услуги на базе популярной свободной реляционной СУБД PostgreSQL. Ее продукт Postgres Plus Advanced Server совместим с Oracle Database, а также со средствами управления базой данных и тиражирования и другими продуктами этого вендора.

EnterpriseDB была создана в 2004 г. и базируется в Бедфорде, шт. Массачусетс. В апреле она объявила о партнерстве с Lenovo, в рамках которого две компании будут совместно продвигать Postgres Plus Advanced Server на серверах Lenovo, в том числе через глобальную сеть своих реселлеров.

Hazelcast

Главный управляющий: Грег Лак (Greg Luck)

Компания разрабатывает ПО размещения-данных-в-памяти (data grid), которое равномерно распределяет данные по нескольким узлам в кластере, обеспечивая лучшее горизонтальное масштабирование в хранении и обработке. ПО предлагается с открытой лицензией Apache, но компания разрабатывает также коммерческую версию и услуги на основе своей технологии.

Hazelcast была создана в 2008 г. и базируется в Пало-Альто, шт. Калифорния. В сентябре она получила второй раунд финансирования 11 млн. долл. и использует эти деньги для продолжения разработки с тем, чтобы превратить свою технологию гридов данных в законченную корпоративную систему вычислений-в-памяти NoSQL-типа.

Informatica

Главный управляющий: Сохаиб Аббаси (Sohaib Abbasi)

Созданная в 1993 г. компания (Редвуд-Сити, шт. Калифорния), наверное, самый значительный игрок в области интеграции данных со своими инструментами извлечения, преобразования и загрузки данных (ETL) из корпоративных приложений, а также средствами управления качеством данных и управления мастер-данными.

Компания продолжала расширять свою технологическую линейку , в том числе предложив инструменты интеграции данных в облаке и в виде платформы-интеграции-как-услуги.

В начале апреля компания объявила, что ее покупают инвестиционный фонд Permira Funds и Пенсионный фонд Канады (Canada Pension Plan) за 5,3 млрд. долл. Informatica сообщила об объеме продаж в I квартале (завершился 31 марта) в размере 250,5 млн. долл. (рост на 3% за год).

JethroData

Соучредитель и главный управляющий: Илай Сингер (Eli Singer)

Hadoop — не самая подходящая платформа для выполнения интерактивных запросов, это означает, что организациям по-прежнему одновременно приходится использовать свои корпоративные хранилища данных для решения повседневных задач бизнес-анализа.

Компания JethroData (Нетания, Израиль) разработала механизм SQL-запросов на основе индексирования для Hadoop и заявляет, что ее технология делает возможной интерактивную бизнес-аналитику в Hadoop. В конце 2014 г. появилась открытая бета-версия ее ПО, а 7 апреля, после двух лет разработки, была предложена JethroData 1.0, первая общедоступная версия ее продукта. Компания создана в 2012 г.

MarkLogic

Президент и главный управляющий: Гари Блум (Gary Bloom)

Компания (Сан-Карлос, шт. Калифорния) работает с 2001 г. и занялась проблемой обработки больших данных еще до того, как появился сам этот термин.

В феврале компания объявила о выпуске MarkLogic 8, новейшей версии ее базы данных NoSQL-типа с поддержкой JavaScript и JSON (JavaScript Object Notation) на сервере, что упрощает для разработчиков создание и внедрение приложений реального времени с большими объемами данных на базе этой БД.

MemSQL

Соучредитель и главный управляющий: Эрик Френкиль (Eric Frenkiel)

Компания MemSQL разрабатывает базу-данных-в-памяти, которая позволяет организациям обрабатывать транзакции и выполнять задачи бизнес-аналитики одновременно, используя данные реального времени и ретроспективные данные, в рамках одной СУБД.

MemSQL, которая создана в 2011 г. и базируется в Сан-Франциско, начала продажи своего ПО два года назад. Одним из ее инвесторов является фирма In-Q-Tel, которая направляет финансовые средства в самые передовые технологии, представляющие интерес для разведорганов США.

MongoDB

Главный управляющий: Дев Иттичериа (Dev Ittycheria)

Вендоров баз данных NoSQL-типа становится всё больше, но компания MongoDB, разрабатывающая свободную NoSQL-СУБД того же названия (которое происходит от слова «humongous» — чудовищный, огромный), — одна из немногих, которые поднялись выше средней планки.

В феврале была предложена версия MongoDB 3.0, в которой значительно увеличена производительность и масштабируемость благодаря новому механизму хранения WiredTiger.

MongoDB, основана в 2007 г. и имеет две штаб-квартиры в США — в Нью-Йорке и Пало-Альто, шт. Калифорния. В январе компания получила седьмой раунд финансирования в размере 80 млн. долл., что довело общую сумму финансирования до более чем 311 млн. долл.

Neo Technology

Главный управляющий: Эмил Эйфрем (Emil Eifrem)

Компания Neo Technology из Сан-Матео, шт. Калифорния — разработчик графовой базы данных Neo4j. Такие СУБД есть не что иное, как разновидность баз данных NoSQL-типа и используют структуры графов вместо индексов для представления и хранения данных, что обеспечивает очень высокую масштабируемость и большую эффективность управления и выполнения запросов к тесно связанным данным.

В марте Neo Technology, созданная в 2007 г., выпустила версию Neo4j 2.2 с увеличенной производительностью чтения и записи, что позволяет ускорять создание работающих приложений. В январе компания получила 20 млн. долл. в третьем раунде финансирования, что довело ее общую сумму финансирования до 44,1 млн. долл.

Paxata

Соучредитель и главный управляющий: Пракаш Нандури (Prakash Nanduri)

Paxata разрабатывает ПО «адаптивной подготовки данных с самообслуживанием», которое упрощает часто нудную работу преобразования исходных данных, чтобы их можно было изучать средствами бизнес-аналитики. Компания позиционирует свое решение как альтернативу традиционному подходу, который полагается на хранилища данных, созданные и обслуживаемые ИТ-отделом.

Paxata (Редвуд-Сити, шт. Калифорния) была создана в 2012 г. В марте она подписала соглашение с поставщиком решений Carahsoft Technology Corp., обслуживающим госсектор, в рамках которого Carahsoft будет внедрять платформу Paxata Adaptive Data Preparation в государственных органах.

Recommind

Главный управляющий: Боб Теннант

Компания из Сан-Франциско разрабатывает корпоративную платформу поиска и классификации данных, которая организует громадные объемы информации из множества источников и обеспечивает управление ею и предоставление этой информации. Главный рынок для такой технологии — адвокатские конторы и юридическое сообщество.

В январе была предложена обновленная версия облачной платформы истребования электронных документов (e-discovery) и анализа Axcelerate 5 с новыми функциями бизнес-аналитики. Компания была создана в 2000 г.

SnapLogic

Главный управляющий: Гаурав Дхиллон (Gaurav Dhillon)

Компания (Сан-Матео, шт. Калифорния) предлагает инструменты платформы-интеграции-данных-как-услуги (iPaaS) для подключения облачных источников данных. Ее платформа SnapLogic Elastic Integration стартовала в конце 2013 г. и сейчас числит своими заказчиками AstraZeneca, CapitalOne, Cisco и Yelp.

SnapLogic, созданная в 2006 г., привлекает к себе всё больше внимания, поскольку интеграция данных оказывается главной проблемой многих проектов Big Data. В октябре SnapLogic получила 20 млн. долл. в четвертом раунде венчурного финансирования, что довело ее общую сумму финансирования до 58,8 млн. долл.

Splice Machine

Соучредитель и главный управляющий: Монт Цвебен (Monte Zweben)

Компания Splice Machine из Сан-Франциско, созданная в 2012 г., разработала полнофункциональную, транзакционную базу данных SQL-типа на Hadoop, которая может прогонять операционные приложения и аналитику реального времени, используя данные Hadoop. После нескольких месяцев разработки и бета-тестирования Splice Machine выпустила версию 1.0 своего ПО в ноябре.

Splice Machine только что объявила о партнерстве с mrc (Michaels, Ross & Cole Ltd.), в рамках которого компании интегрируют Hadoop-СУРБД, созданную Splice Machine, с платформой разработки веб-приложений m-Power, имеющейся у mrc, что позволит упростить строительство и внедрение приложений на Hadoop.

Talend

Главный управляющий: Майк Тюшен (Mike Tuchen)

Talend предлагает обширную линейку open-source ПО управления данными, в том числе инструменты для интеграции данных, управления их качеством, управления мастер-данными и бизнес-процессами, а также корпоративную сервисную шину (ESB-сервисы).

Talend, учрежденная в Париже в 2005 г., имеет теперь штаб-квартиру в Редвуд-Сити, шт. Калифорния. В марте компания представила облачную версию своей технологии интеграции данных, нацеливаясь на средства облачной и гибридной интеграции — первый шаг перехода к новой стратегии разработки «облако в первую очередь».

Tamr

Главный управляющий: Энди Палмер

Tamr разрабатывает ПО унификации корпоративных данных, позволяющее организациям интегрировать разнородные, обособленные данные для задач бизнес-аналитики.

Компания, которая базируется в Кеймбридже, шт. Массачусетс, была основана в 2013 г. двумя ветеранами разработки баз данных, Майклом Стоунбрейкером и Энди Палмером, которые создали также Vertica Systems. Сегодня Палмер — главный управляющий Tamr, а Стоунбрейкер — директор по технологии.

Trifacta

Главный управляющий: Адам Уилсон

Сделать большие данные доступными и пригодными к использованию — трудная задача для многих организаций. Trifacta разрабатывает технологию, которая служит для преобразования исходных, сложных данных в чистые и структурированные форматы для анализа. Сама компания называет это «data wrangling»*.

В феврале Trifacta(2012 г., базируется в Сан-Франциско) заключила соглашения об интеграции и дальнейшей разработке с MapR Technologies, Waterline Data и Zoomdata.

Xplenty

Учредитель и главный управляющий: Янив Мор (Yaniv Mor)

Компания из Тель-Авива создала облачную платформу Hadoop-как-услуга, которая интегрирует и преобразует структурированные, полуструктурированные и неструктурированные данные в форму, пригодную для анализа.

Компания была основана в 2011 г.; в октябре получила финансирование первоначального этапа развития — 3 млн. долл., которые используются на продолжение разработки ее технологии и расширение маркетинга.

* Условный перевод: «уход за данными». (Прим. перев.)

© 2015. The Channel Company LLC. Initially published on CRN.com, a The Channel Company website, at https://www.crn.com. Reprinted with permission.