Необходимо управлять
В прошлом году общий объем цифровой информации на планете оценивался в 4,4 Зеттабайт, согласно ежегодному отчету IDC «Digital Universe» (1 Зеттабайт = 1000 эксабайт). Ожидается, что к 2020 г. этот показатель вырастет в 10 раз и составит 44 Зеттабайт.
И всеми этими данными надо управлять. К счастью, есть также целая волна новых технологий, которые помогают организациям не просто эффективно распоряжаться всеми этими данными, но и находить способы применять их с пользой .
Редакционная команда CRN/США подготовила третий ежегодный список «Big Data 100», включив в него вендоров, которые выводили на рынок программные продукты и услуги, помогающие работать с большими данными. Ниже представлены 30 вендоров ПО управления данными, предлагающих всё, от СУБД следующего поколения и мощных технологий интеграции данных до средств разработки приложений, позволяющих извлечь максимум ценной информации из больших данных.
1010data
Соучредитель и главный управляющий: Сэнди Стейер (Sandy Steier)
Компания из Нью-Йорка, созданная в 2000 г., предлагает платформу Big Data Discovery для обнаружения данных и совместного использования приложений, особенно при работе с очень большими массивами данных. Эта платформа вызывает наибольший интерес у ритейлеров, в сфере финансовых услуг и игорном бизнесе.
В апреле была предложена версия 8 платформы Big Data Discovery с обновленным инструментарием QuickApps для разработки анализа на основе формуляров, панелей управления и сложных аналитических приложений.
Actian
Президент и главный управляющий: Стив Шайн (Steve Shine)
Компания Actian (Редвуд-Сити, шт. Калифорния) позиционирует себя как ведущего поставщика SQL-аналитики для Hadoop со своей платформой Actian Analytics. Компания предлагает также ряд баз данных для операционных приложений и программных продуктов интеграции данных. Она фигурирует в группе «Провидцы» (Visionaries) в «Магическом квадранте» Gartner в категории хранилищ данных и решений по управлению данными для аналитики.
Actifio
Главный управляющий: Аш Ашутош (Ash Ashutosh)
Созданная в 2009 г. компания Actifio (Уолтем, шт. Массачусетс)предлагает платформу управления копиями данных, устраняющую проблему «их разрастания» в организации, создавая одну копию всех рабочих данных и делая ее виртуально доступной для резервного копирования, аварийного восстановления, разработки и тестирования ПО, а также для целей бизнес-аналитики и архивирования.
В феврале компания представила платформу Actifio One — «облако отказоустойчивости бизнеса» (business resiliency cloud), которая построена на ее технологии виртуализации копий данных и предоставляет набор функций управления и защиты данных в виде единого приложения.
Aerospike
Главный управляющий: Джон Дилльон (John Dillon)
Компания Aerospike разрабатывает свободную базу данных NoSQL-типа для высокопроизводительных приложений. Эта, оптимизированная для флэш-накопителей СУБД-в-памяти отвечает требованиям ACID (атомарность, непротиворечивость, изолированность, долговечность) по надежности обработки транзакций.
В феврале Aerospike (Маунтин-Вью, шт. Калифорния), созданная в 2009 г., назначила Дилльона своим главным управляющим. Он был менеджером по продажам Oracle на заре ее существования и главным управляющим Salesforce.com с 1999 по 2001 гг., а в более поздний период — главным управляющим компании Engine Yard, поставщика технологии разработки.
Alation
Главный управляющий: Сатьен Сангани (Satyen Sangani)
Стартап Alation (Редвуд-Сити, шт. Калифорния) только что вышел из «скрытого режима». В марте компания представила технологию доступности данных, которая призвана облегчить поиск , понимание и использование нужных данных и управление ими, чтобы быстрее принимать верные решения. В числе первых заказчиков фигурируют eBay, MarketShare и Inflection.
Компания, созданная в 2012 г., недавно получила 9 млн. долл. финансирования первоначального этапа развития — деньги она планирует потратить на ускорение разработки продукта, сбыт и маркетинг.
AtScale
Учредитель и главный управляющий: Дейв Мариани (Dave Mariani)
Еще один стартап, недавно вышедший из «скрытого режима». AtScale (Сан-Матео, шт. Калифорния) разрабатывает платформу AtScale Intelligence, с которой широко используемые инструменты бизнес-аналитики получают доступ к данным, хранимым в кластерах Hadoop.
AtScale (основана в 2013 г.) намерена устранить камень преткновения для многих проектов Big Data: сегодня корпоративные данные всё чаще собираются и хранятся в Hadoop, но многие работающие с информацией и вооруженные соответствующими инструментами отчетности и бизнес-аналитики располагают лишь считанными способами прямого доступа к этим данным.
Attunity
Главный управляющий: Шимон Алон (Shimon Alon)
Attunity специализируется на обеспечении доступности информации, предлагая инструменты для тиражирования данных, сбора изменений в них, подключения к ним, корпоративной репликации и управляемого переноса файлов, доставки облачных данных.
В марте Attunity купила компанию Appfluent Technology, разработчика ПО аналитики использования данных для среды Big Data, за 18 млн. долл. Технология Appfluent помогает организациям анализировать паттерны использования данных и перемещает большие объемы и рабочие нагрузки их обработки в Hadoop.
Attunity, основанная в 1998 г., базируется в Берлингтоне, шт. Массачусетс. Компания сообщила о росте дохода в 2014 г.на 41%, до 35,7 млн. долл.
Basho Technologies
Президент и главный управляющий: Адам Рей (Adam Wray)
Компания Basho, которая создана в 2008 г. и базируется в Белвью, шт. Вашингтон, разрабатывает распределенную базу данных Riak NoSQL-типа, предназначенную для задач, требующих максимально высокой доступности, а также облачную объектно-ориентированную базу данных Riak CS, работающую на Riak.
В 2014 г. компании пришлось пережить трудные времена: уход главного управляющего Грега Коллинза и директора по технологии Джастина Шихи (Justin Sheehy). В этом году Basho получила седьмой раунд финансирования 25 млн. долл. в январе и сообщила, что объем заказов в I квартале вырос на 65% (за год).
Citus Data
Главный управляющий: Умур Кубукчу (Umur Cubukcu)
Компания Citus Data разработала столбцовую базу данных CitusDB с массовым параллелизмом, построенную на основе свободной СУБД PostgreSQL. Компания заявляет, что ее БД, ориентированная на обработку транзакций и задачи аналитики, способна обрабатывать петабайты данных за секунды.
Citus Data, созданная в 2010 г., базируется в Сан-Франциско. В марте компания выпустила версию CitusDB 4.0 с возросшей производительностью запросов и поддержкой рабочих нагрузок реального времени.
ClearStory Data
Учредитель и главный управляющий: Шармила Маллиган (Sharmila Mulligan)
ПО компании ClearStory работает над упрощением доступа к внешним и внутренним источникам данных организаций, включая корпоративные базы данных, Hadoop и Интернет, и использованием их для выявления трендов и паттернов.
ClearStory Data, которая была учреждена в 2011 г. и базируется в Менло-Парк, шт. Калифорния, недавно расширила облачный механизм обработки Intelligent Data Harmonization, предназначенный для аналитиков и бизнес-пользователей, и более тесно интегрировала свое ПО с механизмом аналитики-в-памяти Apache Spark.
Couchbase
Президент и главный управляющий: Боб Видерхольд (Bob Wiederhold)
Couchbase работает в тесном пространстве «альтернативных СУБД», соперничая с MongoDB, Cassandra и др. со своим продуктом Couchbase Server — коммерческой версией Apache CouchDB, свободной документоориентированной базы данных NoSQL-типа.
В марте была выпущена версия Couchbase Server 4.0 с многомерным масштабированием, которое, как говорит компания, повышает производительность, независимо распределяя и масштабируя службы индексирования, запросов и доступа к данным по конкретным серверам.
Couchbase была основана в 2011 г. и базируется в Маунтин-Вью, шт. Калифорния.
Databricks
Главный управляющий: Йон Стоика (Ion Stoica)
Компания Databricks из Сан-Франциско была учреждена в 2013 г. создателями Apache Spark — свободного, сверхбыстрого механизма обработки больших данных, который значительно ускоряет Hadoop, и некоторые обозреватели считают, что он может даже заменить эту платформу. Компания разрабатывает коммерческие сервисы для Spark, в частности полную хостинговую платформу данных Databricks Cloud.
DataStax
Главный управляющий: Билли Бозуорт (Billy Bosworth)
Компания (Санта-Клара, шт. Калифорния) разработала платформу данных высокой масштабируемости на основе Apache Cassandra, свободной распределенной СУБД для хранения громадных объемов данных и управления ими с охватом множества ЦОДов и облака.
В апреле DataStax сообщила, что ее база клиентов превысила 500 корпоративных заказчиков во всем мире; в их числе Netflix, Target, Comcast и ING. Компания была создана в 2010 г.
DataTorrent
Соучредитель и главный управляющий: Фу Хонг (Phu Hoang)
DataTorrent разрабатывает систему потоковой обработки в реальном времени DataTorrent RTS на базе Hadoop 2.0, которая позволяет отслеживать, обрабатывать, анализировать большие данные и сразу же действовать.
DataTorrent (Санта-Клара, шт. Калифорния), созданная в 2012 г., в апреле получила второй раунд финансирования 15 млн. долл., что довело общую сумму инвестиций до 23,8 млн. долл.
EnterpriseDB
Президент и главный управляющий: Эд Бояджян (Ed Boyajian)
Компания EnterpriseDB предлагает ПО и услуги на базе популярной свободной реляционной СУБД PostgreSQL. Ее продукт Postgres Plus Advanced Server совместим с Oracle Database, а также со средствами управления базой данных и тиражирования и другими продуктами этого вендора.
EnterpriseDB была создана в 2004 г. и базируется в Бедфорде, шт. Массачусетс. В апреле она объявила о партнерстве с Lenovo, в рамках которого две компании будут совместно продвигать Postgres Plus Advanced Server на серверах Lenovo, в том числе через глобальную сеть своих реселлеров.
Hazelcast
Главный управляющий: Грег Лак (Greg Luck)
Компания разрабатывает ПО размещения-данных-в-памяти (data grid), которое равномерно распределяет данные по нескольким узлам в кластере, обеспечивая лучшее горизонтальное масштабирование в хранении и обработке. ПО предлагается с открытой лицензией Apache, но компания разрабатывает также коммерческую версию и услуги на основе своей технологии.
Hazelcast была создана в 2008 г. и базируется в Пало-Альто, шт. Калифорния. В сентябре она получила второй раунд финансирования 11 млн. долл. и использует эти деньги для продолжения разработки с тем, чтобы превратить свою технологию гридов данных в законченную корпоративную систему вычислений-в-памяти NoSQL-типа.
Informatica
Главный управляющий: Сохаиб Аббаси (Sohaib Abbasi)
Созданная в 1993 г. компания (Редвуд-Сити, шт. Калифорния), наверное, самый значительный игрок в области интеграции данных со своими инструментами извлечения, преобразования и загрузки данных (ETL) из корпоративных приложений, а также средствами управления качеством данных и управления мастер-данными.
Компания продолжала расширять свою технологическую линейку , в том числе предложив инструменты интеграции данных в облаке и в виде платформы-интеграции-как-услуги.
В начале апреля компания объявила, что ее покупают инвестиционный фонд Permira Funds и Пенсионный фонд Канады (Canada Pension Plan) за 5,3 млрд. долл. Informatica сообщила об объеме продаж в I квартале (завершился 31 марта) в размере 250,5 млн. долл. (рост на 3% за год).
JethroData
Соучредитель и главный управляющий: Илай Сингер (Eli Singer)
Hadoop — не самая подходящая платформа для выполнения интерактивных запросов, это означает, что организациям по-прежнему одновременно приходится использовать свои корпоративные хранилища данных для решения повседневных задач бизнес-анализа.
Компания JethroData (Нетания, Израиль) разработала механизм SQL-запросов на основе индексирования для Hadoop и заявляет, что ее технология делает возможной интерактивную бизнес-аналитику в Hadoop. В конце 2014 г. появилась открытая бета-версия ее ПО, а 7 апреля, после двух лет разработки, была предложена JethroData 1.0, первая общедоступная версия ее продукта. Компания создана в 2012 г.
MarkLogic
Президент и главный управляющий: Гари Блум (Gary Bloom)
Компания (Сан-Карлос, шт. Калифорния) работает с 2001 г. и занялась проблемой обработки больших данных еще до того, как появился сам этот термин.
В феврале компания объявила о выпуске MarkLogic 8, новейшей версии ее базы данных NoSQL-типа с поддержкой JavaScript и JSON (JavaScript Object Notation) на сервере, что упрощает для разработчиков создание и внедрение приложений реального времени с большими объемами данных на базе этой БД.
MemSQL
Соучредитель и главный управляющий: Эрик Френкиль (Eric Frenkiel)
Компания MemSQL разрабатывает базу-данных-в-памяти, которая позволяет организациям обрабатывать транзакции и выполнять задачи бизнес-аналитики одновременно, используя данные реального времени и ретроспективные данные, в рамках одной СУБД.
MemSQL, которая создана в 2011 г. и базируется в Сан-Франциско, начала продажи своего ПО два года назад. Одним из ее инвесторов является фирма In-Q-Tel, которая направляет финансовые средства в самые передовые технологии, представляющие интерес для разведорганов США.
MongoDB
Главный управляющий: Дев Иттичериа (Dev Ittycheria)
Вендоров баз данных NoSQL-типа становится всё больше, но компания MongoDB, разрабатывающая свободную NoSQL-СУБД того же названия (которое происходит от слова «humongous» — чудовищный, огромный), — одна из немногих, которые поднялись выше средней планки.
В феврале была предложена версия MongoDB 3.0, в которой значительно увеличена производительность и масштабируемость благодаря новому механизму хранения WiredTiger.
MongoDB, основана в 2007 г. и имеет две штаб-квартиры в США — в Нью-Йорке и Пало-Альто, шт. Калифорния. В январе компания получила седьмой раунд финансирования в размере 80 млн. долл., что довело общую сумму финансирования до более чем 311 млн. долл.
Neo Technology
Главный управляющий: Эмил Эйфрем (Emil Eifrem)
Компания Neo Technology из Сан-Матео, шт. Калифорния — разработчик графовой базы данных Neo4j. Такие СУБД есть не что иное, как разновидность баз данных NoSQL-типа и используют структуры графов вместо индексов для представления и хранения данных, что обеспечивает очень высокую масштабируемость и большую эффективность управления и выполнения запросов к тесно связанным данным.
В марте Neo Technology, созданная в 2007 г., выпустила версию Neo4j 2.2 с увеличенной производительностью чтения и записи, что позволяет ускорять создание работающих приложений. В январе компания получила 20 млн. долл. в третьем раунде финансирования, что довело ее общую сумму финансирования до 44,1 млн. долл.
Paxata
Соучредитель и главный управляющий: Пракаш Нандури (Prakash Nanduri)
Paxata разрабатывает ПО «адаптивной подготовки данных с самообслуживанием», которое упрощает часто нудную работу преобразования исходных данных, чтобы их можно было изучать средствами бизнес-аналитики. Компания позиционирует свое решение как альтернативу традиционному подходу, который полагается на хранилища данных, созданные и обслуживаемые ИТ-отделом.
Paxata (Редвуд-Сити, шт. Калифорния) была создана в 2012 г. В марте она подписала соглашение с поставщиком решений Carahsoft Technology Corp., обслуживающим госсектор, в рамках которого Carahsoft будет внедрять платформу Paxata Adaptive Data Preparation в государственных органах.
Recommind
Главный управляющий: Боб Теннант
Компания из Сан-Франциско разрабатывает корпоративную платформу поиска и классификации данных, которая организует громадные объемы информации из множества источников и обеспечивает управление ею и предоставление этой информации. Главный рынок для такой технологии — адвокатские конторы и юридическое сообщество.
В январе была предложена обновленная версия облачной платформы истребования электронных документов (e-discovery) и анализа Axcelerate 5 с новыми функциями бизнес-аналитики. Компания была создана в 2000 г.
SnapLogic
Главный управляющий: Гаурав Дхиллон (Gaurav Dhillon)
Компания (Сан-Матео, шт. Калифорния) предлагает инструменты платформы-интеграции-данных-как-услуги (iPaaS) для подключения облачных источников данных. Ее платформа SnapLogic Elastic Integration стартовала в конце 2013 г. и сейчас числит своими заказчиками AstraZeneca, CapitalOne, Cisco и Yelp.
SnapLogic, созданная в 2006 г., привлекает к себе всё больше внимания, поскольку интеграция данных оказывается главной проблемой многих проектов Big Data. В октябре SnapLogic получила 20 млн. долл. в четвертом раунде венчурного финансирования, что довело ее общую сумму финансирования до 58,8 млн. долл.
Splice Machine
Соучредитель и главный управляющий: Монт Цвебен (Monte Zweben)
Компания Splice Machine из Сан-Франциско, созданная в 2012 г., разработала полнофункциональную, транзакционную базу данных SQL-типа на Hadoop, которая может прогонять операционные приложения и аналитику реального времени, используя данные Hadoop. После нескольких месяцев разработки и бета-тестирования Splice Machine выпустила версию 1.0 своего ПО в ноябре.
Splice Machine только что объявила о партнерстве с mrc (Michaels, Ross & Cole Ltd.), в рамках которого компании интегрируют Hadoop-СУРБД, созданную Splice Machine, с платформой разработки веб-приложений m-Power, имеющейся у mrc, что позволит упростить строительство и внедрение приложений на Hadoop.
Talend
Главный управляющий: Майк Тюшен (Mike Tuchen)
Talend предлагает обширную линейку open-source ПО управления данными, в том числе инструменты для интеграции данных, управления их качеством, управления мастер-данными и бизнес-процессами, а также корпоративную сервисную шину (ESB-сервисы).
Talend, учрежденная в Париже в 2005 г., имеет теперь штаб-квартиру в Редвуд-Сити, шт. Калифорния. В марте компания представила облачную версию своей технологии интеграции данных, нацеливаясь на средства облачной и гибридной интеграции — первый шаг перехода к новой стратегии разработки «облако в первую очередь».
Tamr
Главный управляющий: Энди Палмер
Tamr разрабатывает ПО унификации корпоративных данных, позволяющее организациям интегрировать разнородные, обособленные данные для задач бизнес-аналитики.
Компания, которая базируется в Кеймбридже, шт. Массачусетс, была основана в 2013 г. двумя ветеранами разработки баз данных, Майклом Стоунбрейкером и Энди Палмером, которые создали также Vertica Systems. Сегодня Палмер — главный управляющий Tamr, а Стоунбрейкер — директор по технологии.
Trifacta
Главный управляющий: Адам Уилсон
Сделать большие данные доступными и пригодными к использованию — трудная задача для многих организаций. Trifacta разрабатывает технологию, которая служит для преобразования исходных, сложных данных в чистые и структурированные форматы для анализа. Сама компания называет это «data wrangling»*.
В феврале Trifacta(2012 г., базируется в Сан-Франциско) заключила соглашения об интеграции и дальнейшей разработке с MapR Technologies, Waterline Data и Zoomdata.
Xplenty
Учредитель и главный управляющий: Янив Мор (Yaniv Mor)
Компания из Тель-Авива создала облачную платформу Hadoop-как-услуга, которая интегрирует и преобразует структурированные, полуструктурированные и неструктурированные данные в форму, пригодную для анализа.
Компания была основана в 2011 г.; в октябре получила финансирование первоначального этапа развития — 3 млн. долл., которые используются на продолжение разработки ее технологии и расширение маркетинга.
* Условный перевод: «уход за данными». (Прим. перев.)
© 2015. The Channel Company LLC. Initially published on CRN.com, a The Channel Company website, at https://www.crn.com. Reprinted with permission.