Организации стараются справиться с быстро растущим объемом, скоростью поступления и разнообразием данных, создаваемых сегодня внутри и за пределами компаний и требующих обработки. Заказчики ищут технологии, которые помогут не только обработать эти данные и управлять ими, но — главное — осмыслить их, чтобы понять истинные механизмы движения рынка, который они обслуживают, и собственные показатели на фоне конкурентов.
Понимая важность этого нового направления ИТ, CRN/США подготовил список «Big Data 100», где впервые представлены вендоры, которые предложили продукты и услуги, помогающие организациям справиться с лавиной «больших данных».
25 вендоров управления данными
Рик Уайтинг, CRN/США
Представляем 25 компаний, работающих на рынке Big Data в сегменте управления данными, включая давних игроков отрасли и стартапы.
10gen
Компания 10gen разрабатывает и предоставляет коммерческую поддержку для MongoDB, свободной СУБД документов, которая помогает справиться с ограничениями производительности и масштабируемости, опираясь на технологию реляционных СУБД. Одним из создателей компании, стартовавшей в 2007 г., был учредитель и директор по технологии DoubleClick Дуайт Мерриман. Добавим, что 10gen получила более 81 млн. долл. венчурного финансирования.
Actian
Компания предоставляет ряд технологий для обработки Big Data, в том числе аналитическую базу данных Vectorwize, базу данных оперативной обработки транзакций (OLTP) Ingress, бизнес-приложения Action Apps и систему быстрой прикладной разработки (RAD) OpenRoad. Actian покупает сейчас Pervasive Software, разработчика ПО аналитики «больших данных», за 162 млн. долл.
Actifio
Actifio предлагает средства для управления «копиями данных» — стремительно растущим объемом вторичной информации, создаваемой процессами защиты данных, резервного копирования, аварийного восстановления, аналитики, обеспечения бесперебойности бизнеса, тестирования и разработки и др. Компания подчеркивает, что ее технология снижает расходы на оборудование и лицензирование ПО, уменьшает используемую полосу пропускания и емкость, требуемую для хранения данных.
Attunity
Компания поставляет ПО, которое служит для обеспечения доступа к данным, обмена и дистрибуции данных в гетерогенной среде, включая облако. Ее линейка включает средства репликации данных, подключения к ним, сбора изменений, тиражирования файлов, управляемой их пересылки и доставки облачных данных.
Basho Technologies
Basho разрабатывает свободную распределенную базу данных Riak на основе NoSQL, которая автоматически перераспределяет данные при масштабировании (наращивании) информационных систем, оставляя их доступными даже при отказе физических машин. Basho нацелена на быстрорастущие Web-компании, операторов облачных систем и крупные организации.
Citus Data
Компания предлагает распределенную базу данных CitusDB, которая построена на уже проверенной СУБД PostgreSQL, позволяющей делать аналитические запросы к очень большим массивам. Главным аргументом продаж CitusDB является ее способность осуществлять SQL-запросы к данным в кластерах Hadoop, не загружая их в саму базу данных, что дает возможность SQL-запросов в реальном времени к хранимым в Hadoop данным.
Couchbase
Это компания, разработавшая свободную базу данных того же наименования на основе NoSQL, которая стала популярной в интерактивных мобильных и веб-приложениях. Обеспечивая поддержку всего сообщества Couchbase, компания зарабатывает продажей коммерческих версий ПО с лицензиями и предлагая услуги индивидуальной поддержки.
DataStax
DataStax предлагает платформу для «больших данных» DataStax Enterprise, которая сочетает в себе NoSQL-базу данных Apache Cassandra, Hadoop и Apache Solr, свободную технологию корпоративного поиска. В январе была выпущена версия DSE 3.0, имеющая самые обширные средства безопасности среди всех СУБД NoSQL-типа, заявляет компания.
Datawatch
Datawatch предлагает ряд программных продуктов «оптимизации информации» и объединенного управления информацией, которые помогут организациям сочетать структурированные, неструктурированные и полуструктурированные данные, сделав их доступными для аналитических приложений и других систем обработки Big Data. Недавно компания объявила о поддержке Hadoop в своем продукте DataWatch Data Pump.
EnterpriseDB
Компания разрабатывает ПО и услуги корпоративного класса на основе свободной базы данных PostgreSQL. EnterpriseDB позиционирует себя как недорогую альтернативу реляционной СУБД Oracle и свободной базе данных MySQL, которой теперь владеет Oracle после покупки Sun Microsystems.
Garantia Data
Garantia Data предоставляет расширенные услуги облачного хранения-в-памяти на основе NoSQL, в частности для хостинга массивов данных Redis и Memcached. Redis — это свободная СУБД-в-памяти, а Memcached — распределенная система кэширования памяти общего назначения. Эти услуги стартовали в феврале; ежемесячная плата варьируется в зависимости от количества Гбайт.
Informatica
Informatica — поистине гранд-дама интеграции данных: компания была создана в 1993 г., задолго до рождения самого термина «Big Data». Informatica разрабатывает широкий спектр ПО для интеграции корпоративных данных, интеграции облачных данных, обеспечения качества данных, репликации данных, управления мастер-данными, виртуализации данных, управления жизненным циклом информации и др.
MarkLogic
Флагманский продукт MarkLogic Server на основе NoSQL работает с популярным ПО бизнес-аналитики, таким как IBM Cognos и Tableau, обеспечивая поддержку распределенной файловой системы Hadoop (HDFS). Компания предлагает и другие продукты, предназначенные для «больших данных»: это средства поиска и прикладной разработки.
MemSQL
MemSQL разработала СУБД-в-памяти того же наименования, которая ускоряет работу приложений Big Data в 30 раз по сравнению с другими системами, заявляет компания. MemSQL нацеливает свою технологию на рынки финансовых услуг и цифровой рекламы, где столь важен быстрый анализ машинных данных.
Neo Technology
Фирма разработала графовую базу данных Neo4j. Это особая категория технологии СУБД на основе NoSQL, которая использует структуру графов вместо индексов, чтобы быстро строить модели подключенных массивов данных и выполнять запросы к ним. Основным заказчиком является Cisco, которая заменила систему управления мастер-данными, использовавшую СУБД Real Application Clusters от Oracle, на Neo4j.
Rainstor
Компания Rainstor разрабатывает базу данных и связанные с ней продукты для управления «большими данными». Ее СУБД, выполняемая в родном формате Hadoop, включает улучшенную технологию сжатия данных, которая снижает стоимость их хранения на величину до 90%, заявляет компания.
Recommind
Recommind разрабатывает ПО для управления неструктурированными данными, включая полное руководство данными (governance) и анализ. Ее платформа CORE (Context Optimized Relevancy Engine) обеспечивает автоматический сбор, организацию и анализ больших объемов информации из многих источников внутри корпоративной сети и за ее пределами.
Revelytix
Revelytix лишь недавно предложила ознакомительную версию своего ПО интеграции данных Loom Dataset Management для Hadoop. Компания подчеркивает, что ее технология облегчает работу с Hadoop для специалистов по изучению данных, помогая управлять файлами Big Data и строить приложения аналитики. В состав ПО входят также средства отслеживания изменений данных и функции аудита.
Simba Technologies
Компания разрабатывает ПО доступа к данным, подключения к массивам и анализа для реляционных и многомерных источников данных, используя стандарты ODBC, JDBC, SQL и XML. В частности, компания разработала драйверы ODBC для Apache Hive и HBase и сотрудничала с Intel, чтобы обеспечить ODBC-доступ к ее дистрибутиву Apache Hadoop.
Splice Machine
На фоне всеобщего интереса к базам данных на основе NoSQL Splice Machine идет своим путем, предлагая SQL-совместимую СУБД, предназначенную для приложений Big Data. Компания заявляет, что ее Splice SQL Engine, построенный на каркасе Hadoop, обеспечивает те же преимущества масштабирования, что и NoSQL, но без необходимости заново переписывать приложения и средства бизнес-аналитики, основанные на SQL.
Syncsort
Компания Syncsort предлагает ряд программных продуктов и услуг интеграции и защиты данных. Ее продукт DMExpress работает с системами HP Vertica и EMC Greenplum, ускоряя обработку «больших данных». Ее технология интеграции данных используется также в проекте Hadoop, который разрабатывается под эгидой Apache Software Foundation.
Talend
Talend предлагает свободное и коммерческое программное обеспечение для работы с Big Data, включая интеграцию данных, обеспечение качества данных, управление метаданными и средства полного руководства данными (governance). Ее Talend Big Data Platform объединяет в себе множество инструментов с такими функциями, как планировщик заданий Hadoop и средства подключения для NoSQL.
Unravel
Компания предлагает средства оптимизации, чтобы помочь пользователям тратить меньше времени на рутинные задачи взаимодействия с Hadoop и нацелиться на анализ Big Data для принятия более верных деловых решений. Unravel предлагает также серию инструментов визуализации, в частности Profiler, который позволяет спланировать потоки данных.
WibiData
Компания WibiData использует Apache Hadoop, HBase и другие технологии, позволяя анализировать огромные объемы данных о поведении пользователей, включая информацию профилей и транзакционные данные, регистрируемые в журналах. Идея в том, что все данные, имеющие отношение к пользователю, заказчику и т. д., держатся в одном месте.
XtremeData
Компания XtremeData разрабатывает СУБД с массовым параллелизмом для создания хранилищ данных, которые могут быть развернуты локально (on premise) или в облаке. Механизм этой СУБД способен обрабатывать сотни терабайт данных и позиционируется как альтернатива другим базам данных SQL-типа, хранилищам данных на основе устройств и платформе хранилища данных Apache Hive.
25 вендоров инфраструктуры и услуг
Рик Уайтинг, CRN/США
Amazon Web Services
Amazon Web Services, включая Amazon Elastic Compute Cloud и Simple Storage Service, предоставляет услуги онлайн-хранения данных, облачной инфраструктуры и онлайн-приложения, которые стали надежной платформой для многих проектов Big Data.
CA Technologies
Компания предлагает линейку ПО управления данными ARCserve и инструменты моделирования данных ERwin, помогая организациям справляться с трудностями обработки «больших данных». В частности, ERwin помогает управлять все более сложными структурами данных при проектировании баз данных, хранилищ и приложений.
Cloudera
Cloudera предлагает платформу для Big Data на основе собственного дистрибутива Apache Hadoop (Cloudera Enterprise) вместе со средствами его внедрения (Cloudera Quickstart) и администрирования (Cloudera Manager). Ее Cloudera Navigator поможет администраторам, менеджерам данных и аналитикам обеспечить защиту, управление и исследование данных в рамках Cloudera Enterprise.
Cloudwick Technologies
Компания предоставляет ряд услуг на платформе Hadoop, включая разработку и развертывание систем на базе Hadoop в организациях, их интеграцию с другими источниками данных внутри организаций, мониторинг этих систем и анализ данных, собранных внутри Hadoop.
Compuverde
Compuverde специализируется на разработке «зелёных» систем хранения «больших данных» для поставщиков решений, телекоммуникационных компаний и организаций. Компания заявляет, что ее облачные системы Compuverde Object Store способны хранить свыше 100 петабайт неструктурированных данных и обеспечивают коэффициент готовности 99,999%.
Continuuity
Компания рассматривает прикладную разработку как следующую большую и трудную задачу в Big Data. Ядром облачных предложений этого стартапа является платформа разработки Continuuity App-Fabric (в настоящее время в стадии бета), построенная на базе Hadoop и сопутствующих компонентов. App-Fabric служит также средой выполнения и платформой для приложений обработки «больших данных».
DataGuise
Один из аспектов Big Data, тревожащий многих: потенциально большие объемы конфиденциальных данных могут остаться незащищенными. Компания DataGuise предлагает свою линейку инструментов DgSecure, позволяющих выявить конфиденциальные данные в организации, обеспечить их защиту в соответствии с регулятивными требованиями HIPAA (Закон о правилах передачи и ответственности за документацию о страховании здоровья) и PCI (стандарты безопасности данных отрасли платежных карточек) и применить шифрование данных, маскирование и другие способы защиты.
Dell
На арене «больших данных» компания предлагает продукт Dell/Hadoop Big Data Solution, объединяющий в себе дистрибутив Cloudera Hadoop, серверы PowerEdge C самой Dell и ПО Business Analytics от Pentaho. Dell предлагает также ПО Kitenga Analytics (после покупки Quest в прошлом году) для анализа структурированных и неструктурированных данных в среде Hadoop.
EMC
Являясь ведущим вендором систем хранения данных, EMC как никто понимает все трудности, связанные с управлением огромными объемами информации. Помимо своего магистрального бизнеса компания предлагает линейку ПО бизнес-аналитики Greenplum, а также Pivotal HD, собственный дистрибутив Hadoop вместе с услугами SQL-базы данных с массовым параллелизмом и технологией виртуализации VMware.
Hewlett-Packard
Компания имеет целый ряд предложений оборудования, ПО и услуг на арене Big Data. Наверное, самой заметной является платформа аналитики для «больших данных» Vertica. Также компания недавно представила свои услуги управления информацией и аналитики HP Big Data Discovery Experience, которые помогут организациям извлечь больше ценных сведений из их массивов «больших данных».
Hortonworks
Это один из заметных стартапов на арене Big Data. Компания предлагает платформу Hortonworks Data Platform, построенную на собственном дистрибутиве Hadoop и сопутствующих компонентах, а также услуги поддержки и обучения и свободно доступную «учебную» версию Hadoop для опробования.
IBM
Со своим арсеналом серверов и СХД, баз данных (DB2, Informix, InfoSphere) и ПО бизнес-аналитики (Cognos, SPSS и др.) IBM смело может заявить, что имеет одно из самых обширных предложений на арене Big Data. Компания только что представила версию своего сервера PureData System, готовую к работе с Hadoop, и ряд расширений к DB2, предназначенных для «больших данных».
Infochimps
Infochimps Enterprise Cloud — это пакет облачных услуг для разработки и развертывания приложений аналитики для Big Data в общедоступном и частном облаке. Система Infochimps включает поддержку хранения данных и доступа для Hadoop, баз данных HBase и NoSQL-типа и заказных приложений, позволяя организациям выполнять анализ данных реального времени, специальный анализ и пакетную аналитическую обработку.
MapR Technologies
Выступая соперником Cloudera, Hortonworks и других поставщиков дистрибутивов Hadoop, MapR предлагает несколько версий собственного дистрибутива Hadoop вместе с обучением, поддержкой и другими профессиональными услугами. Компания предлагает также ПО и услуги для вертикальных рынков: здравоохранения, производства и ретейла.
Microsoft
В отличие от IBM или Oracle Microsoft не работает на рынке оборудования, но имеет серьезное предложение для «больших данных» в лице своей СУБД SQL Server 2012 и ПО бизнес-аналитики. Компания предлагает HDInsight Services — услуги развертывания и предоставления кластеров Hadoop в облаке, построенные на базе Hortonworks Data Platform. HDInsight для Windows Server и Windows Azure находятся сейчас в бета-стадии.
Mortar Data
Компания Mortar Data предлагает весь инструментарий Hadoop на базе облака — по сути, это платформа-как-услуга, которая поможет разработчикам и аналитикам строить приложения для обработки гигантских массивов данных, значительно облегчая весь процесс. Предложение компании строится на основе ее собственной свободной платформы разработки.
NetApp
NetApp предлагает больше, чем просто оборудование для обработки «больших данных». Ее Open Solution for Hadoop — это готовая к развертыванию система хранения с поддержкой кластеров Hadoop для аналитики Big Data. Компания разрабатывает также репозитории корпоративного и распределенного контента, высокопроизводительную систему хранения с поддержкой распределенной файловой системы Lustre для параллельной обработки.
Oracle
Oracle имеет широкий спектр продуктов для работы с Big Data, от своей флагманской реляционной СУБД до ПО бизнес-аналитики и «специализированных систем», таких как Exadata Database Machine. Ее сервер на аппаратной платформе Intel Oracle Big Data Appliance интегрирован с дистрибутивом Hadoop от Cloudera и ее собственной базой данных на основе NoSQL.
Rackspace
Компания предлагает ряд услуг, связанных с Hadoop, в том числе хостинг Hadoop для заказчиков на выделенных серверах или в виде услуг собственного частного облака. (Компания готовит также общедоступные облачные услуги Hadoop.) Также Rackspace в партнерстве с Hortonworks предоставляет услуги прикладной разработки и проектирования системной архитектуры на базе своего дистрибутива Hadoop.
RightScale
Компания RightScale предлагает целый ряд облачных услуг предоставления, мониторинга, отчетности и защиты приложений Big Data, построенных на базе экосистем Hadoop и NoSQL. Ее предложение включает также ряд «серверных шаблонов» (Server Template), как называет их компания, размещенных на ее витрине MultiCloud Marketplace, в том числе Hadoop MapReduce, IBM BigInsights Hadoop Framework, MongoDB и Couchbase.
Software AG
Главным предложением компании на рынке Big Data является линейка ПО администрирования Terracotta. Эта линейка, которую Software AG приобрела вместе с одноименной фирмой-разработчиком в 2011 г., включает средства, позволяющие управлять данными в памяти, выполнять их анализ и действовать исходя из результатов. Этот инструментарий позволяет также повысить производительность и масштабируемость приложений и согласовать выполнение заданий обработки на множестве узлов.
StackIQ
Компания предлагает пакет StackIQ Enterprise Data, обеспечивающий развертывание и администрирование кластерных систем обработки «больших данных». Изначально продукт был ориентирован на поддержку дистрибутива Hadoop от Hortonworks, но недавно компания предложила «мультивендорную» версию с поддержкой дистрибутивов Hadoop от Cloudera, MapR Technologies, DataStax и других.
Teradata
Компания предлагает ряд аппаратных платформ (в том числе хранилище данных Teradata Active Enterprise Data Warehouse и устройство аналитики Teradata Aster Big Analytics Appliance), СУБД, инструменты анализа данных и аналитические приложения для ретейлеров, маркетинга, управления каналом, анализа информации о заказчиках, а также для авиаперевозчиков и других транспортных компаний.
Treasure Data
Компания предлагает облачную платформу анализа данных, которую называет Big Data-как-услуга. Организации могут выгрузить свои данные из операционных приложений, файлы системных журналов, информацию датчиков и т. п. в хранилище данных Treasure Data для анализа и затем получить результаты обработки, которые можно поместить в электронные таблицы, базы данных и другие приложения, используя интерфейсы SQL, JBC или ODBC.
Zettaset
Пакет Orchestrator, который предлагает Zettaset, работает с дистрибутивами Hadoop многих вендоров, автоматизируя и упрощая внедрение этой платформы. Что, наверно, еще важнее, он привносит свою меру безопасности «корпоративного класса» и соблюдения регулятивных требований.
Big Data 100: 50 вендоров бизнес-аналитики
Кристин Бент, CRN/США
1010data
Компания предлагает интегрированное решение, включающее СУБД и ПО аналитики, которое нацелено на рынки розничной торговли и продажи расфасованных товаров, финансовые фирмы, госсектор, здравоохранение и сектор телекоммуникационных услуг. Один из флагманских продуктов компании, Trillion-Row Spreadsheet, позволяет анализировать «большие данные» в знакомом формате, напоминающем интерфейс Microsoft Excel.
Actuate
Компания ведет свой собственный open-source проект BIRT, который посвящен построению свободной системы отчетности на базе Eclipse для веб-приложений. Ее платформа ActuateOne строится на базе проекта BIRT, обеспечивая поддержку целого ряда приложений аналитики «больших данных» и взаимодействия с заказчиками.
Alpine Data Labs
Компания, созданная бывшими членами команды Greenplum в EMC, специализируется на прогнозной аналитике. Ее аналитическая платформа работает с построенными на базе Hadoop и традиционными источниками данных и предельно проста в навигации и развертывании, заявляет компания.
Alteryx
Компания разрабатывает стратегическое ПО аналитики, помогая организациям принимать верные решения. Ее облачный сервис Analytics Gallery упрощает публикацию и раздачу аналитических приложений, используя общедоступное и частное облако.
Attivio
Суть предложения Attivio — это соединение корпоративного поиска, бизнес-аналитики и «больших данных», чтобы дать организациям более четкую картину их бизнеса и данных. Предлагаемый компанией Active Intelligence Engine располагается между источниками данных и аналитическими приложениями, обеспечивая услуги поиска данных и интеграции.
Ayasdi
Разрабатывает ПО, помогающее организациям найти исходную форму их данных. Применяя сотни алгоритмов из раздела математики «топология», это ПО находит повторяющиеся закономерности и взаимосвязи внутри больших массивов данных, выявляя лежащие в их основе геометрические формы.
Birst
Компания стремится предоставить «большие данные» самим бизнес-пользователям, предлагая инструменты бизнес-аналитики с самообслуживанием и с выводом результатов на «приборные панели». Пакет бизнес-аналитики Birst позволяет объединить и анализировать данные из разных источников в реальном времени, а также задействовать библиотеку интерактивных средств визуализации, чтобы нагляднее представить результаты.
Chartio
Компания специализируется на интерактивных диаграммах и «приборных панелях» для аналитической обработки «больших данных». Chartio подчеркивает, что ее инструменты дают интуитивно понятный интерфейс, работающий по принципу «перетаскивания», так что бизнес-пользователи могут легко освоиться с ее инструментарием сами, не прибегая к помощи ИТ-персонала.
Cirro
Ставит своей целью свести к минимуму время на освоение аналитики для Big Data, предлагая решения, позволяющие анализировать большие массивы данных, используя имеющиеся средства анализа. Так, ее инструмент Analyst for Excel позволяет выполнять анализ данных через Microsoft Excel, задействуя при этом библиотеку Cirro Function Library для типовых SQL-запросов и реализации функций Map/Reduce.
ClearStory Data
Компания понимает, сколь разрозненны сегодня источники данных организаций, и разрабатывает средства аналитики, позволяющие справиться с этой проблемой. Задействуя ее инструменты, пользователи могут охватить самые разные источники — будь то Hadoop, обычная реляционная база данных или вебсайты, такие как Facebook или Twitter, — и создать интерактивные отчеты на основе их анализа.
Continuum Analytics
Компания занята разработкой средств аналитики следующего поколения, стремясь сделать язык программирования Python столь же полезным и мощным инструментом анализа Big Data и других деловых данных, каким он стал в науке, инженерных дисциплинах и масштабируемых вычислениях.
DataGravity
DataGravity не сообщает подробностей о разрабатываемых ею решениях для Big Data, но всё же можно заключить, что она строит платформу управления данными и аналитики, которая позволит извлекать полезную информацию из неструктурированных данных, не прибегая к «сложным пакетам ПО».
Datameer
Компания предлагает интегрированное решение для управления массивами «больших данных», их интеграции и анализа с самообслуживанием. Ее продукт — это единое приложение, которое не требует средств ETL (извлечения, преобразования и загрузки информации) или статических схем, так как уже включает в себя свыше 200 специальных функций.
Datasift
Разрабатывает платформу аналитики для «соцсетевых больших данных», специально предназначенную для поиска и анализа информации с сайтов соцсетей и других социальных медиа. Ее инструменты помогают организациям использовать данные из этих источников для управления отношениями с клиентами или отслеживания восприятия своего бренда на рынке.
Dataspora
Предлагает «платформу машинного самообучения», как она ее называет. Это решение использует сетевые модели и параллельные вычисления, помогая организациям понимать не только то, что происходит с их бизнесом в данный момент, но и чего они могут ожидать в ближайшем будущем.
DataXu
Компания хочет помочь игрокам рынка строить и укреплять свои бренды в сегодняшнем цифровом мире. Понимая, что традиционные методы маркетинга уже не эффективны там, где правят Web и социальные сети, DataXu помогает рекламодателям использовать новые пласты Big Data, чтобы продвигать свои продукты по различным цифровым каналам.
Digital Reasoning
Digital Reasoning предлагает платформу Synthesys, которая может анализировать структурированные и неструктурированные данные, помогая обнаружить взаимосвязи между ними. Это решение нацелено на госструктуры и финансовые организации, где его можно использовать для выявления мошенничества и смягчения других рисков.
Emcien
Компания предлагает уникальные решения аналитики «больших данных» для розничной торговли, дистрибуции, производственного сектора и госучреждений. Ее пакет EmcienMix позволяет организациям получить текущую картину покупательского поведения в реальном времени, а EmcienScout помогает правоохранительным органам изучать текущие данные, чтобы выявить потенциальные источники дестабилизации.
Glassbeam
Компания Glassbeam предлагает пакеты приложений аналитики «больших данных» для служб поддержки заказчиков, маркетинговых отделов и других групп. К примеру, группы технической поддержки или сервисного обслуживания клиентов могут использовать ее решения, чтобы предвидеть проблемы еще до того, как заказчик обратится за помощью.
GoodData
GoodData предлагает облачные приложения обработки «больших данных» (компания называет их «Bashes»), которые должны помочь организациям отслеживать спрос своих заказчиков и лучше его направлять. Недавно компания выпустила GoodSuccess Bash, который отслеживает уровень спроса на продукт среди ключевых клиентов организации.
Присутствие Google на рынке Big Data держится на облачном сервисе BigQuery, который позволяет проводить интерактивный анализ огромных объемов данных — вплоть до миллиардов записей. Пользователи могут делать произвольные SQL-запросы к многотерабайтным массивам данных за считанные секунды, заявляет компания.
Hadapt
Преподносит свою Adaptive Analytic Platform как соединение лучшего из Hadoop и реляционной СУБД в единой платформе обработки Big Data. Результат, говорит компания, — высокопроизводительная система аналитики, способная работать со структурированными и неструктурированными данными.
HStreaming
Платформа HStreaming на базе Apache Hadoop предоставляет функции аналитики для неструктурированных источников данных, таких как видеоконтент и встроенные датчики. Она совместима со всеми основными дистрибутивами Hadoop; типичные варианты применения включают анализ видеоданных, особенно в военной области, а также сетевой анализ и обнаружение мошенничества.
Information Builders
Компания нацелена на самые разные сферы применения своего пакета бизнес-аналитики для Big Data — от образования и здравоохранения до гостиничного бизнеса. Ее флагманский продукт WebFocus включает множество полезных инструментов, в том числе «приборные панели», «цифровые табло» и управляемую автоматизированную отчетность для построения отчетов аналитики и их последующей рассылки членам команды.
Jaspersoft
Компания Jaspersoft помогает визуализировать любые данные, будь то реляционные, OLAP (оперативной аналитической обработки) или Big Data, посредством интерактивных диаграмм на базе HTML5 и «приборных панелей». Можно выполнить анализ типа «что если...», используя готовые встроенные функции Jaspersoft, или встроить анализ на базе браузера в веб-приложение и внедрить его в рамках всей организации.
Karmasphere
Предложение компании включает три основных компонента: Karmasphere Analyst, который дает аналитикам информации доступ к структурированным и неструктурированным данным в Hadoop; Karmasphere Studio, предоставляющий инструменты для разработки заказных алгоритмов для Hadoop; и Karmasphere Analytics Engine, программное ядро всего предложения.
Kognitio
Компания преподносит свою Analytical Platform как первую аналитическую платформу, использующую вычисления-в-памяти. Она может быть развернута локально либо в частном или общедоступном облаке в качестве платформы-как-услуги и совместима с большинством решений ETL (извлечения, преобразования и загрузки информации) и бизнес-аналитики, имеющихся на сегодня.
LucidWorks
Компания LucidWorks применяет концепцию поисковых механизмов к «большим данным», предлагая платформу разработки, которая ускоряет и упрощает создание поисковых приложений корпоративного класса. Кроме того, ее LucidWorks Search может помочь улучшить настройку и оптимизацию поиска для получения более надежных результатов.
MicroStrategy
Компания предлагает ряд решений-в-памяти и бизнес-аналитики, предназначенных для обработки «больших данных», в том числе MicroStrategy Mobile — инструмент аналитики, позволяющий извлекать полезную информацию из источников Big Data и создавать оптимизированные для сенсорного экрана отчеты прямо с мобильных устройств.
NGData
NGData имеет ряд решений для рынка Big Data, но ее флагманским инструментом аналитики является пакет Lily, способный дать организациям более глубокое понимание их базы заказчиков. Позиционируемый как «инструмент потребительской аналитики», Lily помогает выявить тренды и изменения в поведении потребителей, чтобы построить более действенную рекламу.
Palantir Technologies
Пакет приложений для интеграции и анализа неструктурированных данных, созданный компанией Palantir, быстро нашел признание в органах разведки, оборонных и правоохранительных органах. Также он помогает подкрепить планы аварийного восстановления и использовался во время урагана Сэнди, помогая отслеживать волонтеров и выявлять районы, больше всего нуждающиеся в помощи.
Panarama Software
Пакет Necto — это веб-решение бизнес-аналитики, позволяющее подключиться почти к любому источнику данных и строить их модели, используя технологию вычислений-в-памяти. Necto включает также встроенный механизм рекомендаций бизнес-аналитики, который может создавать ассоциации между данными, профили пользователей и др., выявляя взаимосвязи, о которых никто даже не подозревал.
Panopticon
Компания Panopticon выделяется среди других вендоров бизнес-аналитики для Big Data со своим неуклонно растущим портфелем средств визуализации данных. Предложение компании насчитывает более 15 решений для визуализации данных в реальном времени, в том числе Treemaps — интерактивные «карты» данных, которые представляют информацию в разноцветных рамках и шрифтом разного размера, помогая мгновенно выявить корреляции и выбросы.
ParAccel
Компания предлагает столбцовую базу данных с массовым параллелизмом, которая оптимизирована для высокопроизводительного анализа Big Data. Стремясь лучше вооружить пользователей, компания встроила в свою базу данных более 500 аналитических функций, готовых к использованию (в дальнейшем можно постепенно создать собственную библиотеку новых, более сложных функций).
Paradigm4
Компания Paradigm4 — ведущая сила open-source проекта SciDB — свободной СУБД, специально предназначенной для обработки больших объемов данных при решении научных проблем. Paradigm4 предлагает собственную разновидность SciDB, включающую сложные аналитические функции, которые выполняются параллельно на всех вычислительных узлах, чтобы обеспечить максимально высокую производительность.
Pentaho
Pentaho Business Analytics — это интерактивная веб-платформа, обеспечивающая доступ к источникам данных, создание отчетов и «приборных панелей» и визуализацию этих данных — будь то из Hadoop, NoSQL или традиционной БД. Intel включила технологию Pentaho в новую версию своего дистрибутива Hadoop.
Platfora
Компания предложила ПО бизнес-аналитики-в-памяти, которое позволяет анализировать данные непосредственно в Hadoop без необходимости строить сложное (и дорогостоящее) хранилище данных или традиционный склад данных. Главный управляющий компании заявил, что это решение может означать «начало конца хранилищ данных».
Qlik Technologies
Платформа Business Discovery компании Qlik Technologies предоставляет функции бизнес-аналитики и поиска для «больших данных», но что действительно делает ее уникальной на рынке, так это прицел на коллективную работу. Она обеспечивает непрерывный обмен между членами команды, позволяя делать закладки и оставлять комментарии прямо в BI-приложениях Qlik, где их могут видеть другие пользователи.
Qubole
Компания Qubole разрабатывает «самомасштабируемую», как она ее называет, платформу для анализа и обработки «больших данных». Цель компании — предложить облачные услуги Apache Hadoop и Hive, которые оставляют «за кадром» все сложности инфраструктуры, позволяя избавить ИТ-подразделения от необходимости строить собственные кластеры Hadoop и обеспечивать их сопровождение.
Retention Science
Customer Profiling Engine компании Retention Science — это маркетинговая платформа, позволяющая использовать «большие данные». Она помогает онлайн-продавцам анализировать огромные объемы данных, чтобы добиться подлинной лояльности клиентов. В частности, приложения этого стартапа могут помочь компаниям, работающим в области интернет-коммерции, прогнозировать, насколько чувствительны к цене потенциальные покупатели, и предложить соответствующие промоакции, которые действительно будут эффективны.
Revolution Analytics
Revolution Analytics предлагает ПО и услуги, предназначенные для пользователей свободного языка программирования R, который служит для разработки статистического ПО и приложений анализа данных. Компания предлагает корпоративную и бесплатную версии своего ПО Revolution R; первая отличается тем, что включает расширенные функции аналитики для обработки терабайтных массивов данных.
SAP
Давний и крупнейший вендор на рынке ПО бизнес-аналитики. Главное предложение компании в сегменте Big Data — это ее СУБД-в-памяти HANA, которая значительно ускоряет манипулирование данными и их аналитическую обработку. Компания предлагает также другие пакеты аналитики — SAP Business Suite, SAP Business One и SAP BusinessObjects, — которые можно использовать вместе с HANA.
SAS
Пакет Visual Analytics от SAS — это набор инструментов, которые помогут аналитикам и бизнес-пользователям быстро исследовать большие объемы данных. SAS — крупнейшая в мире частная ИТ-компания; в 2012 г. ее продажи выросли на 5,4%, в том числе благодаря растущему спросу на приложения для анализа «больших данных».
SiSense
Компания SiSense заявляет, что создала «самую компактную в мире систему аналитики для Big Data». Это ее пакет Prism, способный перемолоть 1 Тбайт данных на ноутбуке, имеющем всего 8 Гбайт оперативной памяти. Компания позиционирует свой пакет Prism, который недавно стартовал в облаке Windows Azure, как более дешевую и простую в использовании альтернативу предложениям других вендоров.
Splunk
Предлагает одноименный механизм обработки данных, который позволяет осуществить сбор, индексирование и анализ машинных данных, создаваемых приложениями, серверами и устройствами, будь то физическими, виртуальными или в облаке. Технология Splunk обеспечивает также возможность поиска по этим данным и позволяет анализировать оперативные и ретроспективные данные из одного и того же источника.
Sumo Logic
Компания предлагает облачный сервис управления журналами и аналитики, который предназначен устранить сложности, связанные с сопровождением локально развертываемого ПО, выполняющего те же функции. Он помогает организациям глубже заглянуть в корпоративные файлы журналов и, возможно, сделать новые открытия, касающиеся безопасности, операционной обработки и др.
Tableau Software
Tableau Software специализируется на визуальной аналитике для «больших данных», и ее главный козырь это предельно простой пользовательский интерфейс, использующий технику «перетаскивания». Предложения Tableau интегрированы почти со всеми ведущими дистрибутивами Hadoop, включая Hortonworks и Cloudera.
Tibco
Помимо своих инструментов аналитики и визуализации для Big Data, компания предлагает также платформу анализа событий, которая позволит организациям быстро собрать и проанализировать информацию о происходящем в их отрасли и действовать исходя из выявленных тенденций — например, по-другому спланировать сложную цепочку поставок, чтобы избежать задержек в будущем.
Tracx
Tracx разработала систему управления информацией с соцсетей, позволяя организациям «просеивать» данные с Facebook, Twitter и других им подобных сайтов, чтобы получить наиболее точные сведения о восприятии их компании. Организации могут также использовать Tracx, чтобы оценить свои показатели на фоне конкурентов и получить полную картину всего, что касается их бренда и его обсуждения в соцсетях.
Zoomdata
Решения Zoomdata помогают организациям охватить внутренние и внешние источники данных, свести воедино эту информацию и визуализировать интересующие их потоки данных в реальном времени. Только что стартовала бета-версия приложения для Big Data; версия для iPad уже предлагается.
© 2013. The Channel Company LLC. Initially published on CRN.com, a The Channel Company website, at https://www.crn.com. Reprinted with permission.