18 декабря 2024 г.

Актуальность концепции data-driven сомнений не вызывает. Eправленческие решения — от стратегических до оперативных — проблематично принимать лишь на основе экспертности или интуиции, особенно если учесть, что многое из происходящего совершенно новое. Экспертность в ряде случаев отсутствует по уважительным причинам; кроме того, происходящее зачастую и контр-интуитивное. При этом современная динамика такова, что даже традиционных решений нужно принимать все больше, а ресурс экспертов ограничен.

Основная опасность связанная с данными — не работать с BI, не применять для аналитики инструменты на ML, не использовать основанные на AI программные решения — или применять их недостаточно эффективно — практически для любой компании это путь к прямым убыткам или недополученной прибыли, к поражению в конкурентной борьбе, а в среднесрочной перспективе и к уходу с рынка. Сложная экономическая ситуация в рублевой зоне существенно ускоряет эти процессы.

И еще раз про термины

Строго говоря, data-driven предполагает опору не на сами данные, а на информацию — бизнес-значимые объективные параметры, полученные на основе анализа массивов данных. Заметим, что анализ не обязательно требует недели работы дата-сайентистов над BigData или аренды дата-центров с графическими ускорителями для создания ИИ-моделей методами машинного обучения, классическая математика продолжает работать и оказывается вполне достаточной для многих задач data-driven.

Разумеется, чтобы эта теоретическая модель стала рабочей, компании прежде всего нужна разработанная политика в области данных: откуда их брать, как проверять на достоверность, как часто актуализировать (и с какой периодичностью), откуда получать недостающие, где хранить (и нужны ли при этом бэкапы), а также кто, как и когда будет вести обработку, превращая данные в информацию. Важна, разумеется, «последняя миля» для результатов обработки — какие нужны ASAP, какие будут предоставлять «по запросу», какие — в регулярных отчетах, а какие у лиц, принимающих решения, должны постоянно присутствовать на дашбордах, причем с обновлением практически в режиме реального времени.

BI — «конвертер» данных в информацию

Business Intelligence иногда переводят как «цифровая разведка», но это инструмент обработки данных для корпоративных заказчиков. У BI две задачи: собрать данные и, выполнив пред-обработку, предоставить информацию менеджменту, визуализировав в форме, удобной для конкретного специалиста. В большинстве случаев BI-инструменты для помощи менеджменту в принятии более эффективных бизнес-решений реализуют при помощи специализированных платформ.

Платформы требуют внедрения — интеграции и настройки. Системы через коннекторы нужно подключить к источникам данных, задать принципы обработки и, если необходимо, указать принципы хранения данных, а также прописать политики доступа. Заметим, что источники данных в большинстве случаев внутренние, но могут быть и внешними — курсы валют, биржевая информация, прогноз погоды, материалы про активность конкурентов и т. д.

Следующий шаг — пред-обработка по заданным правилам и визуализация результата в виде, удобном для бизнес-пользователя: рассылка по e-mail, автоматическое создание презентаций, отображение на информационных панелях, дашбордах и т. д. BI-системы успешно могут готовить как управленческую, так и регламентную отчетность. Их применяют в компаниях разного масштаба — эти инструменты востребованы не только крупным бизнесом и на уже разных вертикальных рынках. Как показывает практика, российские корпоративные заказчики — в том числе, и госструктуры — применяют BI как на уровне организации, так и в рамках отдельных подразделений.

Объем российского рынка BI в денежном выражении составляет порядка 8-9 млрд рублей, сказал Иван Вахмянин, управляющий партнер Visiology, выступая на конференции ViRush-2024. Объем невелик, сегмент демонстрирует положительную динамику — порядка 9% Y2Y — основные изменения происходят внутри «install base» этих систем.

Глобальные поставщики BI-платформ с рынка РФ ушли, хотя с их продуктами продолжают работать корпоративные заказчики; более того, количество пользователей все еще продолжает расти, хотя и незначительно.

«Во избежание рисков потери функциональности, технических сбоев из-за отсутствия обновлений и потери данных из-за отсутствия вендорской поддержки бизнес развернул свой спрос в сторону альтернативных отечественных продуктов», — говорит Владимир Лебедев, директор по развитию бизнеса M1Cloud, что справедливо для любых корпоративных инструментов, в том числе, и для BI-платформ.

Локальный рынок BI-платформ практически разделен поделен между российскими вендорами, китайскими и opensource-решениями. Доля российских решений предсказуемо растет, так как корпоративным инструментам нужда вендорская поддержка, получить которую проблематично как в случае с «китайцами», так и при работе с «оперсорсом».

От BI — к дата-майнингу

Рассмотренный выше BI можно рассматривать как дата-майнинг «на минималках», но традиционные задачи для дата-сайентистов остались и тоже требуют решения в рамках концепции data driven. Рассматривать BI как полностью автоматизированную задачу дата-сайенс не стоит, хотя бы потому, что она требует участия специалистов, как минимум для начальной настройки и для периодической перестройки схем обработки данных. Полностью автоматизировать BI в большинстве случаев невозможно, даже применение ИИ при имеющемся уровне развития технологии не позволяет это сделать.

Даже пред-обученный бот, работающий самостоятельно, выдает абсурдные или очевидные результаты. Однако пред-обученный бот ViTalk повышает эффективность работы аналитиков на 20+% и более, сказал Максим Губин, руководитель отдела экспертизы и развития компетенций в Visiology, обеспечивая более быстрое получение бизнес-значимых результатов.

Аналогичная ситуация — в «большом дата-сайенс», где боты и другие инструменты на основе ML и ИИ находят распространение, которое становится все более широким по мере развития технологий и навыков их применения у специалистов. Каких-либо специфических рисков, связанных именно с ИИ, аналитики не отмечают, но подчеркивают, что к моделям следует относиться осторожно — они имеют свой жизненный цикл и по мере изменения ситуации в окружающем мире должны быть модифицированы или выведены из эксплуатации. Рано или поздно возникает ситуация, когда в бизнес-процессах уже произошли изменения, а модель об этом «не знает».

Исключить человека из процессов анализа данных невозможно, только в результате ежедневной работы десятков квалифицированных специалистов, действующих на основе корпоративных политик и соблюдающих регламенты, данные могут реально превратиться в «новую нефть». Заметим, что «новая нефть» как метафора оказывается многогранной: иногда это «черное золото» может оказаться крайне токсичным.

«Данные — это новая нефть, платина, золото XXI века», — сказал Михаил Мишустин, Премьер-министр Правительства РФ, отметив, что данные могут как быть источником пополнения заработков, так и причиной разрушения.

Продолжение следует

Источник: Александр Маляревский, внештатный обозреватель IT Channel News