22 января 2020 г.
Машинное обучение — одна из наиболее продуктивных высоких технологий, которые активно осваивает современный ритейл. Анализ истории заказов потребителя — либо офлайн, с привязкой к номеру скидочной карты, либо онлайн, прямо по журналу покупок в личном кабинете — позволяет прогнозировать, за каким товаром и когда именно данный конкретный человек обратится в этот магазин в следующий раз. Однако время от времени покупатели совершают абсолютно, казалось бы, непредсказуемые покупки. Так вот: тот ритейлер, что научится эффективно предугадывать именно эти покупки, получит ощутимое преимущество на своём высококонкурентном рынке.
Недавно на портале Amazon.Science, где публикуются вполне серьёзные работы в области прикладной экономики розничной торговли и изучения потребительского рынка, появился анонс исследования на тему «Почему покупатели приобретают очевидно нерелевантные продукты?» Нерелевантные, имеется в виду, тому прогнозу предпочтений данного потребителя, который на основе глубокого анализа его прежних покупок и сформулированного им запроса предложила «умная» система Amazon. Полностью эта работа вместе с детальным изложением методики и критериев верифицируемости будет представлена на февральской конференции ACM Web Search and Data Mining (WSDM).
Исследователи обратили внимание на чрезвычайно важный с точки зрения организации розничных продаж факт: то, что потребитель ищет — либо в каталоге Интернет-агрегатора, либо бродя между полками традиционного магазина, — далеко не всегда оказывается тем, что ему действительно нужно и что он в итоге приобретает. Простой пример подобной ситуации приведён на сопровождающем заметку рисунке: покупатель лаконично заявил (в данном случае — голосом, через умную колонку Amazon с голосовым помощником Alexa) о своём желании приобрести бургер («Buy burger»).
Казалось бы, всё просто: человек хочет бургер — значит, надо показать ему весь доступный ассортимент упакованных в булки жареных котлет, от полуфабрикатов до готовых к доставке из ресторана блюд. Собственно, живые консультанты Amazon, которые избирательно курируют голосовые запросы с целью лучшего растолкования их компьютерной системе, именно таким образом и трактовали пожелание «Купить бургер». В результате бургеры как продукт помечаются для системы меткой «релевантно запросу», и она предлагает покупателю, например, тот сложный бутерброд с сочной шестиунциевой котлетой из мяса бычков абердин-ангусской породы, что приведён на рисунке слева.
Вместе с тем автоматическая система, основанная на машинном обучении, демонстрирует потенциальному покупателю, помимо помеченных как заведомо релевантные товаров, один-два менее подходящих, но всё же имеющих отношение к запросу. Справа на рисунке в этом качестве показан ручной пресс для формовки аккуратных бургерных котлет из фарша. Так вот, сюрприз: в реальности внезапно оказывается, что среди всех клиентов Amazon, которые заявляли голосовому помощнику о своём намерении «купить бургер» (именно эти два слова), ни один в итоге не приобрёл пресловутую котлету в булке. Зато некоторые, примерно 3%, купили продемонстрированный им словно бы невзначай пресс для самостоятельного приготовления этих самых котлет.
Ассоциированные с Amazon исследователи проанализировали значительный массив подобных ситуаций, накопленных системой оценки потребительских предпочтений за долгое время. Выяснилось, что такие нерелевантные покупки совершают чаще всего те клиенты, которые формулируют свой запрос либо чрезвычайно коротко, либо, наоборот, слишком длинно и в мельчайших деталях. Те же потребители, которые используют поисковые фразы средней длины, со значимо большей вероятностью останавливают свой выбор на ожидаемо релевантных их запросу рекомендациях, выданных системой.
Объясняющая эту особенность поведения покупателей гипотеза такова: люди, которые сами не слишком точно знают, чего хотят, подсознательно склонны формулировать свой поисковый запрос наиболее коротко. Такая формулировка позволяет им получить в ответ максимально широкий спектр предложений, рассматривая которые, они с некой вероятностью обнаружат-таки то, что на самом деле искали, не отдавая себе в этом явного отчёта. Причём обнаружат нередко как раз среди кажущихся компьютерной системе и живым консультантам нерелевантными предложений.
С длинными запросами ситуация иная: зная исходно во всех мелочах, какой продукт ему нужен, клиент не удовлетворится «почти тем же самым, но без перламутровых пуговиц». Удостоверившись, что в данном магазине желаемого товара нет — а если речь идёт об агрегаторе масштаба Amazon, можно считать, что его в данный момент приобрести практически нереально, — дотошный покупатель смирится с невозможностью совершить желанную покупку прямо сейчас. И обратит внимание не на прямой её аналог от другого производителя либо с несколько отличающимися характеристиками, а на что-то совсем вроде бы нерелевантное его исходному детальному запросу.
Зато те потребители, которые формируют запрос средней длины, обычно склонны выбирать именно среди тех вариантов, что умная система предлагает им в первую очередь: они исходно настроены на позитивное восприятие дельного совета, исходит ли он от консультанта в торговом зале или от системы машинного обучения.
Любопытно, что российский онлайновый ритейл уже не первый год активно использует аналитику «вроде бы нерелевантных» покупок. Так, в ходе круглого стола stoREvolution, своеобразного коллоквиума по цифровой трансформации ритейла, который Microsoft проводила в Москве осенью 2018 г., Андрей Ревяшко, ИТ-директор онлайнового магазина Wildberries, рассказал о своём опыте применения машинного обучения для конкретизации нечётких запросов потребителей. К примеру, если человек ищет на сайте «портплед», то значительно чаще вместо современного словарного значения этого слова — «дорожный чехол для костюмов или иных предметов одежды» — он имеет в виду небольшую мягкую дорожную сумку. Да, формально он неправ, — но зачем на этом основании отказывать ему в покупке?
Никто специально не обучал поисковую систему онлайн-магазина потакать не слишком твёрдым в определениях клиентам: она сама сделала соответствующий вывод на основе сопоставления множества поисковых запросов и последующих покупок. Аналогично, введя на сайте Wildberries запрос «зелёное платье», клиент получает в списке выдачи — помимо действительно зелёных — ещё и одну-две ссылки на платья красного цвета. Именно красного: просто потому, что машинное обучение позволило системе подметить, что некоторая доля подбиравших себе изначально зелёное платье в итоге останавливается как раз на красном.
Иными словами, искусственный интеллект на сайте компьютерного магазина на запрос «процессор» быстро научится выдавать ссылки не только на центральные процессоры в боксовых упаковках, но и на системные блоки, от неттопов до геймерских станций, — и тем самым расширит потенциальную потребительскую аудиторию за счёт обывателей, не слишком сведущих в ИТ-терминологии. И не следует волноваться, что «машина не может знать лучше живого профессионала, чего хочет покупатель». Разумеется, не может. Зато она способна анализировать гигантские объёмы данных заведомо быстрее и точнее любого профессионала — и обнаруживать там реально работающие, хотя формально и непредсказуемые паттерны. А если нечто работает — так ли уж важно для дела, существует ли для этого логически безупречное обоснование?
Источник: Максим Белоус, crn.ru