Даниель Яна Дмитриевна
студент
Харьковский национальный университет радиоэлектроники
Украина, г. Харьков
Руководитель:
Турута Алексей Петрович
кандидат технических наук, доцент
Харьковский национальный университет радиоэлектроники
Украина, г. Харьков
Аннотация: Статья посвящена обзору рекомендательных систем и проблеме «холодного старта». Проанализированы существующие примеры рекомендательных систем. Рассмотрены способы борьбы с основными проблемами таких систем.
Ключевые слова: рекомендательная система, «холодный старт», проблема поиска и выбора
Мы живем в эпоху, неограниченную физическими пределами торгового пространства, когда для того, чтобы приобрести нужный товар или воспользоваться услугой достаточно иметь доступ к сети Интернет. Как следствие, значительно вырос объем предложения, и человек столкнулся с проблемой поиска и выбора [1]. Иначе говоря, большое количество вариантов усложняет процесс принятия решения.
Рекомендательные системы - это программы, которые пытаются предсказывать, какой именно товар или услуга могут быть интересны пользователю. Предполагается, что они способны помочь в решении проблемы поиска и выбора путем формирования списка рекомендаций по запросу.
Первые сложности возникают на этапе формирования этого списка. Для того, чтобы рекомендательная система могла выдвинуть какие-либо предположения согласно интересам, требуется располагать хотя бы минимальным набором информации о пользователе. Эта проблема является основной для рекомендательных систем и называется «холодный старт» [2]. Она относится не только к новым пользователям, но и к объектам, о которых пока еще ничего не известно.
Для борьбы с этой проблемой рекомендательные системы используют две основные стратегии - сбор информации о пользователе путем фильтрации на основе содержания и коллаборативной фильтрации [3].
Фильтрация на основе содержания являет собой список вопросов, на которые пользователю предлагается ответить во время создания профиля в рекомендательной системе. Атрибутивная информация, собираемая таким образом, зависит от типа объекта.
Коллаборативная фильтрация собирает данные о поведении пользователя в прошлом, а также анализирует предпочтения пользователей со схожими вкусами - если интересы пользователя схожи с некоторой группой покупателей, то можно рекомендовать товары и услуги, которые пришлись по вкусу кому-то из группы. Определение схожести осуществляется вычислением коэффициента Жаккара [4], который определяет насколько общая часть интересов относится к их общему количеству. Следует отметить, что это эти стратегии являются не единственными при формировании рекомендаций.
iTunes - медиаплеер, который использует вышеописанные стратегии для определения рекомендаций музыки и фильмов. Во время создания профиля пользователю предлагается указать, какие музыкальные исполнители и жанры ему интересны, расставив их в порядке предпочтений, а также исключить те, которые ему не нравятся. Вторая стратегия воплощена в виде списка рекомендаций на основе ранее понравившихся музыкальных треков или фильмов.
Еще одним примером рекомендательных систем является Upwork - глобальная площадка для фрилансеров, где работодатели и независимые профессионалы могут удаленно сотрудничать. Фрилансер указывает информацию о себе, своих навыках и сферах занятости. Согласно полученному списку, ему предлагается перечень доступных проектов, на которые можно подать заявку. Со своей стороны, заказчик предоставляет описания проекта и специалистов, которые на него затребованы. Если кто-либо из пользователей платформы еще не зарекомендовал себя и у него нет предыдущего опыта успешного заключения контрактов на данной платформе, мы сталкиваемся с проблемой «холодного старта» - когда ничего не известно ни о фрилансере, ни о заказчике.
Для борьбы с этой проблемой в данном контексте предлагается использовать неявный сбор данных [5]. Можно сопоставлять данные из профиля пользователя на платформе с его общедоступными данными в социальных сетях (в том числе и в соцсетях для деловых контактов, например, LinkedIn) - в каком учреждении получено высшее образование, какой средний балл, отзывы сотрудников и работодателей с предыдущих мест работы до ухода на фриланс, дополнительные навыки, интересы, и так далее. Кроме этого, можно отслеживать поведение пользователя онлайн для анализа проектов, на которые он подает заявку. Полученные данные могут быть использованы в различных целях, вплоть до среднего рейта среди фрилансеров с таким же образованием и уровнем навыков, или рейт проектов, ниже которого не рассматривается фрилансером.
Таким образом, проблема «холодного старта» является одной из основных для рекомендательных систем, и существуют эффективные методы и стратегии борьбы с ней. Эти методы могут применяться для различных целей - от исключения риска подписания контрактов с людьми, о которых ничего не известно до поиска и выбора музыкального трека или фильма на основании предыдущих предпочтений.
Литература:
1. Louviere, Jordan J.; Woodworth, George (1983). "Design and Analysis of Simulated Consumer Choice or Allocation Experiments: An Approach Based on Aggregate Data". Journal of Marketing Research. 20 (4): 350–367.
2. Andrew I. Schein; Alexandrin Popescul; Lyle H. Ungar; David M. Pennock (2002). Methods and Metrics for Cold-Start Recommendations. Proceedings of the 25th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2002). New York City, New York: ACM. pp. 253–260.
3. John S. Breese, David Heckerman, and Carl Kadie, Empirical Analysis of Predictive Algorithms for Collaborative Filtering, 1998
4. Jaccard P. Distribution de la flore alpine dans le Bassin des Dranses et dans quelques regions voisines // Bull. Soc. Vaudoise sci. Natur. 1901. V. 37. Bd. 140. S. 241—272.
5. Y. Koren, R. Bell, C. Volinsky Matrix Factorization Techniques for Recommender Systems // Computer. — IEEE. — Т. 42, № 8. — С. 30—37.