Саморазвитие Cамосовершенствование Личностный рост

Коллаборативная фильтрация – что это такое и как используют ее методы?

Коллаборативная фильтрация – что это такое и как используют ее методы?

Коллаборативная фильтрация появилась недавно, эта методика помогает человеку справляться с информационным потоком, рекомендуя то, что ему с большой долей вероятности должно понравиться. Основы коллаборативной фильтрации существовали и ранее, но были более примитивны.

Коллаборативная фильтрация – что это такое?

Несколько последних десятилетий отличаются предыдущих огромным количеством информации, доступной человеку. Ни один индивид не способен воспринять и переработать весь существующий информационный поток, поэтому и была изобретена коллаборативная фильтрация – определение которой звучит так: это автоматизированный метод построения рекомендаций для одного пользователя на основе известных предпочтений этого пользователя и группы других пользователей.

Коллаборативная фильтрация простыми словами

«Коллаборация» означает «сотрудничество», это позволяет объяснить термин коллаборативная фильтрация – что это такое простыми словами. Значение слова коллаборативная фильтрация простым языком – это методика рекомендаций на основе предпочтений группы с похожими интересами, к которой можно отнести пользователя. То есть, сначала система анализирует то, что понравилось и не понравилось человеку и определяет его в группу людей с похожими интересами.

Предполагается, что интересы людей в группе схожи, поэтому, основываясь на том, что понравилось большинству индивидов из этой группы, система предлагает человеку музыку, фильмы, игры, товары и многое другое. Коллаборативная фильтрация будет точнее, если пользователь активно ставит оценки, слушает музыку, интересуется какими-либо темами. Если со временем у пользователя появляются дополнительные интересы – система гибко подстраивается и предлагает ему новую информацию.

Где используется коллаборативная фильтрация?

Рекомендательные сервисы в начале своего существования использовались на сайтах, где пользователь дает товарам оценки – на площадках интернет-торговли. Со временем сервисов, где применяется коллаборативная фильтрация, стало больше. Интерес к товарам система стала оценивать не по данным оценкам, а по тому, куда пользователь заходил, что купил. Эта система не совсем точна, поскольку вещь может быть куплена в подарок человеку с отличными интересами, а заход на сайт быть простым любопытством. Где используется коллаборативная фильтрация:

где применяется коллаборативная фильтрация

Как работает коллаборативная фильтрация?

Методы прогнозирования в коллаборативной фильтрации работают с двумя допущениями:

  1. Предпочтения пользователей со временем не меняются или меняются у всех одинаково.
  2. Если вкусы совпадают в чем-то одном, то они совпадают и в остальном, то есть, если людям нравятся одинаковые книги, то и фильмы они предпочтут одни и те же.

Методы коллаборативной фильтрации

Сегодня существуют два основных метода коллаборативной фильтрации и гибридный, основанный на первых двух. Первый метод коллаборативной фильтрации – основанный на соседстве. В этой методике каждому активному пользователю подбирается группа схожих с ним по вкусам людей. Данный подход реализуется по следующим этапам:

  1. Каждому пользователю присваивается вес, который зависит от того, насколько схожи его интересы с интересами активного пользователя
  2. Среди всех пользователей выбираются те, кто имеет максимальный вес (максимальную схожесть с активным пользователем), это и есть соседи активного пользователя.
  3. Осуществляется предсказание интересов активного пользователя на неоцененные им предметы, опираясь на оценки соседей и их вес.

Второй метод коллаборативной фильтрации основан на моделях – он предоставляет рекомендации на основе измерения статистических моделей для оценок пользователей (метод кластеризации, байесовских сетей). Модели для этого метода используются с применением алгоритмов машинного обучения и интеллектуального анализа данных. Этот метод более точный, но и более дорогой. В гибридном методе сочетаются подходы методов, основанных на соседстве и на моделях. Гибридная методика является самой распространенной для сайтов коммерческой направленности.

метод коллаборативной фильтрации

Коллаборативная фильтрация – пример

Области, где применяется коллаборативная фильтрация – реклама, интернет-магазины. Как она работает, можно рассмотреть на примере Яндекс Дзена – коллаборативная фильтрация – это одна из методик оценки, которую использует этот сервис, который постоянно совершенствуется. У Яндекс Дзена более 50 млн пользователей. Когда на сервисе появляется новичок, ему предлагаются самые популярные медиа на самые разные темы. Новичок листает ленту, открывает посты, ставит лайки или дизлайки, пишет комментарии. Система изучает эти сигналы и подбирает ему соседей.

Виды рекомендательных систем

В интернете область применения рекомендательной системы – магазины, музыка, фильмы, видео, новости, игры, приложения, социальные сети. Существуют два основных вида рекомендательных систем, которые часто объединяют и создают гибридную систему:

  1. Content-based – рекомендации даются на основе того, что пользователь смотрел, покупал, лайкал. Похожесть оценивается по признакам содержимого, то есть если пользователю понравилась мелодрама, ему только этот жанр и будут предлагать.
  2. Коллаборативная фильтрация – для рекомендаций используются оценки пользователя и его соседей – пользователей со схожими предпочтениями.

Проблемы, с которыми сталкиваются сервисы рекомендаций:

  • холодный старт – очень сложно давать рекомендации новому пользователю;
  • разреженность информации – из-за отсутствия информации, которая требуется системе (например, оценок товаров), ей сложно давать рекомендации пользователям;
  • из-за слишком простых методов фильтрации даются слишком тривиальные рекомендации;
  • чем больше в системе пользователей, тем сложнее алгоритм коллаборативной фильтрации;
  • система часто не понимает, какие понятия являются синонимами и относятся к одной группе, например, «детская одежда» и «одежда для детей»;
  • точность фильтрации могут сбивать сервисы, покупающие хорошие отзывы о своих услугах и товарах;
  • алгоритмы, основанные на рейтингах, плохо допускают в систему малоизвестные и новые товары и постоянно предлагают пользователям старые товары с хорошим рейтингом;
  • пользователей, чье мнение всегда не совпадает с большинством, очень много, и им сложно что-то рекомендовать.
область применения рекомендательной системы

Популярные сервисы рекомендаций

Известные во всем мире рекомендательные системы помогут найти все, что угодно – людей, музыку, фильмы, работу:

  • LinkedIn – бизнесориентированная социальная сеть, рекомендует людей, которых может знать пользователь, вакансии, группы;
  • Amazon – популярный сайт для покупки товаров, использует коллаборативную фильтрацию от элемента к элементу;
  • Hulu – веб-сайт потокового видео, распознает интересный для пользователя контент;
  • Netflix – сайт видео-контента, использует более 100 рекомендательных алгоритмов, благодаря чему отличается высокой точностью прогнозирования;
  • Google – поисковая веб-платформа;
  • Имхонет – сервис, дающий рекомендации на самые разные темы – литература, фильмы, музыка, игры и многое другое;
  • QiQo.ru – сервис, рекомендующий подарки;
  • genre.ru – сервис, рекомендующий на основе интересов пользователя или на основе одного объекта – актера, музыканта;
  • FeedMe – система рекомендации интересных для пользователя веб-страниц.

Сервис рекомендаций фильмов

Коллаборативная рекомендательная система и другие системы помогут найти самые интересные фильмы:

  • afisha.ru – найти интересный фильм поможет Киноробот;
  • IMDb, КиноПоиск – сервисы с информацией о фильмах, жанрах, актерах;
  • MovieLens – сервис для поиска фильмов с рекомендациями.

Сервисы рекомендаций музыки

Хороший сервис рекомендаций музыки поможет найти любую композицию:

  • Яндекс.Музыка – помогает слушать любимые композиции прямо из браузера;
  • Яндекс.Радио – сервис музыкальных рекомендаций в виде плейлиста;
  • Last.fm – социальная сеть музыкальной направленности, помогает искать новых исполнителей, сохранять собственную медиатеку;
  • Gnoosic – сервис, который рекомендует музыку на основе предпочтений пользователя.

Сервис рекомендаций книг

Сайты, где используется коллаборативная фильтрация – книги, журналы и многое другое:

  • livelib.ru – ресурс рекомендации литературы;
  • Архивы Кубикуса, Лаборатория Фантастики – сервисы рекомендации литературы жанров фэнтези и фантастика;
  • ЛитРес – электронная библиотека с рекомендацией новинок.

Сервисы товарных рекомендаций

Разнообразных интернет-магазинов в сети очень много, для привлечения покупателей они используют системы скидок, рекомендации и другие услуги:

  • Ozon, Яндекс.Лавка – сайты рекомендуют товары, при этом используется как совместная фильтрация (коллаборативная), так и индивидуальные предпочтения пользователя;
  • Юлмарт – сайт с огромным количеством товаров, скидками и рекомендациями;
  • Wildberries – огромный интернет-магазин;
  • Aliexpress, Joom – доступные товары из Китая.
 
Похожие статьи
Как планировать свой день?
Только прочитав данную статью, вы сможете раз и навсегда повернуть свою жизнь в новое русло. Научитесь правильно строить планы и успевать все их притворять в жизнь. Внимательно следуя рекомендациям, вы сможете по-настоящему оценить все свободное время, которое обязательно теперь появится в мерном течении рабочих дней.
Чем заняться в самолете?
Для тех, чья жизнь связана с частыми авиаперелётами вопрос: «Чем заняться в самолете?» не исчерпает себя никогда. Так что если вы не являетесь стюардессой или пилотом, которым по долгу службы развлекаться всё-таки не стоит, примите на вооружение наши полезные советы.
Что отнимает много времени?
Ежедневно мы тратим огромное количество времени на действия или же бездействие, от которых нет никакого толку. Так к чему же тогда удивляться, почему нам вечно не хватает времени, сил и возможностей. Может быть пришла пора менять свою жизнь в лучшую сторону?
Как выспаться за короткое время?
Современный ритм жизни часто не позволяет такую роскошь, как сон по 10 часов. Но не высыпаясь, вы не способны нормально работать. Как же порвать этот замкнутый круг? Учиться высыпаться быстро! Мы дадим вам несколько простых, но эффективных советов.