Российские цифровые сервисы начали выполнять закон. Рассказали о своих алгоритмах рекомендаций
Цифровые сервисы начали выполнять закон, обязывающий их разместить на сайте, как именно они предлагают контент пользователям. На государственных СМИ кампания – как сервисы умеют манипулировать пользователем – “ууууу”. На сервисах – тексты, как создают рекомендации. До раскрытия весов факторов ранжирования ещё не дошло, но у некоторых факторы перечислены. У некоторых совсем лаконичное описание.
Wildberries. Прямая речь
Правила применения рекомендательных технологий
- ООО «Вайлдберриз» (ИНН 7721546864) (далее – «Общество») является владельцем сайта www.wildberries.ru (далее – «Сайт»), на котором применяются информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети “Интернет”, находящихся на территории Российской Федерации.
- Под рекомендательными технологиями здесь и далее понимаются информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», находящихся на территории Российской Федерации».
- Общество не допускает применения рекомендательных технологий, которые нарушают права и законные интересы граждан и организаций, а также не допускает применение рекомендательных технологий в целях предоставления информации с нарушением законодательства Российской Федерации.
- Для алгоритмических вычислений и машинного обучения Общество использует данные, полученные от пользователей Сайта, а также техническую информацию, собираемую автоматически, в том числе информацию о том, как пользователь пользуется сайтом и информацию об устройстве пользователя, а именно:
- данные о любых действиях пользователя на Сайте;
- данные о любых запросах пользователя на Сайте;
- данные о выбранном пункте выдачи заказов;
- IP адрес;
- файлы cookies;
- длительность пользовательской сессии;
- точки входа (сторонние сайты, с которых пользователь по ссылке переходит на сайт);
- точки выхода (ссылки на сайте, по которым пользователь переходит на сторонние сайты);
- страна пользователя;
- геопозиция;
- регион пользователя;
- часовой пояс, установленный на устройстве пользователя;
- провайдер пользователя;
- браузер пользователя;
- ОС пользователя;
- информация об устройстве пользователя;
- параметры экрана (разрешение, глубина цветности, параметры размещения страницы на экране);
- дата и время посещения сайта;
- источник перехода (UTM метка);
- данные, содержащиеся в личном кабинете пользователя, зарегистрированного на Сайте;
- данные сетевого трафика.
- Общество использует рекомендательные технологии для формирования персональных и неперсональных подборок на сайте, обработки запросов пользователей Сайта при поиске товаров в целях быстрого предварительного отбора товаров, из которых пользователь Сайта может выбрать наиболее подходящие.
- Для формирования выдачи рекомендаций применяются такие технологии как нейросети, ансамбли решающих деревьев, коллаборативные фильтрации и классические модели машинного обучения. Алгоритмы обучаются и применяются с целью подобрать для пользователя Сайта наиболее релевантные товары на основании его действий на сайте.
- Процесс работы рекомендательных технологий Общества заключается в следующем:
- формируется набор данных о последней активности пользователя;
- на основании этого набора делается предсказание его последующих действий набором алгоритмов;
- результаты работы нескольких алгоритмов объединяются и формируют рекомендации, подходящие пользователю;
- на основании схожести характеристик товаров и информации о пользователе отобранные рекомендации досортировываются и сохраняются для выдачи пользователю;
- на этапе выдачи товаров заранее рассчитанные рекомендации перемешиваются в соответствии с бизнес-правилами.
Подробности от Habr о других
Интернет-площадки, в том числе VK, «Яндекс», Ozon, Wildberries, «Сбермаркет», «М.видео-Эльдорадо», ivi, Start и другие, разместили правила применения своих рекомендательных алгоритмов и «колдунщиков». Этого требует закон, вступивший в силу 1 октября.

Теперь на главной странице «Яндекса» есть раздел «Правила рекомендаций», где описываются особенности работы всех сервисов экосистемы, в том числе поисковика. Так, «Яндекс» учитывает историю поисковых запросов пользователя, информацию о его устройстве, геолокацию, cookie, язык запросов и страниц в результатах выдачи. В «Яндекс.Музыке» на выдачу влияют отметки «Нравится» и настройки предпочтений, а в «Кинопоиске» — история поиска.
Ozon обновила оглавление рубрикой «Работа алгоритмов Ozon». В ней сообщается, что всего учитывается около 300 параметров товара: характеристики, рейтинг и покупательское поведение (оформление заказа, просмотр товара или добавление в корзину). Wildberries также собирает данные о любых действиях пользователя на сайте, а, кроме того, информацию о его провайдере, браузере и операционной системе, плюс учитывает разрешение и глубину цветности экрана на устройстве.
VK сообщает, что использует для рекомендаций отметки «Мне нравится», «Это не интересно», «Поделиться», добавление аудиозаписей в раздел «Моя музыка» или видеозаписей в раздел «Мои видео», комментирование контента, частоту просмотра контента того или иного сообщества или пользователя, добавление в друзья, вступление в сообщества и подписки на пользователей. Также могут учитываться иные факторы, такие как обобщённые сведения о предпочтениях пользователей на этой территории.
Гендиректор ассоциации «Интернет-видео» Алексей Бырдин отметил, что в нынешней редакции закон не требует раскрытия коммерчески чувствительных правил работы алгоритмов.
Зампред комитета Госдумы по информполитике, информационным технологиям и связи Антон Горелкин напомнил, что зарубежные сервисы тоже должны соблюдать новые требования, но YouTube и Google пока не раскрыли принципы работы своих алгоритмов.
В 2022 году депутаты предложили частично запретить рекомендательные алгоритмы интернет-сервисов. Против этой инициативы выступили «Яндекс» и VK. В конце года АНО «Цифровая экономика» предложило механизм саморегулирования на базе разрабатываемых предпринимательским сообществом этических правил создания и применения рекомендательных сервисов.