Российские цифровые сервисы начали выполнять закон. Рассказали о своих алгоритмах рекомендаций

Цифровые сервисы начали выполнять закон, обязывающий их разместить на сайте, как именно они предлагают контент пользователям. На государственных СМИ кампания – как сервисы умеют манипулировать пользователем – “ууууу”. На сервисах – тексты, как создают рекомендации. До раскрытия весов факторов ранжирования ещё не дошло, но у некоторых факторы перечислены. У некоторых совсем лаконичное описание.

 

Wildberries. Прямая речь

Правила применения рекомендательных технологий

  1. ООО «Вайлдберриз» (ИНН 7721546864) (далее – «Общество») является владельцем сайта www.wildberries.ru (далее – «Сайт»), на котором применяются информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети “Интернет”, находящихся на территории Российской Федерации.
  2. Под рекомендательными технологиями здесь и далее понимаются информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», находящихся на территории Российской Федерации».
  3. Общество не допускает применения рекомендательных технологий, которые нарушают права и законные интересы граждан и организаций, а также не допускает применение рекомендательных технологий в целях предоставления информации с нарушением законодательства Российской Федерации.
  4. Для алгоритмических вычислений и машинного обучения Общество использует данные, полученные от пользователей Сайта, а также техническую информацию, собираемую автоматически, в том числе информацию о том, как пользователь пользуется сайтом и информацию об устройстве пользователя, а именно:
    • данные о любых действиях пользователя на Сайте;
    • данные о любых запросах пользователя на Сайте;
    • данные о выбранном пункте выдачи заказов;
    • IP адрес;
    • файлы cookies;
    • длительность пользовательской сессии;
    • точки входа (сторонние сайты, с которых пользователь по ссылке переходит на сайт);
    • точки выхода (ссылки на сайте, по которым пользователь переходит на сторонние сайты);
    • страна пользователя;
    • геопозиция;
    • регион пользователя;
    • часовой пояс, установленный на устройстве пользователя;
    • провайдер пользователя;
    • браузер пользователя;
    • ОС пользователя;
    • информация об устройстве пользователя;
    • параметры экрана (разрешение, глубина цветности, параметры размещения страницы на экране);
    • дата и время посещения сайта;
    • источник перехода (UTM метка);
    • данные, содержащиеся в личном кабинете пользователя, зарегистрированного на Сайте;
    • данные сетевого трафика.
  5. Общество использует рекомендательные технологии для формирования персональных и неперсональных подборок на сайте, обработки запросов пользователей Сайта при поиске товаров в целях быстрого предварительного отбора товаров, из которых пользователь Сайта может выбрать наиболее подходящие.
  6. Для формирования выдачи рекомендаций применяются такие технологии как нейросети, ансамбли решающих деревьев, коллаборативные фильтрации и классические модели машинного обучения. Алгоритмы обучаются и применяются с целью подобрать для пользователя Сайта наиболее релевантные товары на основании его действий на сайте.
  7. Процесс работы рекомендательных технологий Общества заключается в следующем:
    1. формируется набор данных о последней активности пользователя;
    2. на основании этого набора делается предсказание его последующих действий набором алгоритмов;
    3. результаты работы нескольких алгоритмов объединяются и формируют рекомендации, подходящие пользователю;
    4. на основании схожести характеристик товаров и информации о пользователе отобранные рекомендации досортировываются и сохраняются для выдачи пользователю;
    5. на этапе выдачи товаров заранее рассчитанные рекомендации перемешиваются в соответствии с бизнес-правилами.

 

Подробности от Habr о других

Интернет-площадки, в том числе VK, «Яндекс», Ozon, Wildberries, «Сбермаркет», «М.видео-Эльдорадо», ivi, Start и другие, разместили правила применения своих рекомендательных алгоритмов и «колдунщиков». Этого требует закон, вступивший в силу 1 ок­тяб­ря.

Яндекс алгоритмы рекомендаций

Теперь на главной странице «Яндекса» есть раздел «Правила рекомендаций», где описываются особенности работы всех сервисов экосистемы, в том числе поисковика. Так, «Яндекс» учитывает историю поисковых запросов пользователя, информацию о его устройстве, геолокацию, cookie, язык запросов и страниц в результатах выдачи. В «Яндекс.Музыке» на выдачу влияют отметки «Нравится» и настройки предпочтений, а в «Кинопоиске» — история поиска.

Ozon обновила оглавление рубрикой «Работа алгоритмов Ozon». В ней сообщается, что всего учитывается около 300 параметров товара: характеристики, рейтинг и покупательское поведение (оформление заказа, просмотр товара или добавление в корзину). Wildberries также собирает данные о любых действиях пользователя на сайте, а, кроме того, информацию о его провайдере, браузере и операционной системе, плюс учитывает разрешение и глубину цветности экрана на устройстве.

VK сообщает, что использует для рекомендаций отметки «Мне нравится», «Это не интересно», «Поделиться», добавление аудиозаписей в раздел «Моя музыка» или видеозаписей в раздел «Мои видео», комментирование контента, частоту просмотра контента того или иного сообщества или пользователя, добавление в друзья, вступление в сообщества и подписки на пользователей. Также могут учитываться иные факторы, такие как обобщённые сведения о предпочтениях пользователей на этой территории.

Гендиректор ассоциации «Интернет-видео» Алексей Бырдин отметил, что в нынешней редакции закон не требует раскрытия коммерчески чувствительных правил работы алгоритмов.

Зампред комитета Госдумы по информполитике, информационным технологиям и связи Антон Горелкин напомнил, что зарубежные сервисы тоже должны соблюдать новые требования, но YouTube и Google пока не раскрыли принципы работы своих алгоритмов.

В 2022 году депутаты предложили частично запретить рекомендательные алгоритмы интернет-сервисов. Против этой инициативы выступили «Яндекс» и VK. В конце года АНО «Цифровая экономика» предложило механизм саморегулирования на базе разрабатываемых предпринимательским сообществом этических правил создания и применения рекомендательных сервисов.

0

Автор публикации

не в сети 2 дня

Задорожный Сергей

33
Комментарии: 11Публикации: 6249Регистрация: 04-02-2020

Добавить комментарий