Т-ТЕХНОЛОГИИ [новости]
НОВОСТИ АКЦИЙ РОССИИ
Как группа «Т-Технологии» меняет правила игры в области рекомендательных систем с новым датасетом T-ECD?
Группа «Т-Технологии» опубликовала крупнейший кросс-доменный датасет T-ECD для рекомендательных систем 🔹 Центр искусственного интеллекта группы «Т-Технологии» открыл доступ к T-ECD — одному из крупнейших в мире датасетов для рекомендательных систем в электронной торговле. 🔹 T-ECD создан на основе данных 44 миллионов пользователей сервисов «Город: Шопинг» и «Супермаркеты», а также рекламной платформы Т-Банка. В наборе более 30 миллионов товаров и 135 миллиардов взаимодействий. 🔹 Основные особенности T-ECD: кросс-доменность и универсальность. Бенчмарк включает пять источников данных: история покупок по транзакциям, чеки, отзывы, рекомендации товаров повседневного спроса (FMCG) и непродовольственных товаров (non-FMCG), а также активации специальных предложений и кэшбэков. Все источники можно использовать отдельно или связывать по ключам пользователей, товаров или брендов, что позволяет строить полные профили и анализировать сложные сценарии для персонализации. Датасет подходит для большинства типов рекомендаций: от следующего объекта до общих топ-N списков. 🔹 Данные собраны за период от 1 до 3,5 лет, что позволяет анализировать краткосрочные и долгосрочные предпочтения, их динамику, сезонность и тренды. Глубина данных важна для исследований, так как позволяет корректно обучать модели и значительно повышать качество рекомендаций с помощью глубоких нейронных сетей. 🔹 В T-ECD есть информация о пользователях и товарах, явная и неявная обратная связь. Это делает его универсальным и подходит для исследований всех типов рекомендательных систем: от коллаборативной фильтрации до сложных контекстных и графовых подходов с глубоким обучением. В академических датасетах часто отсутствуют данные о просмотрах (impressions), которые важны для бизнеса. T-ECD уточняет источник показов: поиск, каталог или рекомендации, что помогает оценивать влияние рекомендаций на пользователей и моделировать эффект воздействия. 🔹 Почему T-ECD важен для индустрии Большинство существующих датасетов для рекомендательных систем устарели и не отражают актуальное поведение пользователей. T-ECD решает эту проблему, предоставляя бенчмарк на основе реальных данных. Это позволяет проверять новые алгоритмы машинного обучения на максимально приближенных к реальным условиям данных и повышает доверие к результатам экспериментов. 🔹 Марина Ананьева, руководитель направления рекомендательных систем в Т-Банке, отмечает: «Мы считаем важным вносить вклад в развитие открытых датасетов. T-ECD может стать новым бенчмарком и принести пользу ML-сообществу, улучшая качество персонализации и клиентский опыт. Этот набор данных также используется для развития наших внутренних продуктов, создания сложных рекомендательных систем в реальном времени и адаптации под клиентов». 🔹 T-ECD доступен на Hugging Face под лицензией Apache 2.0, что разрешает свободное коммерческое использование и модификацию. Больше новостей и анализа находятся в нашем мобильном приложение [m o n d i a r a](https://i.mondiara.com/) Скачать в [App Store](https://apps.apple.com/ru/app/m-o-n-d-i-a-r-a/id6475953453) Скачать в [Google Play](https://play.google.com/store/apps/details?id=com.mondiara.app) Источник: www.tbank.ru
Пост взят с международного финтех-медиа ресурса
ДЛЯ ЛЮДЕЙ