
Задача 5
Поиск одинаковых товаров на маркетплейсе
Актуальность
Ozon — ведущая мультикатегорийная платформа электронной коммерции и одна из
крупнейших интернет-компаний в России. На площадке представлено более 150 млн
товарных наименований в 20 категориях: от книг и одежды до продуктов питания и товаров для здоровья.
Сейчас более 90% ассортимента площадки формируют партнеры маркетплейса, в некоторых
случаях предлагающие одинаковые товары по разной стоимости и с разными сроками доставки.
В этой связи Ozon нужно постоянно совершенствовать алгоритм определения одинаковых
товаров, чтобы клиенты лучше ориентировались в предложениях продавцов
Описание задачи
Разработайте ML-модель, способную определить идентичность товаров по названиям, атрибутам и изображениям.
Модель должна находить среди пар-кандидатов как можно больше одинаковых товаров с точностью >95%
- Тренировочная выборка: пары одинаковых и различных товаров;
- Тестовая выборка: пары товаров без разметки (выборка для формирования лидерборда);
- Дополнительные данные: названия, атрибуты, векторные представления картинок (эмбединги) товаров
эксперты





