К мероприятиям
«Я тебя по IP вычислю!» – помните такую угрозу из интернета времен нулевых? в МТС Digital решили выяснить, можно ли составить хотя бы приблизительное представление о человеке, обладая информацией о сайтах, которые он посещает. Для этого в МТС Digital сгенерировали полусинтетические данные.
Вопрос звучит так: сможем ли мы по таким цифровым следам пользователя (на каких сайтах с каких IP он сидел, сколько раз заходил, какое у него устройство) понять, кто этот пользователь? Студент или пенсионер? Мужчина или женщина?
Действительно, в Digital-рекламе часто сегмент включает себя пол и один из бакетов по возрасту (<18, 18-24, 25-34, 35-44, 45-54, 55-64, 65+). Эта задача особенно актуальна для рекламных DSP-площадок, которые в OpenRTB запросах получают такие данные с частотой 200 000 запросов в секунду со всех сайтов, размещающих рекламу за деньги.
Задача соревнования
Определение пола и возраста владельца HTTP cookie по истории активности пользователя в интернете на основе ситнетических данных.
Проверка решений:
Участники могут объединяться в команды до 4 человек.
Призовой фонд :
MTS ML CUP
- Когда:
- 30.01.2023 - 29.03.2023
- Где:
- Онлайн
- Организатор
- МТС
Вопрос звучит так: сможем ли мы по таким цифровым следам пользователя (на каких сайтах с каких IP он сидел, сколько раз заходил, какое у него устройство) понять, кто этот пользователь? Студент или пенсионер? Мужчина или женщина?
Действительно, в Digital-рекламе часто сегмент включает себя пол и один из бакетов по возрасту (<18, 18-24, 25-34, 35-44, 45-54, 55-64, 65+). Эта задача особенно актуальна для рекламных DSP-площадок, которые в OpenRTB запросах получают такие данные с частотой 200 000 запросов в секунду со всех сайтов, размещающих рекламу за деньги.
Задача соревнования
Определение пола и возраста владельца HTTP cookie по истории активности пользователя в интернете на основе ситнетических данных.
Проверка решений:
- Решения проверяются автоматически. Запуск происходит на полностью закрытых тестовых данных, которые не передаются участникам.
- На лидерборде рейтинг участников будет рассчитываться по подвыборке ответов из тестовых данных.
- Кол-во сабмитов в день: 3
- Метрика соревнования — ROC-AUC – для определения пола, f1 weighted – для определения возраста. Все решения рассчитываются по формуле - 2 * f1_weighted(по 6 возрастным бакетам) + gini по полу.
- Возрастные бакеты 18-24, 25-34, 35-44, 45-54, 55-64 65+.
Участники могут объединяться в команды до 4 человек.
Призовой фонд :
- 1 место - 350 000 рублей
- 2 место - 200 000 рублей
- 3 место - 100 000 рублей