G
enby!

Д. Руденко, А.Червов "Обзор прошедшего соревнования "Open Problems – Single-Cell Perturbations""

👨‍🔬 Дмитрий Руденко, Александр Червов "Обзор прошедшего соревнования "Open Problems – Single-Cell Perturbations"" ⌚️ Четверг 20.00 (по Москве) 14 Декабря https://t.me/sberlogabig/347
В соревнование требовалось предсказать как под действием лекарств (146 разных) меняются экспрессии генов. Было только две фичи и они категорные - название клеточного типа (6 типов клеток крови) и название лекарств. Это реальные экспериментальные данные полученные по топовым технологиям и стоящие огромных денег (200 тысяч клеток секвинировали мультимодально) - реально cutting-edge research questions. Семплов мало - 600+ в трейне, 255 в тесте, но таргетов было много 18211 (все гены). Удивительно, но особого шейкапа не было, хотя СВ-ЛБ билось плохо и семплов мало. Основные решения строились на PYBOOST (https://www.kaggle.com/code/alexander...)
и нейронках (удивительно, но нейронки хорошо работают даже при таком малом числе семплов). Наша команда (Антонина Долгорукова, Дмитрий Руденко, Дмитрий Ершов, Антон Вахрушев, Александр Червов) заняла "счастливое" 13 место - ровно на 1 ниже золота ((((( Но у нас есть шанс еще на приз от экспертов - и ваши апвоуты - нам не помешают: "U900 team - PYBOOST is what you need" https://www.kaggle.com/competitions/o...
описание решения и ответы на вопросы оргов. (Ваш альтруизм не будет забыт!) В данном докладе мы напомним в чем была задача, немного расскажем о подходе на PYBOOST и перейдем к обзору решений других команд. Zoom link will be in @sberlogabig just before start. Video records:    / sciberloga   - subscribe ! PS Подписывайтесь на канал Дмитрия о дата сайнс и Каггл: https://t.me/pseudolabeling

Смотрите также