Линейная зависимость фичей, что значит мультиколлинеарность и как она ломает модель
📌 Заполни анкету прямо сейчас и получи чек-лист «15 самых популярных вопросов с собеседований и ответы на них» Анкета предзаписи: https://vk.cc/cO375f
Курс «База ML»: https://clck.ru/3NmoJd
Курс «ML в бизнесе»: https://clck.ru/3NmoNC
Telegram MLinside: https://t.me/+xPCRRLylQh5lMmI6
Вы добавляете новые признаки в модель, ожидаете рост качества, но метрики падают? Вероятности «скачут» даже на похожих объектах? Виновата может быть мультиколлинеарность — линейная зависимость признаков, которая ломает интерпретируемость и стабильность модели. Александр Дубейковский — ML-эксперт (3 года в Яндекс, сейчас Авито) — объясняет, что такое мультиколлинеарность, чем она опасна и как с ней бороться. В этом видео: • Что значит линейная зависимость признаков и как её заметить • Почему мультиколлинеарность ломает веса и интерпретируемость модели • 3 главных последствия: потеря стабильности, падение обобщающей способности и путаница в интерпретации • Как использовать корреляционную матрицу и коэффициент Пирсона для диагностики • Способы борьбы: регуляризация (L1/L2), PCA, генерация новых признаков • Практические примеры: кредитный скоринг, бизнес-модели и продакшн ML Подходит тем, кто: • готовится к собеседованию в Data Science / ML • работает с линейными моделями и хочет глубже понимать их работу • ищет практические методы повышения качества моделей Это часть серии MLinside — честно, по делу и без лишней воды. Таймкоды: 00:00 — Когда признаки ломают модель: вводная и примеры 00:59 — Что такое мультиколлинеарность и линейная зависимость 01:27 — Пример: кредитный скоринг и зависимые фичи 04:32 — Увеличение дисперсии коэффициентов 06:11 — Потеря интерпретируемости и воспроизводимости модели 08:22 — Как диагностировать мультиколлинеарность: корреляционная матрица и коэффициент Пирсона 10:00 — Способы борьбы: генерация новых признаков
Смотрите также
