G
enby!

Как Нейросети Обобщают Знания? Генерализация в ИИ.

Но почему нейросеть не может просто запомнить обучающий датасет? Давайте разберемся, как ИИ находит общие паттерны в данных, разберем, что такое "гладкий минимум" и почему он важнее глобального минимума. 0:00 Введение 0:38 Quick recap 2:48 Как это обобщать? 3:24 Устойчивость к шуму в данных 4:17 Устойчивость к шуму в весах 5:46 Гладкие и острые минимумы 7:25 Острота и learning rate 8:50 Learning rate scheduler 9:42 эксперимент с mobile-net-v2 11:18 Устойчивость к шуму в высокоуровневых признаках 12:01 Вывод

Смотрите также