Llama 3.1: разбор статьи. Часть 5. DPO.
Разбираем статью "The Llama 3 Herd of Models" (2024) со слушателями нашей AI-школы, раздел 4.1.4 Direct Preference Optimization. Таймкоды: 00:00 Приветствие 01:37 Direct Preference Optimization Плейлист с разбором Llama 3.1: • Llama 3.1: разбор статьи Все видео плейлиста: 1. Intro & Data mix: • Llama 3.1: разбор статьи. Часть 1.Intro & ... 2. Model Architecture & Scaling laws: • Llama 3.1: разбор статьи. Часть 2. Archite... 3. Pre-training: • Llama 3.1: разбор статьи. Часть 3. Pre-tra... 4. Reward modeling & Supervised Fine-tuning: • Llama 3.1: разбор статьи. Часть 4. Reward ... Телеграм-канал: https://t.me/razinkov_ai
Список моих открытых курсов по AI на YouTube: https://t.me/razinkov_ai/622
Предварительная регистрация в следующий поток AI-школы: https://razinkov.ai/school