Большинство разработчиков не понимают, как работают токены LLM.
Большинство разработчиков ежедневно используют программы LLM, но не имеют представления о некоторых фундаментальных принципах. Понимание токенов крайне важно, поскольку необходимо знать, как выставляется счет и почему тарифы различаются у разных поставщиков. Станьте героем ИИ с новостной рассылкой AI Hero: https://www.aihero.dev/newsletter
Код: https://github.com/mattpocock/ai-sdk-...
00:00 Введение 00:33 Токены ввода и вывода 01:11 Мониторинг использования токенов 02:16 Что такое токены? 02:50 Tiktoken 03:47 Полный процесс обучения на уровне магистратуры (LLM) 04:49 Создание словарей токенов 05:25 Токенизатор на уровне символов 06:37 Размер словарного запаса 07:20 Токенизатор на уровне подслов 08:33 Создание более длинных подслов 08:58 Необычные слова 09:45 Краткое содержание