How Large Language Models Work

Edward Raff, Drew Farris, Stella Biderman

Эта книга предлагает глубокое и систематическое погружение в архитектуру и принципы работы больших языковых моделей (LLM). Авторы, эксперты в области машинного обучения, последовательно раскрывают внутреннее устройство современных генеративных моделей, начиная с фундаментальных концепций и заканчивая практическими аспектами их применения и этическими вопросами.

Ключевой фокус сделан на детальном разборе компонентов LLM: от процесса токенизации, который преобразует текст в числовые представления, до архитектуры трансформеров — сердца современных языковых моделей. В книге подробно объясняются слои эмбеддинга, механизмы внимания, позиционное кодирование и процесс декодирования, которые вместе позволяют модели генерировать связный и контекстуально релевантный текст.

Отдельные главы посвящены процессу обучения LLM, методам контроля и настройки их поведения, а также применению моделей за пределами обработки естественного языка. Авторы также рассматривают распространённые заблуждения, текущие ограничения технологий и обсуждают важные этические аспекты разработки и использования больших языковых моделей в реальных решениях.

Похожие книги

Building Applications with Large Language Models: Techniques, Implementation, and Applications

Bhawna Singh

Large Language Models Projects: Apply and Implement Strategies for Large Language Models

Pere Martra

Hands-On Large Language Models: Language Understanding and Generation

Jay Alammar, Maarten Grootendorst

Intermediate Python and Large Language Models

Dilyan Grigorov

Introduction to Python and Large Language Models: A Guide to Language Models

Dilyan Grigorov

Understanding Large Language Models: Learning Their Underlying Concepts and Technologies

Thimira Amaratunga

Logic and Language Models for Computer Science

Dana Richards, Henry Hamburger

The Hundred-Page Language Models Book

Andriy Burkov

Data Analysis with LLMs: Text, tables, images and sound

Immanuel Trummer

Build a Large Language Model (From Scratch)

Sebastian Raschka