The Hundred-Page Language Models Book

Andriy Burkov

«The Hundred-Page Language Models Book» — это лаконичное и доступное руководство по языковым моделям и машинному обучению от автора популярной серии «The Hundred-Page». Книга представляет собой мастер-класс по сжатию сложных концепций искусственного интеллекта в понятные, «разжеванные» объяснения.

В книге рассматривается полный путь от основ машинного обучения и линейной алгебры до реализации современных трансформеров и больших языковых моделей (LLM). Автор начинает с фундаментальных понятий: модели, векторы, матрицы, градиентный спуск и автоматическое дифференцирование, что делает материал доступным даже для новичков.

Основное внимание уделяется архитектуре и принципам работы языковых моделей: от классических методов Bag of Words и word embeddings до рекуррентных нейронных сетей (RNN) и трансформеров. Подробно разбираются ключевые компоненты: self-attention, multi-head attention, residual connections, нормализация и позиционные эмбеддинги (включая Rotary Position Embedding).

Заключительные главы посвящены практическим аспектам работы с LLM: тонкой настройке (finetuning), Low-Rank Adaptation (LoRA), инженерии промптов, оценке моделей, проблеме галлюцинаций, а также этическим и юридическим вопросам. Книга завершается обзором перспективных направлений: Mixture of Experts, слияние моделей, сжатие моделей и безопасность.

Похожие книги

The Hundred-Page Machine Learning Book

Andriy Burkov

Introduction to Python and Large Language Models: A Guide to Language Models

Dilyan Grigorov

Understanding Large Language Models: Learning Their Underlying Concepts and Technologies

Thimira Amaratunga

Hands-On Large Language Models: Language Understanding and Generation

Jay Alammar, Maarten Grootendorst

Intermediate Python and Large Language Models

Dilyan Grigorov

Mastering Large Language Models with Python: Unleash the Power of Advanced Natural Language Processing for Enterprise Innovation and Efficiency Using Large Language Models (LLMs) with Python

Raj Arun R

Large Language Models Projects: Apply and Implement Strategies for Large Language Models

Pere Martra

Building Applications with Large Language Models: Techniques, Implementation, and Applications

Bhawna Singh

LLM Engineer’s Handbook: Master the art of engineering large language models from concept to production

Paul Iusztin, Maxime Labonne

Scaling Enterprise Solutions with Large Language Models: Comprehensive End-to-End Generative AI Solutions for Production-Grade Enterprise Solutions

Arindam Ganguly