Build a Large Language Model (From Scratch)

Sebastian Raschka

Эта книга представляет собой практическое руководство по созданию больших языковых моделей (LLM) с нуля. Автор, известный эксперт в области машинного обучения, проводит читателя через три ключевых этапа разработки LLM: реализацию архитектуры и подготовку данных, предварительное обучение на неразмеченных данных для создания базовой модели, а также тонкую настройку для решения конкретных задач, таких как классификация текста или создание персональных ассистентов.

Книга начинается с фундаментальных концепций, включая понимание архитектуры трансформеров и механизмов внимания, которые лежат в основе современных LLM. Далее подробно рассматриваются практические аспекты работы с текстовыми данными: токенизация, создание эмбеддингов, байт-парное кодирование и методы семплирования данных.

Особое внимание уделяется реализации ключевых компонентов LLM, включая механизмы самовнимания с обучаемыми весами и архитектуру GPT. Читатель научится создавать, предобучать и тонко настраивать модели, используя PyTorch, что делает книгу ценным ресурсом для разработчиков и исследователей, желающих глубоко понять внутреннее устройство языковых моделей.

Похожие книги

Introduction to Python and Large Language Models: A Guide to Language Models

Dilyan Grigorov

Large Language Models Projects: Apply and Implement Strategies for Large Language Models

Pere Martra

Building Generative AI Applications with Opensource Libraries: Practical guide to implementing large language models

Srikannan Balakrishnan

Building Applications with Large Language Models: Techniques, Implementation, and Applications

Bhawna Singh

Hands-On Large Language Models: Language Understanding and Generation

Jay Alammar, Maarten Grootendorst

Building LLMs with PyTorch: A step-by-step guide to building advanced AI models with PyTorch

Anand Trivedi

Computer Science From Scratch: Building Interpreters, Art, Emulators, and ML in Python

David Kopec

Generative AI with LangChain: Build large language model (LLM) apps with Python, ChatGPT, and other LLMs

Ben Auffarth

Intermediate Python and Large Language Models

Dilyan Grigorov

Applied Natural Language Processing with PyTorch 2.0: Master Advanced NLP Techniques, Transform Text Data into Insights, and Build Scalable AI Models with PyTorch 2.0

Dr. Deepti Chopra