Understanding Large Language Models: Learning Their Underlying Concepts and Technologies

Thimira Amaratunga

Эта книга представляет собой глубокое погружение в мир больших языковых моделей (LLM). Автор последовательно раскрывает фундаментальные концепции, лежащие в основе современных языковых моделей, таких как GPT и BERT. Книга начинается с исторического экскурса в развитие искусственного интеллекта и обработки естественного языка, что позволяет понять эволюционный путь, приведший к созданию LLM.

Основное внимание уделяется архитектурным решениям, включая механизмы внимания и трансформеры, которые стали ключевыми для успеха современных моделей. Автор подробно объясняет процессы обучения, тонкой настройки и оценки производительности языковых моделей, делая сложные технические детали доступными для понимания.

Книга также затрагивает практические аспекты работы с LLM, включая их применение в различных задачах, таких как генерация текста, перевод, анализ тональности и вопросно-ответные системы. Рассматриваются этические вопросы, ограничения и будущие направления развития технологии больших языковых моделей.

Похожие книги

Introduction to Python and Large Language Models: A Guide to Language Models

Dilyan Grigorov

Building Applications with Large Language Models: Techniques, Implementation, and Applications

Bhawna Singh

Hands-On Large Language Models: Language Understanding and Generation

Jay Alammar, Maarten Grootendorst

Large Language Models Projects: Apply and Implement Strategies for Large Language Models

Pere Martra

Intermediate Python and Large Language Models

Dilyan Grigorov

The Hundred-Page Language Models Book

Andriy Burkov

LLM Engineer’s Handbook: Master the art of engineering large language models from concept to production

Paul Iusztin, Maxime Labonne

Mastering Large Language Models with Python: Unleash the Power of Advanced Natural Language Processing for Enterprise Innovation and Efficiency Using Large Language Models (LLMs) with Python

Raj Arun R

Scaling Enterprise Solutions with Large Language Models: Comprehensive End-to-End Generative AI Solutions for Production-Grade Enterprise Solutions

Arindam Ganguly

Generative AI on Kubernetes: Operationalizing Large Language Models

Roland Huß, Daniele Zonca