Understanding Large Language Models: Learning Their Underlying Concepts and Technologies

Эта книга представляет собой глубокое погружение в мир больших языковых моделей (LLM). Автор последовательно раскрывает фундаментальные концепции, лежащие в основе современных языковых моделей, таких как GPT и BERT. Книга начинается с исторического экскурса в развитие искусственного интеллекта и обработки естественного языка, что позволяет понять эволюционный путь, приведший к созданию LLM.

Основное внимание уделяется архитектурным решениям, включая механизмы внимания и трансформеры, которые стали ключевыми для успеха современных моделей. Автор подробно объясняет процессы обучения, тонкой настройки и оценки производительности языковых моделей, делая сложные технические детали доступными для понимания.

Книга также затрагивает практические аспекты работы с LLM, включая их применение в различных задачах, таких как генерация текста, перевод, анализ тональности и вопросно-ответные системы. Рассматриваются этические вопросы, ограничения и будущие направления развития технологии больших языковых моделей.

Understanding Large Language Models: Learning Their Underlying Concepts and Technologies
A
Автор
Thimira Amaratunga
Издательство
Apress
Год
2023
Язык
Английский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент