Книги / AI и ML / LLM / Hands-On RAG for Production: Design, Develop, and Deploy Production-Ready RAG Applications

Hands-On RAG for Production: Design, Develop, and Deploy Production-Ready RAG Applications

Ofer Mendelevitch, Forrest Sheng Bao

Эта книга представляет собой исчерпывающее руководство по созданию, разработке и развертыванию production-ready RAG (Retrieval-Augmented Generation) приложений. Авторы, Офер Менделевич и Форрест Шэн Бао, подробно рассматривают все этапы жизненного цикла RAG-системы: от парсинга документов и индексации до построения пайплайнов извлечения и генерации, а также их оценки и мониторинга в production.

Особое внимание уделяется практическим аспектам, которые часто упускаются из виду в демо-проектах: правильная обработка таблиц, чанкинг документов, выбор векторных хранилищ, интеграция с графами знаний (GraphRAG) и создание агентных расширений. Книга содержит множество примеров кода и паттернов, которые помогут инженерам преодолеть разрыв между прототипом и надежной production-системой.

Отдельные главы посвящены вопросам точности, задержки и масштабирования, а также фреймворку "build versus buy" для архитекторов. Это обязательное чтение для ML-инженеров, платформенных инженеров и технических лидеров, которые хотят вывести свои LLM-приложения на новый уровень надежности и производительности.