RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью LlamaIndex, Deep Lake и Pinecon
Эта книга представляет собой практическое руководство по созданию и оптимизации систем генеративного искусственного интеллекта на основе технологии RAG (Retrieval-Augmented Generation). Автор подробно исследует архитектуру RAG-пайплайнов, объясняя, как связывать вывод моделей с исходными документами для повышения точности и контекстной релевантности результатов.
В книге рассматриваются ключевые компоненты инфраструктуры RAG: векторные хранилища данных, фрагментация документов, индексация и ранжирование. Читатели научатся работать с популярными фреймворками и инструментами, включая LlamaIndex и Deep Lake, векторные базы данных Pinecone и Chroma, а также модели от Hugging Face и OpenAI.
Особое внимание уделяется продвинутым техникам оптимизации: использованию адаптивного RAG, интеграции обратной связи от человека для уточнения поиска, тонкой настройке систем, реализации динамических RAG для поддержки принятия решений в реальном времени и визуализации сложных данных с помощью графов знаний. Книга также охватывает создание мультимодальных пайплайнов ИИ, объединяющих текстовые и визуальные данные.
Практические примеры и кейсы демонстрируют применение RAG-решений в различных областях — от производственных задач до обслуживания клиентов, помогая читателям приобрести навыки внедрения интеллектуальных систем, повышающих конкурентные преимущества проектов.









