Building Generative AI Services with FastAPI: A Practical Approach to Developing Context-Rich Generative AI Applications
Практическое руководство по созданию промышленных генеративных AI-сервисов с использованием фреймворка FastAPI. Книга охватывает полный цикл разработки — от проектирования до развертывания в облаке.
Вы научитесь интегрировать модели, обрабатывающие текст, изображения, аудио и видео, а также настраивать взаимодействие с базами данных, файловыми системами, веб-сайтами и API. Особое внимание уделяется построению контекстно-обогащенных приложений с использованием RAG (Retrieval-Augmented Generation) и векторных баз данных.
Автор подробно рассматривает ключевые аспекты production-разработки: аутентификацию, управление параллелизмом, кэширование, потоковую передачу данных через WebSockets и Server-Sent Events. Также приводятся лучшие практики тестирования AI-выводов, оптимизации производительности и обеспечения безопасности микросервисов.
Заключительные главы посвящены контейнеризации приложений с помощью Docker и их развертыванию в облачной среде. Книга подойдет веб-разработчикам, дата-сайентистам и DevOps-инженерам, желающим создавать масштабируемые AI-приложения реального времени.









