LLMOps: Managing Large Language Models in Production
Книга посвящена операционным аспектам развертывания и эксплуатации больших языковых моделей (LLM) в промышленных средах. Автор, Аби Арян, имеющая почти десятилетний опыт создания ML-систем продакшен-уровня, объясняет, почему традиционные подходы MLOps не работают с генеративным ИИ, и предлагает новую дисциплину LLMOps.
В книге рассматриваются ключевые вызовы: галлюцинации моделей, проблемы безопасности, мониторинг производительности, управление агентами и RAG-системами. Читатели узнают, как настраивать оценки, управление и аудиты безопасности, специфичные для GenAI, а также масштабировать инфраструктуру без перерасхода бюджета на вычисления.
Практическое руководство охватывает новые роли и процессы, необходимые для LLM-операций, и предлагает действенные решения для трансформации прототипов LLM в надежные, готовые к продакшену AI-системы. Книга предназначена для ML-инженеров, платформенных команд и всех, кто занимается внедрением LLM в реальные проекты.
