LLMOps: Managing Large Language Models in Production

Abi Aryan

Книга посвящена операционным аспектам развертывания и эксплуатации больших языковых моделей (LLM) в промышленных средах. Автор, Аби Арян, имеющая почти десятилетний опыт создания ML-систем продакшен-уровня, объясняет, почему традиционные подходы MLOps не работают с генеративным ИИ, и предлагает новую дисциплину LLMOps.

В книге рассматриваются ключевые вызовы: галлюцинации моделей, проблемы безопасности, мониторинг производительности, управление агентами и RAG-системами. Читатели узнают, как настраивать оценки, управление и аудиты безопасности, специфичные для GenAI, а также масштабировать инфраструктуру без перерасхода бюджета на вычисления.

Практическое руководство охватывает новые роли и процессы, необходимые для LLM-операций, и предлагает действенные решения для трансформации прототипов LLM в надежные, готовые к продакшену AI-системы. Книга предназначена для ML-инженеров, платформенных команд и всех, кто занимается внедрением LLM в реальные проекты.

Похожие книги

Generative AI on Kubernetes: Operationalizing Large Language Models

Roland Huß, Daniele Zonca

Prompt Engineering for LLMs: The Art and Science of Building Large Language Model–Based Applications

John Berryman, Albert Ziegler

Large Language Models Projects: Apply and Implement Strategies for Large Language Models

Pere Martra

Building Applications with Large Language Models: Techniques, Implementation, and Applications

Bhawna Singh

Mastering Large Language Models with Python: Unleash the Power of Advanced Natural Language Processing for Enterprise Innovation and Efficiency Using Large Language Models (LLMs) with Python

Raj Arun R

Generative AI on Microsoft Azure: From Large Language Models to Advanced Multi-Agent Systems

Adrián González Sánchez, Jaime De Mora, Jorge García Ximénez

Introduction to Python and Large Language Models: A Guide to Language Models

Dilyan Grigorov

LLM Engineer’s Handbook: Master the art of engineering large language models from concept to production

Paul Iusztin, Maxime Labonne

Learning LangChain: Building AI and LLM Applications with LangChain and LangGraph

Mayo Oshin, Nuno Campos

Understanding Large Language Models: Learning Their Underlying Concepts and Technologies

Thimira Amaratunga