Книги / AI и ML / LLM / Domain-Specific Small Language Models: Efficient AI for local deployment

Domain-Specific Small Language Models: Efficient AI for local deployment

Guglielmo Iozzia

Эта книга посвящена созданию и развертыванию эффективных небольших языковых моделей (SLM), специализированных для конкретных предметных областей. Автор Guglielmo Iozzia предлагает практическое руководство по всему жизненному циклу таких моделей — от подготовки данных и тонкой настройки (fine-tuning) до оптимизации, профилирования и локального развертывания.

В первой части книги рассматриваются основы архитектуры трансформеров и преимущества небольших моделей перед гигантскими LLM. Вторая часть погружает в технические детали: тонкая настройка BERT и GPT, работа с ONNX, квантизация для production-среды. Третья часть демонстрирует реальные кейсы — генерацию Python-кода и предсказание структур белков.

Заключительные главы охватывают продвинутые техники квантизации, профилирование производительности, развертывание на серверах и ноутбуках, а также создание полноценных LLM-приложений с RAG и агентными компонентами. Книга ориентирована на практикующих ML-инженеров и разработчиков, стремящихся внедрять ИИ в условиях ограниченных вычислительных ресурсов.