Книги / DevOps и Инфраструктура / AWS / AI Systems Performance Engineering

AI Systems Performance Engineering

Chris Fregly

Книга AI Systems Performance Engineering представляет собой исчерпывающее руководство по оптимизации производительности систем искусственного интеллекта. Автор, Крис Фрегли, инженер и лидер продуктов с опытом работы в AWS, Databricks и Netflix, предлагает практические стратегии для повышения эффективности на всех уровнях AI-инфраструктуры — от аппаратного обеспечения до алгоритмов.

В книге подробно рассматриваются методы тонкой настройки GPU-ядер CUDA, алгоритмов на базе PyTorch, а также систем многопоточного обучения и инференса. Особое внимание уделяется масштабированию GPU-кластеров для высокопроизводительных распределенных задач обучения и серверов инференса. В конце книги представлен чек-лист из более чем 175 проверенных оптимизаций.

Издание охватывает такие темы, как совместная оптимизация аппаратного и программного обеспечения, внедрение передовых стратегий инференса для снижения задержек и увеличения пропускной способности, профилирование и устранение узких мест в сложных AI-пайплайнах, а также интеграция методов полного стека для создания надежных и масштабируемых систем.

Книга получила высокие оценки от экспертов индустрии, включая Криса Латтнера (CEO Modular), Себастьяна Рашки (исследователь ML/AI) и Марка Саруфима (инженер PyTorch в Meta). Она станет незаменимым ресурсом для инженеров, исследователей и разработчиков, стремящихся максимально эффективно использовать современные AI-системы.