Apache Kafka. Потоковая обработка и анализ данных. 2-е издание
Эта книга представляет собой исчерпывающее руководство по Apache Kafka — свободной потоковой платформе для обработки данных в реальном времени. Второе издание охватывает все аспекты работы с Kafka, от базовых концепций до продвинутых тем администрирования и безопасности.
Книга начинается с введения в архитектуру Kafka, объяснения основных компонентов (производители, потребители, брокеры, топики, партиции) и преимуществ использования потоковой обработки данных. Авторы подробно рассматривают установку и настройку Kafka в различных окружениях, включая облачные платформы.
Основная часть книги посвящена практическим аспектам работы с Kafka: созданию производителей и потребителей, программированию на Java API, обеспечению надежной доставки сообщений, реализации семантики "точно один раз", построению конвейеров данных и зеркальному копированию между кластерами. Особое внимание уделяется внутреннему устройству Kafka и принципам её работы.
В заключительных главах рассматриваются вопросы безопасности (аутентификация, авторизация, шифрование), администрирования кластеров, мониторинга производительности и потоковой обработки данных с использованием Kafka Streams. Книга содержит множество практических примеров и рекомендаций от экспертов, работающих с Kafka в production-средах.









