Потоковая обработка данных с Apache Flink. Основы разработки потоковых приложений

Эта книга представляет собой фундаментальное руководство по Apache Flink — мощному фреймворку с открытым исходным кодом для распределённой потоковой обработки данных. Авторы, являющиеся ключевыми контрибьюторами проекта с первых дней его существования, предлагают глубокое погружение в архитектуру и принципы работы системы.

Вы изучите основные концепции параллельной потоковой обработки, поймёте её отличия от традиционной пакетной обработки и освоите идеологию API DataStream. Книга подробно рассматривает такие важные аспекты, как обработка с учётом состояния, механизмы отказоустойчивости, временные семантики (режим обработки по времени событий) и гарантии согласованности «ровно один раз» при взаимодействии с внешними системами.

Практическая часть охватывает полный цикл разработки: от создания масштабируемых потоковых приложений до их развёртывания, настройки кластеров и операционного обслуживания в production-средах. Особое внимание уделяется решению реальных задач, таких как аналитика в реальном времени, обнаружение мошенничества, обработка данных IoT и построение дашбордов с малой задержкой.

Потоковая обработка данных с Apache Flink. Основы разработки потоковых приложений
A
Автор
Фабиан Уэске, Василики Калаври
Издательство
ДМК Пресс
Год
2021
Язык
Русский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент