Книги / DevOps и Инфраструктура / AWS / Data Wrangling on AWS: Clean and organize complex data for analysis

Data Wrangling on AWS: Clean and organize complex data for analysis

Navnit Shukla, Sankar M, Sam Palani

Книга «Data Wrangling on AWS» представляет собой практическое руководство по очистке, организации и подготовке сложных данных для анализа в облачной среде Amazon Web Services. Авторы, являющиеся опытными специалистами AWS в области аналитики и архитектуры данных, делятся экспертизой по построению эффективных конвейеров обработки данных.

Издание охватывает полный цикл работы с данными: от извлечения и загрузки из различных источников до трансформации, очистки от аномалий и подготовки для машинного обучения и бизнес-аналитики. Особое внимание уделяется использованию сервисов AWS, таких как AWS Glue, Amazon Athena, AWS Lambda и Amazon S3, для создания масштабируемых и отказоустойчивых решений.

Книга содержит реальные кейсы и лучшие практики, которые помогут инженерам данных, аналитикам и архитекторам оптимизировать процессы обработки данных, снизить операционные затраты и повысить качество аналитических выводов. Материал подходит как для начинающих, так и для опытных специалистов, работающих с облачными платформами.