Data Engineering with Python: Work with massive datasets to design data models and automate data pipelines using Python

Книга «Data Engineering with Python» представляет собой практическое руководство по проектированию и построению систем обработки данных с использованием Python. Автор, Пол Крикард, фокусируется на работе с большими наборами данных, проектировании эффективных моделей данных и создании автоматизированных конвейеров данных (data pipelines).

Издание охватывает ключевые аспекты инженерии данных: от извлечения и преобразования данных (ETL) до их загрузки в хранилища и последующего анализа. Особое внимание уделяется использованию популярных библиотек и фреймворков Python для решения реальных задач, связанных с обработкой больших объёмов информации.

Книга подходит как для начинающих специалистов, желающих освоить основы data engineering, так и для опытных разработчиков, стремящихся систематизировать знания и изучить передовые практики. Материал изложен с акцентом на практическое применение, содержит примеры кода и рекомендации по построению масштабируемых и надёжных систем.

Автор делится опытом построения end-to-end решений, рассматривая весь жизненный цикл данных — от сырых источников до готовых к анализу структур. Это делает книгу ценным ресурсом для всех, кто работает в области data science, аналитики данных или разработки backend-систем, связанных с обработкой информации.

Data Engineering with Python: Work with massive datasets to design data models and automate data pipelines using Python
A
Автор
Paul Crickard
Издательство
Packt Publishing
Год
2020
Язык
Английский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент