Data Wrangling Using Pandas, SQL, and Java
Эта книга посвящена ключевой задаче в области Data Science — обработке и подготовке данных (Data Wrangling). Автор рассматривает практические методы очистки, трансформации и анализа данных с использованием трёх мощных инструментов: библиотеки Pandas для Python, языка SQL для работы с базами данных и языка Java для более сложных или высокопроизводительных задач.
Читатели научатся эффективно манипулировать данными, устранять пропуски и аномалии, агрегировать информацию и подготавливать её для дальнейшего анализа или машинного обучения. Книга построена на практических примерах и охватывает как базовые, так и продвинутые техники работы с данными.
Особое внимание уделяется интеграции разных технологий: вы узнаете, как использовать Pandas для быстрого исследования данных, SQL для работы с реляционными базами и Java для создания масштабируемых решений. Издание подходит для аналитиков данных, инженеров данных и разработчиков, которые хотят систематизировать свои знания в области обработки данных.