Learning Pandas 2.0: A Comprehensive Guide to Data Manipulation and Analysis for Data Scientists and Machine Learning Professionals

Matthew Rosch

«Learning Pandas 2.0» — это современное и исчерпывающее руководство по библиотеке Pandas, ключевому инструменту для манипуляции и анализа данных в Python. Книга специально обновлена для версии Pandas 2.0, представляя новейшие функции и лучшие практики для эффективной работы с данными. Она идеально подходит для специалистов по Data Science и Machine Learning, стремящихся углубить свои навыки обработки данных.

Книга начинается с основ: установки, настройки и знакомства с основными структурами данных Pandas — Series и DataFrame. Автор подробно рассматривает загрузку данных из различных источников, включая CSV, Excel, JSON, базы данных (SQLite) и веб-API, а также методы веб-скрапинга с помощью Beautiful Soup. Особое внимание уделяется критически важным этапам подготовки данных: обработке пропущенных значений, трансформации, очистке и нормализации.

Центральные разделы книги посвящены продвинутым техникам индексации, выборки и манипуляции данными. Читатель освоит работу с .loc, .iloc, .at, булевой индексацией, многоуровневыми индексами, а также методы слияния (merge), объединения (join, concat) и преобразования (pivot, melt) DataFrame. Отдельная глава раскрывает мощные возможности группировки и агрегации данных, а также применение функций apply, map и applymap.

Завершающая часть книги знакомит с работой с временными рядами (Time Series), операциями с датой и временем, что является важным навыком для анализа временных данных. Практический, пошаговый подход с многочисленными примерами кода делает эту книгу отличным ресурсом для перехода от теории к практике в реальных проектах по анализу данных.

Похожие книги

Pandas Cookbook. Third Edition. Practical recipes for scientific computing, time series, and exploratory data analysis using Python

William Ayd, Matthew Harrison

Python Data Cleaning Cookbook. Second Edition. Prepare your data for analysis with pandas, NumPy, Matplotlib, scikit-learn, and OpenAI

Michael Walker

Essentials of Python for Artificial Intelligence and Machine Learning

Pramod Gupta, Anupam Bagchi

Pandas for Everyone: Python Data Analysis. Second Edition

Daniel Y. Chen

Learn Data Science Using Python: A Quick-Start Guide

Engy Fouda

Pandas Workout: 200 Exercises to Make You a Stronger Data Analyst

Reuven M. Lerner

Python Data Science Handbook: Essential Tools for Working with Data

Jake VanderPlas

Data Science and Analytics with Python. Second Edition

Jesús Rogel-Salazar

Machine Learning with Python for Beginners: A Step-by-Step Guide with Hands-On Projects

Jamie Chan

Learn TensorFlow 2.0: Implement Machine Learning and Deep Learning Models with Python

Pramod Singh, Avinash Manure