Learning Pandas 2.0: A Comprehensive Guide to Data Manipulation and Analysis for Data Scientists and Machine Learning Professionals
«Learning Pandas 2.0» — это современное и исчерпывающее руководство по библиотеке Pandas, ключевому инструменту для манипуляции и анализа данных в Python. Книга специально обновлена для версии Pandas 2.0, представляя новейшие функции и лучшие практики для эффективной работы с данными. Она идеально подходит для специалистов по Data Science и Machine Learning, стремящихся углубить свои навыки обработки данных.
Книга начинается с основ: установки, настройки и знакомства с основными структурами данных Pandas — Series и DataFrame. Автор подробно рассматривает загрузку данных из различных источников, включая CSV, Excel, JSON, базы данных (SQLite) и веб-API, а также методы веб-скрапинга с помощью Beautiful Soup. Особое внимание уделяется критически важным этапам подготовки данных: обработке пропущенных значений, трансформации, очистке и нормализации.
Центральные разделы книги посвящены продвинутым техникам индексации, выборки и манипуляции данными. Читатель освоит работу с .loc, .iloc, .at, булевой индексацией, многоуровневыми индексами, а также методы слияния (merge), объединения (join, concat) и преобразования (pivot, melt) DataFrame. Отдельная глава раскрывает мощные возможности группировки и агрегации данных, а также применение функций apply, map и applymap.
Завершающая часть книги знакомит с работой с временными рядами (Time Series), операциями с датой и временем, что является важным навыком для анализа временных данных. Практический, пошаговый подход с многочисленными примерами кода делает эту книгу отличным ресурсом для перехода от теории к практике в реальных проектах по анализу данных.









