Основы науки о данных на Python
Книга «Основы науки о данных на Python» представляет собой введение в фундаментальные концепции и методы работы с данными. Она охватывает ключевые темы, включая манипуляцию и визуализацию данных, теорию вероятностей, статистику и методы снижения размерности. Издание ориентировано на инженеров и учёных, но будет понятно всем, кто знаком с основами математического анализа и программирования.
Автор использует вычислительный подход, обучая читателей применять Python и специализированные библиотеки для визуализации, преобразования и моделирования данных, а также для проведения статистических тестов на реальных наборах данных. Вместо сложных формул книга делает акцент на методах передискретизации (resampling) — простом и универсальном подходе к статистическому тестированию с помощью симуляций, основанных на выборках из анализируемых данных.
Статистические методы демонстрируются на разнообразных современных примерах: от влияния социально-экономических факторов на распространение вируса COVID-19 до анализа воздействия законодательства о firearms на смертность. Книга подходит как учебник для курсов по науке о данных или инженерной статистике, а также как практическое руководство для специалистов, желающих освоить основы этой области.









