Язык R в задачах науки о данных: Импорт, подготовка, обработка, визуализация и моделирование данных
Эта книга представляет собой практическое руководство по использованию языка R для решения задач науки о данных. Авторы, Хэдли Уикхем и Гарретт Гролемунд, являются ведущими специалистами в области R и создателями ключевых пакетов tidyverse, которые стали стандартом для анализа данных.
Книга охватывает весь процесс работы с данными: от импорта и очистки до визуализации и построения моделей. Основное внимание уделяется практическим навыкам, необходимым для превращения сырых данных в содержательные выводы. Читатели научатся использовать ggplot2 для создания сложных визуализаций, dplyr для манипуляций с данными и tidyr для приведения данных в аккуратный формат.
Структура книги следует логике реального проекта анализа данных. Первая часть посвящена предварительному анализу и визуализации. Вторая часть подробно рассматривает подготовку данных — самый важный и трудоёмкий этап. Третья часть углубляется в программирование на R, а четвёртая — в моделирование данных. Завершает книгу раздел о коммуникации результатов с помощью R Markdown.
Издание ориентировано на практиков: аналитиков данных, исследователей и разработчиков, которые хотят эффективно использовать R в своей работе. Книга подходит как для начинающих, так и для опытных пользователей R, желающих освоить современные инструменты tidyverse.









