Язык R в задачах науки о данных: Импорт, подготовка, обработка, визуализация и моделирование данных

Эта книга представляет собой практическое руководство по использованию языка R для решения задач науки о данных. Авторы, Хэдли Уикхем и Гарретт Гролемунд, являются ведущими специалистами в области R и создателями ключевых пакетов tidyverse, которые стали стандартом для анализа данных.

Книга охватывает весь процесс работы с данными: от импорта и очистки до визуализации и построения моделей. Основное внимание уделяется практическим навыкам, необходимым для превращения сырых данных в содержательные выводы. Читатели научатся использовать ggplot2 для создания сложных визуализаций, dplyr для манипуляций с данными и tidyr для приведения данных в аккуратный формат.

Структура книги следует логике реального проекта анализа данных. Первая часть посвящена предварительному анализу и визуализации. Вторая часть подробно рассматривает подготовку данных — самый важный и трудоёмкий этап. Третья часть углубляется в программирование на R, а четвёртая — в моделирование данных. Завершает книгу раздел о коммуникации результатов с помощью R Markdown.

Издание ориентировано на практиков: аналитиков данных, исследователей и разработчиков, которые хотят эффективно использовать R в своей работе. Книга подходит как для начинающих, так и для опытных пользователей R, желающих освоить современные инструменты tidyverse.

Язык R в задачах науки о данных: Импорт, подготовка, обработка, визуализация и моделирование данных
A
Автор
Хэдли Уикхем, Гарретт Гролемунд
Издательство
Диалектика
Год
2018
Язык
Русский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент