Getting Started with Greenplum for Big Data Analytics
Эта книга представляет собой практическое руководство по выполнению аналитического проекта с использованием Greenplum — от концептуализации до операционализации. Автор, Sunila Gollapudi, начинает с объяснения проблем Big Data и необходимости новых подходов и навыков. Затем подробно рассматривается вычислительная сторона: работа с масштабом, сложностью данных и быстрым временем отклика. Особое внимание уделяется устранению «шума» в данных на ранних этапах жизненного цикла Data Science. Книга объясняет, как использовать платформу Greenplum для построения решений Big Data, объединяя коммерческие и открытые компоненты. Также рассматриваются возможности языка R для статистических вычислений и продвинутой аналитики. Изложение отличается практическим стилем с реальными примерами, что делает книгу полезной как для специалистов по данным, так и для тех, кто стремится освоить Data Science.