Hadoop в действии

Книга «Hadoop в действии» представляет собой практическое руководство по работе с Apache Hadoop — мощным каркасом для распределенной обработки больших массивов данных. Автор, Чак Лэм, подробно объясняет, почему традиционные СУБД часто не справляются с гигантскими объемами информации, и как Hadoop решает эту проблему через парадигму MapReduce.

Читатель последовательно знакомится с архитектурой Hadoop, его основными компонентами (NameNode, DataNode, JobTracker, TaskTracker и др.) и принципами их взаимодействия. Книга содержит инструкции по настройке кластера, включая конфигурацию SSH, и запуску Hadoop в различных режимах — от локального до полноценного распределенного.

Основное внимание уделяется программированию в стиле MapReduce. После разбора простых примеров, таких как классический подсчет слов, автор переходит к более сложным задачам анализа данных. В книге описываются рекомендованные приемы и паттерны проектирования, которые помогают эффективно разрабатывать масштабируемые приложения для обработки данных.

Для комфортной работы с материалом требуется знание основ языка Java. Знакомство с математической статистикой будет полезно для понимания продвинутых примеров. Книга идеально подходит для разработчиков, аналитиков и инженеров, которые хотят освоить технологии распределенных вычислений для работы с Big Data.

Hadoop в действии
A
Автор
Чак Лэм
Издательство
ДМК Пресс
Год
2012
Язык
Русский
1
Оцените книгу

Чтобы читать книгу, войдите или зарегистрируйтесь

Ознакомительный фрагмент