Introducing .NET for Apache Spark: Distributed Processing for Massive Datasets

Ed Elliott

Книга Introducing .NET for Apache Spark знакомит разработчиков .NET с возможностями Apache Spark — мощного фреймворка для распределенной обработки больших данных. Автор Эд Эллиотт показывает, как использовать знакомые инструменты .NET для создания масштабируемых приложений обработки данных.

Первая часть книги посвящена основам Apache Spark: его архитектуре, основным сценариям использования (трансформация данных, анализ, машинное обучение) и настройке окружения. Особое внимание уделяется паритету функциональности между .NET и нативным API Spark.

Практические примеры охватывают типичные задачи обработки больших данных: загрузку и преобразование датасетов, выполнение аналитических запросов, применение алгоритмов машинного обучения. Книга содержит готовые фрагменты кода на C# и рекомендации по оптимизации производительности.

Издание предназначено для .NET-разработчиков, желающих освоить распределенные вычисления, а также для специалистов по данным, которые хотят интегрировать Spark в существующую .NET-инфраструктуру. Материал подкреплен ссылками на GitHub-репозиторий с примерами.

Похожие книги

Hands-on Guide to Apache Spark 3: Build Scalable Computing Engines for Batch and Stream Data Processing

Alfonso Antolínez García

Обработка больших данных с Apache Spark

Н. А. Бутаков, М. В. Петров, Д. Насонов

Parallel Programming with C# and .NET: Fundamentals of Concurrency and Asynchrony Behind Fast-Paced Applications

Vaskaran Sarcar

Getting Started with .NET Aspire: Build Cloud-Native and Distributed Applications with Ease

Dave Rael

Working with Unix Processes

Jesse Storimer

Spark в действии. С примерами на Java, Python и Scala

Жан-Жорж Перрен

Applied Data Science Using PySpark: Learn the End-to-End Predictive Model-Building Cycle, Second Edition

Ramcharan Kakarla, Sundar Krishnan, Balaji Dhamodharan, Venkata Gunnu

Большие данные на Kubernetes: Практическое руководство по созданию эффективных и масштабируемых решений для данных

Нейлсон Крепальде

Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Brian Lipp

Grokking Algorithms

Автор не указан в предоставленном фрагменте