Парсинг с помощью Python. Веб-скрапинг в действии. 3-е межд. изд.
Эта книга представляет собой обновлённое третье издание исчерпывающего руководства по веб-скрапингу на Python. Автор, Райан Митчелл, рассматривает веб-скрапинг как мощный инструмент для сбора данных из современного интернета, сравнивая его с настоящим колдовством в мире программирования. Книга разделена на две основные части, каждая из которых посвящена ключевым аспектам автоматизированного сбора информации.
В первой части основное внимание уделяется механике веб-скрапинга: отправке запросов к веб-серверам с помощью Python, обработке ответов и автоматизации взаимодействия с сайтами. Читатели научатся создавать свои первые веб-скраперы, углублённо парсить HTML, разрабатывать веб-краулеры и изучать различные модели краулинга. Отдельная глава посвящена мощному фреймворку Scrapy, а также вопросам хранения собранных данных.
Вторая часть книги погружает в более сложные и специализированные темы веб-скрапинга. Здесь рассматриваются чтение различных форматов документов, обработка «грязных» данных, работа с естественными языками, авторизация на сайтах, скрапинг JavaScript-приложений и использование API. Каждая глава содержит практические примеры и рекомендации, которые помогут решать реальные задачи по сбору данных в современных условиях.









