Web Scraping with Python: Collecting More Data from the Modern Web
Эта книга представляет собой практическое руководство по веб-скрапингу (парсингу) с использованием языка Python. Второе издание охватывает как основы сбора данных из интернета, так и продвинутые техники, включая работу с BeautifulSoup, Scrapy, обработку документов (PDF, CSV, Word), очистку данных и анализ естественного языка.
Книга разделена на две части: первая посвящена созданию базовых скраперов и краулеров, вторая — более сложным задачам, таким как чтение документов, работа с базами данных, обработка изображений и обход капч. Автор уделяет внимание не только техническим аспектам, но и юридическим и этическим вопросам веб-скрапинга.
Издание рассчитано на разработчиков, знакомых с основами Python, которые хотят научиться извлекать данные с веб-сайтов для анализа, исследований или создания собственных сервисов. Книга содержит множество примеров кода и практических заданий.










