Книги / AI и ML / Data Science / Web Scraping with Python: Collecting More Data from the Modern Web

Web Scraping with Python: Collecting More Data from the Modern Web

Ryan Mitchell

Эта книга представляет собой практическое руководство по веб-скрапингу (парсингу) с использованием языка Python. Второе издание охватывает как основы сбора данных из интернета, так и продвинутые техники, включая работу с BeautifulSoup, Scrapy, обработку документов (PDF, CSV, Word), очистку данных и анализ естественного языка.

Книга разделена на две части: первая посвящена созданию базовых скраперов и краулеров, вторая — более сложным задачам, таким как чтение документов, работа с базами данных, обработка изображений и обход капч. Автор уделяет внимание не только техническим аспектам, но и юридическим и этическим вопросам веб-скрапинга.

Издание рассчитано на разработчиков, знакомых с основами Python, которые хотят научиться извлекать данные с веб-сайтов для анализа, исследований или создания собственных сервисов. Книга содержит множество примеров кода и практических заданий.