Web Scraping with Python: Collecting Data from the Modern Web

Ryan Mitchell

Эта книга представляет собой практическое руководство по веб-скрапингу с использованием Python. Автор Райан Митчелл подробно объясняет, как автоматизировать сбор данных из интернета, преодолевая современные вызовы, такие как JavaScript, мультимедиа и cookies. Книга развеивает распространённые мифы о законности веб-скрапинга и чётко разграничивает использование API и скраперов.

В первой части рассматриваются основы веб-скрапинга и краулинга: отправка HTTP-запросов, парсинг HTML, работа с формами и сессиями. Автор демонстрирует, как писать ботов, которые собирают данные и сохраняют их в базах данных или выводят в терминал. Особое внимание уделяется библиотекам Python, таким как Beautiful Soup и Requests, для эффективного извлечения информации.

Вторая часть книги посвящена продвинутым темам: обработка JavaScript-сайтов, обход капч, масштабирование скраперов и этические аспекты сбора данных. Митчелл также затрагивает вопросы анализа данных и информационной безопасности, связанные с веб-скрапингом. Книга подходит как для начинающих, так и для опытных программистов, желающих автоматизировать работу с веб-контентом.

Похожие книги

Web Data Mining with Python: Discover and extract information from the web using Python

Dr. Ranjana Rajnish, Dr. Meenakshi Srivastava

Современный скрапинг веб-сайтов с помощью Python. 2-е межд. издание

Райан Митчелл

Python Web Scraping Cookbook: Over 90 proven recipes to get you scraping with Python, microservices, Docker, and AWS

Michael Heydt

Introducing Python: Modern Computing in Simple Packages

Bill Lubanovic

Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Brian Lipp

Mastering.Data.Analysis.with.Python

Mastering Python Automation: A Comprehensive Guide to Automate Everything

Ahmed Khorshid

Advanced Forecasting with Python: Mastering Modern Forecasting Techniques with Machine Learning and Cloud Tools, Second Edition

Joos Korstanje

PYTHON – Master Python OOP Programming with One Guide Only! A lot of Coding, Practice, and Theory. Learn Python with Hands-On Projects

Rick Sekulsoki

Real-World Python: A Hacker's Guide to Solving Problems with Code

Lee Vaughan