书籍详情

开本：16开
纸张：胶版纸
包装：平装-胶订
是否套装：否
国际标准书号ISBN：9787115474209

书籍详情

Scrapy是一个开源的Python爬虫框架，可以用来轻松提取从页面数据。Scrapy带有丰富的特性，可通过简单的编码或配置来访问，从而可以节省开发人员数周的开发时间，并高效地提取所需数据。Scrapy有一个高度活跃且迅速增长的社区，而且已经成为黑客、创业者和Web爬取专家的首选框架。本书讲解了Scrapy的基础知识，讨论了如何从任意源提取数据，如何清理数据，以及如何使用Python和第三方API进行处理，以满足自身需求。本书还讲解了如何将爬取的数据高效地馈入数据库、搜索引擎和流数据处理系统（比如Apache Spark）。在学习完本书后，你将对数据爬取胸有成竹，并将数据应用在自己的应用程序中。本书内容：使用HTML和Xpath提取所需的数据；使用Python编写Scrapy爬虫，并在网络上进行爬取操作；将数据推送到任意数据库、搜搜引擎或分析系统的方法；配置爬虫，使其

产品特色

作者简介

[美]迪米特里奥斯 考奇斯-劳卡斯（Dimitrios Kouzis-Loukas）

目　　录

精通Python爬虫框架Scrapy

精通Python爬虫框架Scrapypython3 scrapy教程全面剖析网络爬虫技术的实现原理通过爬取示例演示Scrapy的应用涵盖从桌面端爬取到移动端爬取实时爬取在内的所有内容

浏览此商品的顾客也同时浏览

精通Python爬虫框架Scrapy

精通Python爬虫框架Scrapypython3 scrapy教程 全面剖析网络爬虫技术的实现原理 通过爬取示例演示Scrapy的应用 涵盖从桌面端爬取到移动端爬取 实时爬取在内的所有内容

浏览此商品的顾客也同时浏览

精通Python爬虫框架Scrapypython3 scrapy教程全面剖析网络爬虫技术的实现原理通过爬取示例演示Scrapy的应用涵盖从桌面端爬取到移动端爬取实时爬取在内的所有内容