大数据及人工智能产教融合系列丛书
Python网络爬虫从入门到实践
Pythhonh
副主编及及智能
产及及教融合及及
参 编及及系列据及及丛书 及及副主编及及参内 及
概念、本本基本本础本本和抓包本本请求库本
Publishing House of Electronics Industry
北京·BEIJING
内 容 简 介
本书讲解了如何使用 Python编写网络爬虫 ,涵盖爬虫 的概念、Web基础、Chrome、Charles和Packet
Capture抓包、urllib、Requests请求库、lxml、Beautiful Soup、正则表达式解析数据 、CSV、Excel、
MySQL、Redis、MongoDB保存数据 、反爬虫策略应对 、爬虫框架 Scrapy的使用与部署,以及应用
案例。
本书结构清晰 、内容精练,代码示例典型实用 ,附带实践过程 中遇到问题的解决方案 ,非常适合 Python
初学者和进阶读者阅读 。
未经许可,不得以任何方式复制或抄袭本书之部分或全部内容 。
版权所有,侵权必究 。
图书在版编目 (CIP)数据
Python网络爬虫从入门到实践 / 庄培杰编著 . —北京:电子工业出版社 ,2019.8
(大数据及人工智能产教融合系列丛书 )
ISBN 978-7-121-37105-9
Ⅰ. ①P… Ⅱ. ①庄… Ⅲ. ①软件工具 -程序设计 Ⅳ. ①TP311.561
中国版本图书馆 CIP数据核字(2019)第144186号
责任编辑:李 冰 特约编辑:王 纲
印 刷:
装 订:
出版发行:电子工业出版社
北京市海淀区万寿路 173信箱 邮编 100036
开 本:787×1 092 1/16 印张:19.5 字数:499千字
版 次:2019年8月第1版
印 次:2019年8月第1次印刷
定 价:79.00元
凡所购买电子工业出版社图书有缺损问题 ,请向购买书店调换 。若书店售缺 ,请与本社发行部联系 ,
联系及邮购电话 :(010)88254888,88258888。
质量投诉请发邮件至 zlts@phei.com.cn,盗版侵权举报请发邮件至 dbqq@phei.com.cn。
本书咨询联系方式 :libing@phei.com.cn。
前 言
笔者是一名 And roid开发工程师,在接触 Python之前,每天的工作流程基本上都是接
到新版本的需求→写新页面→修改接口和业务逻辑,非常乏味。
持续性的重复劳动,让笔者意识到一个问题:如果只会 Android开发,能做的事情非
常有限!例如,自己写一个 App,如果没有可供调用的 API,那么只能得到一个单机的 App。
因为自己对后台相关的技术一窍不通,平时根本不用去了解这方面的知识,只要给后台发
出请求,然后解析数据,显示到页面上就好。
笔者开始琢磨花点时间去学习后台开发的知识,候选方案有 Java、Kotlin
《Python网络爬虫从入门到实践》.pdf