P
ython数 据抓取技术与实战
潘
庆和
摇赵
星驰
摇编
著
内容简介
数据抓取是获取大数据的一种主要手段。本书主要介绍使用Python语言及其相关工具进行数据抓取的
方法,通过实例演示在数据抓取过程中常见问题的解决方法。通过本书的学习,读者可以根据需求快速地
编写出符合要求的抓取程序。
本书技术性强,注重应用和实战,可供从事数据获取的工程技术人员、理工科院校相关专业的本科生
及大数据从业人员使用。
未经许可,不得以任何方式复制或抄袭本书之部分或全部内容。
版权所有,侵权必究。
图书在版编目(CIP)数据
Python数据抓取技术与实战/潘庆和,赵星驰编著郾—北京:电子工业出版社,2016郾8
ISBN978-7-121-29884-4
玉郾淤P…摇域郾淤潘…摇于赵…摇芋郾淤软件工具-程序设计摇郁郾淤TP311郾561
中国版本图书馆CIP数据核字(2016)第217952号
责任编辑:富摇军摇摇特约编辑:刘汉斌
印摇摇刷:
装摇摇订:
出版发行:电子工业出版社
北京市海淀区万寿路173信箱摇邮编100036
开摇摇本:787伊1092摇1/16摇印张:16摇字数:410千字
版摇摇次:2016年8月第1版
印摇摇次:2016年8月第1次印刷
印摇摇数:3000册摇摇定价:49郾00元
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系,
联系及邮购电话:(010)88254888,88258888。
质量投诉请发邮件至zlts@phei郾com郾cn,盗版侵权举报请发邮件至dbqq@phei郾com郾cn。
本书咨询联系方式:(010)88254456。
前摇摇言
大数据技术是当前工程和科学技术领域研究的热点。数据科学研究通常包括四个主要
环节,即数据获取、数据存储、数据分析及数据可视化。本书主要聚焦数据获取环节。这
是其他环节的基础。及时准确地获得丰富详实的数据,可为后续工作奠定坚实的基础,并
提高分析结论的可信性和可靠性。
互联网的开放性为数据的获取带来了极大的便利。本书基于Python语言的数据抓取技
术,主要介绍如何快速准确地从网络上获得所需的数据,构建满足要求的数据集或大数据
集。Python语言是一种通用编程语言,可以应用于各种编程领域,在数据科学领域也是一
种十分热门的语言。本书使用Python作为数据抓取技术的实现语言,利用Python丰富的模
块支持和语言特性,解决绝大部分数据抓取中经常会遇到的问题。为了使不了解Python语
言的读者快速上手,在第1章中介绍了阅读本书所需的Python语言基础知识。
本书介绍了数据抓取涉及的各类技术问题和解决方法,并按章节进行组织,每章内容
基本独立,可使读者在遇到问题时
《Python数据抓取技术与实战》.pdf