文库 T_工业技术

[图灵程序设计丛书].干净的数据:数据清洗入门与实践.pdf

人民邮电出版社 PDF   209页   下载0   2025-02-19   浏览6   收藏0   点赞0   评分-   207761字   10积分
温馨提示:当前文档最多只能预览 10 页,若文档总页数超出了 10 页,请下载原文档以浏览全部内容。
[图灵程序设计丛书].干净的数据:数据清洗入门与实践.pdf 第1页
[图灵程序设计丛书].干净的数据:数据清洗入门与实践.pdf 第2页
[图灵程序设计丛书].干净的数据:数据清洗入门与实践.pdf 第3页
[图灵程序设计丛书].干净的数据:数据清洗入门与实践.pdf 第4页
[图灵程序设计丛书].干净的数据:数据清洗入门与实践.pdf 第5页
[图灵程序设计丛书].干净的数据:数据清洗入门与实践.pdf 第6页
[图灵程序设计丛书].干净的数据:数据清洗入门与实践.pdf 第7页
[图灵程序设计丛书].干净的数据:数据清洗入门与实践.pdf 第8页
[图灵程序设计丛书].干净的数据:数据清洗入门与实践.pdf 第9页
[图灵程序设计丛书].干净的数据:数据清洗入门与实践.pdf 第10页
剩余199页未读, 下载浏览全部
m2 u¥È0€Àµ￾¨µ Z ¼ ] V[ ©i!!¨1 -Ë¥Í « „1%' É›  b Œ ]™¥È0€Ç ]ñ ¦P¨ ÃÜq ƒ‚¤É›.lb áÌûiM￾€ µƒ"¥© „ $ÐáÌ ] ¹©MÁ ƒb ÂT™€µ S ƒ›¹áÌ V ? ¾¨¼L@ “Œ‚K¿1>¾ k|©» ƒn@i V ?îEp 3 ©b ÄÇf M 内 容 提 要 本书主要内容包括 :数据清洗在数据科学领域中的重要作用 ,文件格式 、数据类型、字符编码的基本概念 , 组织和处理数据的电子表格与文本编辑器 ,各种格式数据的转换方法 ,解析和清洗网页上的 HTML文件的 三种策略 ,提取和清洗 PDF文件中数据的方法 ,检测和清除 RDBMS中的坏数据的解决方案 ,以及使用书 中介绍的方法清洗来自 Twitter和Stack Overflow 的数据。 本书适合任何水平的数据科学家以及对数据清理感兴趣的读者阅读 。 定价:49.00元 读者服务热线: (010)51095186转 600 印装质量热线: (010)81055316 反盗版热线: (010)81055315 广告经营许可证:京东工商广字第 8052 号 著    [美] Megan Squire 译    任政委 责任编辑 岳新欣 执行编辑 李 敏 责任印制 彭志环 人民邮电出版社出版发行   北京市丰台区成寿寺路11号 邮编 100164  电子邮件 315@ptpress.com.cn 网址 http://www.ptpress.com.cn 北京    印刷 开本:800×1000 1/16 印张:12.5 字数:296千字 2016年 5 月第 1 版 印数:1 — 3 000册 2016年 5 月北京第 1 次印刷 著作权合同登记号 图字:01-2015-7995号 ◆ ◆ ◆ 250 前 言 版权声明 Copyright © 2015 Packt Publishing. First published in the English language under the title Clean Data. Simplified Chinese-language edition copyright © 2016 by Posts & Telecom Press. All rights reserved. 本书中文简体字版由Packt Publishing 授权人民邮电出版社独家出版。未经出版者书面许可, 不得以任何方式复制或抄袭本书内容。 版权所有,侵权必究。 iv 前 言 前 言 q È98} e• “ "´<Ðb ôlÂ)o v/ ¾îŸtþþ òÓ#›&r ——克?·8} e1864 qÐ)Ð{dr ——%??e1963 qBT˜\ $J ôl‚dr —— ¤pe L F3wíxv Ì ÃÐ Þ†8d ™ê4 Ã2015 世界上第一台计算机的发明者查尔斯·巴贝奇,在他 1864年的随笔文集中记录了这样一件 事,他
[图灵程序设计丛书].干净的数据:数据清洗入门与实践.pdf