大数据搜索引擎
原理分析及编程实现
刘凡平 编著
内 容 简 介
本书向读者提供了一套完整的大数据时代背景下的搜索引擎解决方案,详尽地介绍了
搜索引擎的技术架构、算法体系及取得的效果,以模块化的方式进行组织。着重介绍了机器
学习在搜索引擎中的应用,包括中文分词、聚类、分类等核心的机器学习算法,并结合示例
加以介绍和分析,使读者可以更好地理解机器学习在搜索引擎中的价值。还阐述了大数据给
搜索引擎带来的新特性,结合目前大数据分析的主流工具,在搜索引擎中构建知识图谱,以
及进行日志反馈学习机制,使得搜索引擎更加智能。
本书适合作为互联网行业从业者的技术参考书,也适合作为搜索引擎爱好者的参考读物。
未经许可,不得以任何方式复制或抄袭本书之部分或全部内容。
版权所有,侵权必究。
图书在版编目( CIP)数据
大数据搜索引擎原理分析及编程实现 / 刘凡平编著.— 北京:电子工业出版社,2016.7
ISBN 978-7-121-29164-7
Ⅰ. ①大… Ⅱ. ①刘… Ⅲ. ①搜索引擎-程序设计Ⅳ. ①TP391.3
中国版本图书馆CIP数据核字(2016 )第141781号
策划编辑:李 冰
责任编辑 :李 冰
特约编辑:田学清 罗树利
印 刷:
装 订:
出版发行:电子工业出版社
北京市海淀区万寿路 173信箱 邮编:100036
开 本:720×1000 1/16 印张: 20.5 字数:525千字
版 次: 2016年 7月第1版
印 次: 2016年 7月第1次印刷
定 价:59.00元
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社
发行部联系,联系及邮购电话 :( 010) 88254888,88258888。
质量投诉请发邮件至 zlts@phei.com.cn,盗版侵权举报请发邮件至 dbqq@phei.com.cn。
本书咨询联系方式 : libing@phei.com.cn。
前 言
搜索引擎本身作为一门综合性的互联网技术,在行业中一直具备较高的关
注度。随着最近几年大数据的发展,搜索引擎的关注度越来越高,原因在于搜
索引擎技术是大数据应用最前线的领域,也是最容易产生价值的大数据应用。
大数据存储、大数据计算都是从搜索引擎中衍生出的新领域。目前搜索引擎技
术的发展不仅以大数据为基础,还利用分布式实时计算对数据进行高性能处理,
以及利用机器学习将数据变得更具价值。在行业中吸引了包括搜索研发工程师、
算法研发工程师、大数据分析工程师、自然语言处理工程师、计算平台架构师、
数据挖掘工程师等行业各类精英的关注,这些工程师占据了整个互联网研发体
系的50%~6
《大数据搜索引擎原理分析及编程实现》.pdf