自然语言处理(NLP)属于人工智能与计算机语言学的交
叉领域,处理的是计算机与人类语言之间的交互问题。随着人
机交互需求的日益增长,计算机具备处理当前主要自然语言的
能力已经成为了一个必然趋势。NLTK正是这一领域中一个强
大而稳健的工具包。
在这本书中,我们首先会介绍一些与NLP相关的知识。
然后,我们会探讨一些与数据科学相关的任务,通过这些任务
来学习如何从零开始构建自定义的标识器和解析器。在此过
程中,我们将会深度探索NLP领域的基本概念,为这一领域
各种开源的Python工具和库提供具有实践意义的见解。接下
来,我们将会介绍如何分析社交媒体网站,发现热门话题,进
行舆情分析。最后,我们还会介绍一些用于处理大规模文本的
工具。
在阅读完本书之后,您将会对NLP与数据科学领域中的概
念有一个充分的了解,并能将这些知识应用到日常工作中。
如果您是NLP或机器学习相关领域的爱好者,并有一些文
本处理的经验,那么本书就是为你量身定做的。此外,这本书
也是专业Python程序员快速学习NLTK库的理想选择。
通过本书,你将学会:
■ 了解自然语言的复杂性以及机器对它们的
处理方式。
■
如何利用标识化处理手段清理文本歧义, 并利用分块操作更好地处理数据。
■ 探索不同标签类型的作用,并学习如何将 句子标签化。
■ 如何根据自己的需要来创建自定义的解析 器和标识器。
■ 如何构建出具有拼写检查、搜索、机器翻 译以及问答系统等功能的实用程序。
■ 如何通过信息爬取与捕获的手段对相关数 据内容进行检索。
■ 如何通过特性的提取与选取,构建出针对 不同文本的分类系统。
■ 如何使用各种第三方P ython库,如pandas、
scikit-learn、matplotlib、gensim。
■
如何对社交媒体网站进行分析,包括发掘 热门话题、舆情分析等。~yNLTK#%5Python取^ %c??i?S+1?;h??1" y.
〔印度〕Nitin Hardeniya 著
凌杰 译
美术编辑:董志桢
NLTK基础教程
用NLTK和Python库构建机器学习应用
NLTK Essentials
NLTK
——
用
NLTK
和
Python
库构建机器学习应用
基础教程
NLTK 基础教程
用NLTK和Python库构建机器学习应用
分类建议:计算机/机器学习/自然语言处理
人民邮电出版社网址:
www.ptpress.com.cn
'