更多课程 选择中心


Python培训

400-996-5531

一本书精通Python自然语言处理


自然语言处理(NLP)是有关计算语言学与人工智能的研究领域之一。NLP主要关注人机交互,它提供了计算机和人类之间的无缝交互,使得计算机在机器学习的帮助下理解人类语言。今天小编就给大家介绍一本《精通Python自然语言处理》,感受用Python是如何开发令人惊讶的NLP项目的。

01

自然语言处理

自然语言处理(Natural Language Processing,NLP)关注的是自然语言与计算机之间的交互。它是人工智能(Artificial Intelligence,AI)和计算语言学的主要分支之一,可以提供计算机和人类之间的无缝交互并使得计算机能够在机器学习的帮助下理解人类语言。在编程语言(例如C、C++、Java、Python等)里用于表示一个文件或文档内容的基础数据类型被称为字符串。自然语言处理融合了语言学、计算机科学、数学,它的目的并不是一般地研究自然语言,而是能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。

自然语言处理大体包括了自然语言理解和自然语言生成两个部分。实现人机间自然语言通信也就意味着:既要使计算机既能理解自然语言文本的意义,也能使它以自然语言文本来表达给定的意图、思想等。前者称为自然语言理解,后者称为自然语言生成。实现人机间自然语言通信是十分困难的,原因在于自然语言很多情况下存在着歧义或多义。一个汉字甚至一个标点符号甚至都可能存在多种含义;反过来,一个相同或相近的意义同样也可以用多个中文文字来表示。这也就是当今机器翻译系统的译文质量离理想目标仍相差甚远的原因之一。

最早的自然语言理解方面的研究工作是机器翻译。1949 年,美国人威弗首先提出了机器翻译设计方案。20 世纪 60 年代,国外对机器翻译曾有大规模的研究工作.大约 90 年代开始,自然语言处理领域发生了巨大的变化。现代自然语言处理算法是基于机器学习,特别是统计机器学习。自然语言处理的应用其实已经非常广泛,比如Siri,它所做的就是将听到的语音转化为文字信号,并且把得出的答案再以文字形式展现。除此之外,我们平时使用的输入法、信息搜索等都使用了自然语言处理技术。这么一说,你是不是对它就不再陌生了呢?

02

本书的作译者

本书作者

Deepti Chopra是Banasthali大学的助理教授。她的主要研究领域是计算语言学、自然语言处理以及人工智能,她也参与了将英语转换为印度诸语言的机器翻译引擎的研发。她在各种期刊和会议上发表过一些文章,此外她还担任一些期刊及会议的程序委员会委员。另外,本书作者还有Nisheeth Joshi和Iti Mathur,他们都是相关领域的专家,在自然语言处理方面有着自己的贡献和成就。

本书译者

王威是资深研发工程师,曾就职于携程、东方财富等互联网公司。目前专注于互联网分布式架构设计、大数据与机器学习、算法设计等领域的研究,擅长C#、Python、Java、C++等技术。内涵段子手、空想创业家、业余吉他手、重度读书人。

03

本书的目标读者

对自然语言处理理论和算法感兴趣的读者;

Python程序员。

04

本书的特色

本书详细介绍如何使用Python执行各种自然语言处理(NLP)任务,并帮助读者掌握利用Python设计和构建基于NLP的应用的最佳实践。本书引导读者应用机器学习工具来开发各种各样的模型。对于训练数据的创建和主要NLP应用的实现,例如命名实体识别、问答系统、语篇分析、词义消歧、信息检索、情感分析、文本摘要以及指代消解等,本书都进行了清晰的介绍。本书有助于读者使用NLTK创建NLP项目并成为相关领域的专家。

通过阅读本书,你将能够学到:

实现字符串匹配算法以及标准化技术;

实现统计语言建模技术;

深刻理解词干提取器、词形还原器、形态分析器以及形态生成器的开发;

开发搜索引擎并实现词性标注和统计建模(包含n-gram方法)等相关概念;

熟悉诸如树型库建设、CFG建设、CYK以及Earley线图解析算法等相关概念;

开发基于NER的系统并理解和应用情感分析的相关概念;

理解并实现信息检索和文本摘要等相关概念;

开发语篇分析系统以及基于指代消解的系统。

05

本书的主要内容

第 ① 章,字符串操作,介绍如何执行文本上的预处理任务,例如切分和标准化,此外还介绍了各种字符串匹配方法。

第 ② 章,统计语言建模,包含如何计算单词的频率以及如何执行各种语言建模的技术。

第 ③ 章,形态学:在实践中学习,讨论如何开发词干提取器、形态分析器以及形态生成器。

第 ④ 章,词性标注:单词识别,解释词性标注以及有关n-gram方法的统计建模。

第 ⑤ 章,语法解析:分析训练资料,提供关于Tree bank建设、CFG建设、CYK算法、线图分析算法以及音译等概念的相关信息。

第 ⑥ 章,语义分析:意义很重要,介绍浅层语义分析(即NER)的概念和应用以及使用Wordnet执行WSD。

第 ⑦ 章,情感分析:我很快乐,提供可以帮助你理解和应用情感分析相关概念的信息。

第 ⑧ 章,信息检索:访问信息,将帮助你理解和应用信息检索及文本摘要的概念。

第 ⑨ 章,语篇分析:理解才是可信的,探讨语篇分析系统和基于指代消解的系统。

第 ⑩ 章,NLP系统评估:性能分析,谈论NLP系统评估相关概念的理解与应用。

预约申请免费试听课

填写下面表单即可预约申请免费试听! 怕学不会?助教全程陪读,随时解惑!担心就业?一地学习,可全国推荐就业!

上一篇:Python虚拟开发环境的使用
下一篇:Python 自然语言处理入门

2021年Python全套免费视频教程在哪里?

Python编程学习路线

Python最高有几级?

人工智能与语音遥控的区别?

Copyright © 2023 Tedu.cn All Rights Reserved 京ICP备08000853号-56 京公网安备 11010802029508号 达内时代科技集团有限公司 版权所有

选择城市和中心
黑龙江省

吉林省

河北省

湖南省

贵州省

云南省

广西省

海南省