自然语言处理实践:聊天机器人技术原理与应用pdf下载pdf下载

自然语言处理实践:聊天机器人技术原理与应用百度网盘pdf下载

作者:
简介:本篇主要提供自然语言处理实践:聊天机器人技术原理与应用pdf下载
出版社:电子工业出版社
出版时间:2019-03
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

产品特色

编辑推荐

适读人群 :对人工智能应用感兴趣的学生、科研人员。自然语言处理、聊天机器人方向从业者,人工智能产品制造者等。

首著问世|集一线AI工程师十余载之功力|揭聊天机器人技术之面纱|深入探讨对话、问答、闲聊系统|产学界大咖力荐!


内容简介

聊天机器人作为人工智能技术的杀手级应用,发展得如火如荼,各种智能硬件层出不穷。《自然语言处理实践:聊天机器人技术原理与应用》系统地阐述了聊天机器人的分类和关键技术,不仅给出了实际案例,还展望了聊天机器人在通往更智能化、更人性化、更趣味化的道路上所面临的挑战。同时,针对聊天机器人在从感知智能到认知智能的跨越中所面临的难题,《自然语言处理实践:聊天机器人技术原理与应用》着重讨论了知识图谱和深度学习技术在自然语言处理、问答、推理、服务融合等方面的应用。

《自然语言处理实践:聊天机器人技术原理与应用》适合有志于从事人工智能行业,以及想了解聊天机器人到底是什么的读者阅读。

作者简介

王昊奋

上海乐言信息科技有限公司CTO,中文知识图谱zhishi.me创始人、OpenKG发起人之一、CCF理事、CCF术语审定工委主任、CCF TF执委、中文信息学会语言与知识计算委员会副秘书长,共发表80余篇高水平论文,在知识图谱、问答系统和聊天机器人等诸多领域有丰富的研发经验,其带队构建的语义搜索系统在Billion Triple Challenge中荣获全球第2名;在著名的本体匹配竞赛OAEI的实体匹配任务中斩获全球第1名。曾主持并参与多项国家自然科学基金、“863”重大专项和国家科技支撑项目,以学术负责人身份参与PayPal、Google、Intel、IBM、百度等企业的合作项目。


邵 浩

博士,上海瓦歌智能科技有限公司总经理,深圳狗尾草智能科技有限公司人工智能研究院院长,上海市静安区首届优秀人才,带领团队打造了AI虚拟生命产品“琥珀·虚颜”的交互引擎。任中国中文信息学会青年工作委员会委员、中国计算机学会YOCSEF上海学术委员会委员,研究方向为机器学习,共发表论文40余篇,主持多项国家及省部级项目,曾在联合国、世界贸易组织、亚利桑那州立大学、香港城市大学等机构任访问学者。


李方圆

狗尾草智能科技有限公司高级工程师,苏州大学硕士,主要研究方向为自然语言处理、问答系统和知识图谱,具有多年实战经验,目前为自然语言处理团队总负责人,主导开发公司全线产品的对话交互功能。


张凯

狗尾草智能科技有限公司高级工程师,主要从事自然语言处理、对话系统、知识图谱等领域的研究工作。在狗尾草智能科技有限公司主导认知对话引擎的设计开发,以及通用领域知识图谱的建设工作,参与编写发布了《知识图谱白皮书》及《知识图谱评测标准》。


宋亚楠

中山大学计算机科学硕士,就学期间专攻图像处理与识别方向。在智能硬件及人工智能行业历任软件工程师、产品经理、战略技术规划经理等职位,产品多次获CES创新奖,先后公开几十项国内及PCT发明专利。


内页插图

精彩书评

《自然语言处理实践:聊天机器人技术原理与应用》是一本系统地介绍聊天机器人发展历史和技术体系的书籍,可作为学者和相关企业工程师随时翻阅的案头参考书。知识图谱是聊天机器人从感知到认知突破的关键技术,本书不仅有对其基础构建和应用的解读,还有基于知识图谱的问答方面的技术分析。本书内容基本涵盖了聊天机器人的各方面研究和前沿工程进展。我力荐本书给想从事这个领域工作的年轻人阅读。

——李涓子(清华大学计算机系教授,中文信息处理学会语言认知与知识计算专委会主任)


聊天机器人,包含了自然语言处理、知识图谱、机器学习等各方面技术,是多种技术的集大成者。在本书中,作者对聊天机器人涉及的技术做了详细介绍,还对深度学习的前沿研究有所涉及。在聊天机器人发展得如火如荼的今天,本书是入门者不可多得的技术参考书。

——张民(苏州大学特聘教授,国家杰出青年科学基金获得者)


本书作者用深入浅出的文字,介绍了聊天机器人的发展和技术,通过对不同类型聊天机器人的详细阐述,让读者能够深入技术细节、尝试具体实践。举例来说,作者通过大量篇幅,介绍了一种非常重要的聊天机器人类型——对话系统,着重阐述了如何在多轮复杂场景下提升对话的性能和效果。虽然聊天机器人远未达到与人自然交流的程度,但我力荐本书给更多的学者和工程师,希望他们能进一步推动技术的突破,打磨出经典的产品。

——刘挺(哈尔滨工业大学人工智能研究院副院长、教授,国家“万人计划”科技创新领军人才)


聊天机器人有很多落地的场景,除了智能客服,还包括个人助理、智能问答及在金融、电商、教育和娱乐等垂直领域的应用。从工业界的角度看,我们更关注技术在落地时能否满足用户需求,是否有较好的用户体验,以及是否有较通用的工程实现。本书内容兼顾理论阐述和技术实践,可以使工程师在尝试技术实现时事半功倍。

——何晓冬(京东人工智能研究院常务副院长、华盛顿大学ECE系兼职教授、IEEE Fellow)


推荐序

聊天机器人是社会关系网络、自动客服、语音助手、智能音箱、游戏等的重要支撑技术,它综合应用了自然语言处理技术。自然语言处理是体现语言智能非常关键的技术,它分析、理解和生成自然语言,实现人与机器的自然交流。同时,机器翻译、自动文摘、自动写作、邮件或者短消息的自动回复也有助于人与人之间的交流。如果语言智能可以实现突破,跟它同属认知智能的知识图谱与常识推理等技术也会得到长足的发展,并推动整个人工智能体系的进步,使更多的场景落地。自然语言处理被视为人工智能“皇冠上的明珠”。要做好这项技术,达到和人一样自然的交互是非常具有挑战性的一项课题。许多积极投身于自然语言处理研究和开发的同仁,迫切需要掌握自然语言处理的基础技术,了解技术前沿。

我很高兴看到本书的出版。它系统地介绍了聊天机器人的技术体系和自然语言处理在聊天机器人中的应用,辅以案例,理论和实践结合良好。本书深入浅出的风格对不同层次的读者都有帮助。

本书由王昊奋博士和邵浩博士主导,他们二位都是从学术界跨越到工业界的年轻人,并致力于将技术应用到产品实践中。我和王昊奋在中国计算机学会术语工作委员会和自然语言专委会等组织中有紧密的合作。我认为,他不仅在学术上积极进取,还特别希望尝试把各种新技术应用到产品中。他将理论和实践相结合,多年来积累了丰富的研发经验,走出了一条独到的创新之路。本书由多位相关企业的资深技术研发人员参与撰写。因此我相信本书一定会激发大家对聊天机器人的兴趣和更深入的思考。

从本书的内容上看,除了对聊天机器人的历史发展和技术体系的阐述,重点介绍了聊天机器人的3 种典型表现形式:闲聊、对话和问答。以闲聊型聊天机器人为例,虽然基于检索的方法是目前主流的产品实现方式,但随着自然语言处理端到端技术的发展,生成式对话越来越受重视,有很多研究者尝试用生成方法解决个性化、多轮对话和安全回复等问题。同时,本书介绍了知识图谱的重要作用,因为基于知识图谱的问答也是问答型聊天机器人的重要组成部分。本书尽可能完整地展现了聊天机器人相关技术的新进展,有兴趣的读者可通过此书全面了解聊天机器人。

聊天机器人已经在智能客服、知识问答等场景里有了较好的应用,未来会在大数据、深度学习和重要场景的推动下进一步提升智能水平。我们可以畅想,在未来的某个时刻,会出现一个基于人工智能技术的虚拟生命,它能够真正理解人类的语言,有自己的记忆和情感,并可以和人进行自然真实的对话。尽管我们离这个目标尚远,但是我们可以逐步靠近。这里孕育着无穷的研究、开发机会和乐趣。我期待本书能激励更多优秀的年轻人投身其中,做出更多成就!


微软亚洲研究院副院长、国际计算语言学会主席

周明

目录

1 聊天机器人概述 1

1.1 聊天机器人的发展历史 1

1.2 聊天机器人的分类与应用场景 6

1.3 聊天机器人生态介绍 9

1.3.1 典型聊天机器人框架介绍 11

1.3.2 聊天机器人平台介绍 13

1.3.3 典型的聊天机器人产品介绍 13

1.4 参考文献 19

2 聊天机器人技术原理 20

2.1 自然语言理解 21

2.1.1 自然语言理解概览 23

2.1.2 自然语言理解基本技术 26

2.1.3 自然语言表示和基于深度学习的自然语言理解 36

2.1.4 基于知识图谱的自然语言理解 46

2.2 自然语言生成 56

2.2.1 自然语言生成综述 56

2.2.2 基于检索的自然语言生成 58

2.2.3 基于模板的自然语言生成 59

2.2.4 基于深度学习的自然语言生成 60

2.3 对话管理 61

2.4 参考文献 65

3 问答系统 67

3.1 问答系统概述 67

3.2 KBQA 系统 71

3.2.1 KBQA 系统简介 71

3.2.2 主流的KBQA 方法 79

3.3 KBQA 系统实现 96

3.3.1 系统简介 96

3.3.2 模块设计 97

3.4 参考文献 105

4 对话系统 109

4.1 对话系统概述 109

4.2 对话系统技术原理 113

4.2.1 NLU 模块 115

4.2.2 DST 模块 120

4.2.3 DPL 模块 121

4.2.4 NLG 模块 126

4.3 基于聊天机器人平台搭建对话系统 126

4.3.1 NLU 模块实现 129

4.3.2 DST 与DPL 模块实现 130

4.3.3 NLG 模块实现 131

4.4 面向任务的对话系统实现 132

4.5 参考文献 137

5 闲聊系统 139

5.1 闲聊系统概述 139

5.2 基于对话库检索的闲聊系统 140

5.2.1 基于对话库检索的闲聊系统介绍 140

5.2.2 对话库的建立 143

5.2.3 基于检索的闲聊系统实现 145

5.3 基于生成的闲聊系统 150

5.3.1 基于生成的闲聊系统介绍 150

5.3.2 生成式闲聊系统的新发展 152

5.3.3 基于生成的闲聊系统实现 155

5.4 参考文献 157

6 聊天机器人系统评测 159

6.1 问答系统评测 159

6.1.1 问答系统评测会议 160

6.1.2 问答系统评测数据集 171

6.1.3 问答系统评测标准 173

6.2 对话系统评测 174

6.2.1 对话系统评测会议 176

6.2.2 对话系统评测数据集 177

6.2.3 对话系统评测标准 178

6.3 闲聊系统评测 179

6.3.1 闲聊系统评测介绍 179

6.3.2 闲聊系统评测标准 180

6.4 参考文献 183

7 聊天机器人挑战与展望 185

7.1 开放式挑战 185

7.2 技术与应用展望 187

7.3 从聊天机器人到虚拟生命 190

7.4 参考文献 193

前言/序言

缘起

写作本书的初衷,是作者在聊天机器人相关的技术公司工作时,在做产品的过程中,深深感受到理论和实践的差别。举例来说,学术界一直追捧的seq2seq技术,并没有很好地应用在聊天机器人的产品中。而且,对于刚入职的工程师,也没有一本系统性的书籍来帮助他们快速理解和掌握聊天机器人的技术脉络。因此,我提议:我们为什么不写一本全面的技术读本,将我们在实践中遇到的问题和解决方案都放到这本书里,让更多的读者了解聊天机器人的知识体系,避免踩我们在工作中踩过的很多坑呢?于是我们开始了本书的撰写。希望这本书能尽可能全面地梳理聊天机器人技术,使读者更深入地理解其背后的理论知识。

本书特色

本书应该是国内第一本聊天机器人参考书,书中不仅介绍了聊天机器人的发展历史,还深入介绍了不同类型聊天机器人的技术实现。无论是拥有实体的聊天机器人还是聊天机器人软件,其功能都跳不出闲聊、问答、对话和主动交互4 种。不同类型的聊天机器人的侧重点不同,但终极目标都是拥有自我感知能力,并能像人一样进行情感交互。本书涵盖的范围比较广泛,但受限于时间和精力,对某些特定的技术点,我们仅仅给出了简要介绍(例如语音识别和语音合成技术),而将主要精力放在了在文字层面聊天机器人如何进行交互上。对于工业界的朋友,希望本书能够在您寻找特定技术的时候提供一定帮助;对于学术界的专家,本书给出的很多难题也期待着您在理论上加以研究并寻求突破。

本书分7 章。第1 章简要介绍了聊天机器人的发展和分类,第2 章给出了聊天机器人的技术体系介绍,第3 章到第5 章分别介绍了3 种不同类型的聊天机器人的技术实现(问答、对话和闲聊),第6 章给出了聊天机器人系统评测的相关信息,第7 章提出了聊天机器人进一步发展所面临的技术挑战和展望。

下面简要介绍每章的具体内容:

第1 章“聊天机器人概述” 在本章中,我们追溯了聊天机器人的发展历史,并阐述了聊天机器人的分类和应用场景,从技术层面给出了一个典型的聊天机器人应该包含的技术框架,同时着重介绍了最具代表性的聊天机器人产品。

第2 章“聊天机器人技术原理” 在本章中,我们从技术的角度,详细介绍了一个文字型交互聊天机器人涉及的技术,包括自然语言理解、对话管理和自然语言生成。我们不仅介绍了传统的自然语言处理技术,也给出了深度学习在解决同类问题上的研究进展。同时,引出了跨越认知智能的关键技术之一——知识图谱,通过不同的例子,阐述了从构建到应用知识图谱的过程。

第3 章“问答系统” 在本章中,我们介绍了聊天机器人的一种形式——问答。对于某一问题,问答系统旨在获取其精准答案。我们重点介绍了基于知识库的问答系统,阐述了构建知识库所需的技术,并给出了IBM Watson 问答系统的详细说明。同时,我们介绍了4 种主流的问答方法,包括模板匹配、语义解析、图遍历和深度学习。最后,给出了一个问答系统的具体实践案例。

第4 章“对话系统” 在本章中,我们主要介绍面向任务的对话系统。与问答系统不同,面向任务的对话系统旨在完成用户指定的一项特定任务。从技术的层面,我们分别介绍了自然语言理解、对话状态跟踪、对话策略学习及自然语言生成,同时穿插了具体的案例,让读者可以有更直观的理解。

第5 章“闲聊系统” 在本章中,我们分别介绍了闲聊系统的两种实现方式,一种基于对话库检索,另一种基于生成模型。我们不仅介绍了技术的最新进展,还给出了具体的实现案例。

第6 章“聊天机器人系统评测” 在本章中,我们梳理了目前国内外聊天机器人评测的公开会议、数据集和进展,并分别针对问答系统和对话系统给出了详细的评测介绍。

第7 章“聊天机器人挑战与展望” 在本章中,我们给出了聊天机器人发展到现阶段所面临的挑战,并对未来不同场景的应用进行了展望。同时,对聊天机器人发展的下一代范式——虚拟生命,给出了我们的见解和期望。

本书是集体智慧的结晶,写作成员包括王昊奋、邵浩、李方圆、张凯、宋亚楠。同时,感谢很多同事和朋友在写作过程中给予的协助。在写作过程中,我们从实际出发,考虑搭建一个聊天机器人所需要的技术应该是什么样的,同时,关注国内外关于聊天机器人、自然语言处理、知识图谱、机器学习的最新进展,并思考如何将这些技术真正应用于构建聊天机器人中。需要说明的是,在写作过程中,我们参阅了很多领域专家的资料,并尽可能地将所有参考资料都列出了。如果您发现某些内容有争议,请联系我们。

尤其要感谢郑柳洁编辑,没有她的督促和协助,本书不可能有这样的完成度。

拥抱人工智能时代

最近几年,技术的飞速发展让我们每个人都无比兴奋。我们也很激动地看到AI 巨头不断地开源最新、最快的模型,例如谷歌开源了语言模型BERT,已经在所有benchmark 数据集上取得了突破。“工欲善其事,必先利其器”,这些强大的算法和工具,让人工智能领域从业者可以创造出更多、更好的产品。在人工智能的发展过程中,我们希望贡献自己的微薄之力。如果读者能够在阅读的过程中获得一点灵感,也将让我们无比欣慰。

愿意创造下一代聊天机器人范式的朋友,我们非常诚挚地邀请您们,一起创造出让人惊艳的、跨越感知智能和认知智能的产品!