《从零构建向量数据库 联合DeepSeek打造私人知识库(图灵出品)》[72M]百度网盘|pdf下载|亲测有效
《从零构建向量数据库 联合DeepSeek打造私人知识库(图灵出品)》[72M]百度网盘|pdf下载|亲测有效
《从零构建向量数据库 联合DeepSeek打造私人知识库(图灵出品)》[72M]百度网盘|pdf下载|亲测有效
《从零构建向量数据库 联合DeepSeek打造私人知识库(图灵出品)》[72M]百度网盘|pdf下载|亲测有效
《从零构建向量数据库 联合DeepSeek打造私人知识库(图灵出品)》[72M]百度网盘|pdf下载|亲测有效
《从零构建向量数据库 联合DeepSeek打造私人知识库(图灵出品)》[72M]百度网盘|pdf下载|亲测有效
《从零构建向量数据库 联合DeepSeek打造私人知识库(图灵出品)》[72M]百度网盘|pdf下载|亲测有效

从零构建向量数据库 联合DeepSeek打造私人知识库(图灵出品) pdf下载

isbn:9787115649782
出版社 人民邮电出版社
出版年 2024-08-01
页数 198页
ISBN 9787115649782
装帧 精装
评分 9.0(豆瓣)
8.90¥ 10.90¥

内容简介

本篇主要提供从零构建向量数据库 联合DeepSeek打造私人知识库(图灵出品)电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

产品特色

编辑推荐

适读人群 :1. 数据库技术从业者:包括数据库开发人员、数据库管理员、数据库架构师等 2. AI(尤其是大模型)、大数据领域从业人员 3. 计算机科学与技术专业的学生和教师 4. 企业和组织的技术决策者 5. 其他对向量数据库感兴趣的读者

1.【实操】涉及技术原理、实现细节和实践应用,涵盖向量数据库的方方面面
2.【生动】10次版本迭代/10000行代码;27张表/41幅图/22个思维导图轻松学
3.【专业】作者罗云是腾讯云向量数据库负责人,带领团队积累了丰富的一线经验
4.【热门】自制成功立马投入实践,带大家结合RAG实现个人知识库等大模型应用
5.【简单】附赠随书代码,随学随查——原来,构建向量数据库如此简单!

内容简介

这是一本需要“动手实践”的图书,通过带领大家从零构建一款分布式向量数据库,让大家透彻理解向量数据库的技术原理和实现细节。

本书共分为三大部分,内容由浅入深、循序渐进。“第一部分 认识向量数据库”(第1~3章)是基础篇,介绍向量数据库的基础知识,涵盖向量及数据库的基本概念、向量数据库的发展历程和核心功能。“第二部分 构建向量数据库”(第4~6章)是核心篇,详细介绍如何从零开始构建并优化向量数据库,巨细靡遗地展示数据库内核的技术实现细节并辅以代码示例、技术架构图等,旨在让大家真正实现动手写向量数据库。“第三部分 向量数据库的实践与展望”(第7~8章)是结束篇,通过实践案例展示向量数据库在AI应用中的使用方法,并尝试勾勒向量数据库的未来。

本书面向数据库开发人员、数据库管理员、数据库架构师等数据库从业人员,AI从业者,及其他对向量数据库感兴趣的读者。

作者简介

罗云

腾讯云数据库副总经理、腾讯云创始团队成员、中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)数据库与存储工作组副组长。

十余年云计算产品技术专家,在复杂分布式系统的建设和管理上实践多年并积累了丰富的经验,擅长将数据治理技术(采集、加工、存储、检索)和AI结合,在AI时代更好地发挥数据的价值。

领导多个平台或产品完成从0到1的上线与商业化运营,达到国内领先水平,其中包括:
1. 一站式 Serverless开发平台(小程序云开发)
2. TencentDB for Redis/MongoDB/KeeWiDB、Tencent Cloud VectorDB等数据库产品
3. 腾讯云数据传输服务(DTS)、数据库智能管家(DBbrain)等多款数据采集和智能化应用平台

精彩书评

王江舟|刘颖|李国良|杜小勇|刘知远|王昊奋|盖国强|杨成虎 联袂推荐

本书是罗云及其团队在AI领域探索的智慧结晶。它不仅深入揭示了向量数据库的工作原理,更提供了丰富的场景案例和实践启发。无论是AI技术的探索者,还是AI应用的创新者,都能从这本书中获得宝贵的灵感和指导。?
——王江舟,中国工程院外籍院士

罗云是云计算行业早期的从业者和资深专家,在数据库、网络和分布式系统方面具有丰富的经验。本书从实践出发,深入浅出地讲解了如何打造高性能向量数据库,推荐大家阅读。
——刘颖,腾讯云副总裁

AI的发展呼唤多模态数据的统一表征和管理,向量数据库应运而生,是数据库大家族的新宠。本书深入浅出地介绍其基本概念,从零开始、逐步深入、重视实战,是学习向量数据库很好的参考书!
——杜小勇,中国人民大学信息学院教授、教育部数据工程与知识工程重点实验室主任

本书汇集了罗云以及腾讯云数据库团队多年服务于腾讯集团及其外部客户的丰富经验。书中内容浅显易懂,非常适合对向量数据库技术感兴趣的技术人员阅读。
——李国良,清华大学教授、IEEE Fellow

在“AI平民化”浪潮中,向量数据库作为新兴技术,正迅速成为AI应用的基石。本书以其深入浅出的讲解和实战导向的内容,填补了市场空白。推荐数据库和AI相关领域的从业者阅读。
——刘知远,清华大学副教授

本书不光理论与实践并重,更是一部揭示未来数据管理方向的重要指南。如果你希望在AI时代站在技术前沿,掌握构建和应用向量数据库的核心技能,那么本书无疑是你不可或缺的良师益友。
——王昊奋,同济大学特聘研究员、OpenKG(中文开放知识图谱联盟)发起人

罗云及其团队在向量检索领域探索多年,积累了诸多先行者的宝贵经验。本书是罗云对向量数据库深刻理解和洞察的系统体现,填补了向量数据库图书的空白。相信所有读者通过动手躬行,一定能够从无到有地构建向量数据库,并真正理解其本质。
——盖国强,云和恩墨创始人、鲲鹏MVP

本书既包含向量技术理论,也有分布式数据库的实践经验,同时也阐述了相关的应用场景,不仅适合数据库领域的专业人士阅读,也适合对AI技术感兴趣的朋友参考。
——杨成虎,北京枫清科技联合创始人 & CTO

目录

第 一部分 认识向量数据库
第 1章 向量数据库基础 2
1.1 向量 2
1.1.1 什么是向量 2
1.1.2 万物皆可向量 4
1.1.3 向量间的相似度 6
1.1.4 相似度应用案例 8
1.2 数据库 11
1.2.1 什么是数据库 11
1.2.2 关系型数据库 13
1.2.3 非关系型数据库 14
1.2.4 传统数据库的限制 15
1.3 为什么需要向量数据库 16
1.3.1 向量数据和传统数据的差异 16
1.3.2 向量数据库应运而生 17
1.3.3 大模型时代的智能存储平台 18
1.4 小结 19
第 2章 向量数据库极简史 21
2.1 孕育期(1980—2012) 21
2.1.1 深度神经网络的飞速发展 22
2.1.2 深度神经网络vs向量数据库 23
2.2 诞生期(2012—2017) 24
2.3 成长期(2017年至今) 25
2.3.1 行业发展简况 26
2.3.2 代表性产品能力对比 27
2.3.3 代表性产品技术架构 28
2.4 小结 32
第3章 向量数据库的核心能力 33
3.1 基础能力 33
3.1.1 逻辑层次 34
3.1.2 索引 39
3.1.3 关键指标 42
3.2 高阶能力 43
3.2.1 动态schema 43
3.2.2 别名机制 44
3.2.3 向量化 45
3.2.4 混合查询 46
3.3 小结 47
第二部分 构建向量数据库
第4章 实现单机向量数据库 50
4.1 实现向量数据索引 50
4.1.1 FAISS核心功能 51
4.1.2 实现扁平索引 56
初始版本v0.0.1 62
4.1.3 HNSWLib核心功能 63
4.1.4 实现HNSW索引 70
版本迭代v0.0.2 73
4.2 实现混合数据索引 74
4.2.1 实现标量数据索引 74
4.2.2 统一管理入口  76
版本升级v0.1   79
4.2.3 实现过滤索引  80
版本迭代v0.1.1  86
4.3 实现系统异常恢复  87
4.3.1 数据日志持久化  87
版本迭代v0.1.2  91
4.3.2 数据快照持久化  92
版本升级v0.2  97
4.4 小结  97
第5 章 实现分布式向量数据库  99
5.1 集群数据管理  100
5.1.1 认识NuRaft  102
5.1.2 建立主从关系  106
5.1.3 实现数据复制  110
版本升级v0.3  113
5.2 集群流量管理  113
5.2.1 集群的元数据管理  114
5.2.2 统一的流量入口  117
5.2.3 读写分离  121
5.2.4 保证读写一致性  122
版本升级v0.4  123
5.3 集群异常管理  123
5.3.1 发现新主节点  123
5.3.2 发现故障从节点  125
5.3.3 实现故障切换  127
版本升级v0.5  128
5.4 集群的分片  130
5.4.1 配置集群的分片策略  130
5.4.2 根据分片策略转发请求  132
版本升级v0.6  139
5.5 小结  140
第6 章 优化向量数据库  142
6.1 性能优化  143
6.1.1 利用指令集优化向量计算  143
6.1.2 优化查询算法  144
6.1.3 优化通信协议  147
6.1.4 自定义基准测试工具  149
6.2 成本优化  154
6.2.1 多模块混合部署  155
6.2.2 单节点部署  158
6.3 易用性优化  160
6.3.1 SDK  160
6.3.2 访问鉴权  162
6.3.3 数据备份  169
6.4 小结  172
第三部分 向量数据库的实践与展望
第7 章 向量数据库实践案例  176
7.1 搭建图片查询系统  176
7.1.1 图片向量化  176
7.1.2 图片上传和查询  179
7.1.3 系统效果一览  181
7.2 搭建个人知识库  182
7.2.1 知识预处理  182
7.2.2 知识向量化  183
7.2.3 知识库管理  184
7.2.4 知识问答  185
7.2.5 系统效果一览  186
7.3 小结  187
第8 章 展望  189
8.1 从行业演进视角看  190
8.1.1 人类调度数据新范式  190
8.1.2 向量数据抹平数据格式差异  192
8.1.3 向量数据库平台化的关键  193
8.2 从行业应用视角看  194
8.2.1 RAG 简介  195
8.2.2 降低RAG 使用门槛  196
8.3 小结  197

产品特色

编辑推荐

适读人群 :1. 数据库技术从业者:包括数据库开发人员、数据库管理员、数据库架构师等 2. AI(尤其是大模型)、大数据领域从业人员 3. 计算机科学与技术专业的学生和教师 4. 企业和组织的技术决策者 5. 其他对向量数据库感兴趣的读者

1.【实操】涉及技术原理、实现细节和实践应用,涵盖向量数据库的方方面面
2.【生动】10次版本迭代/10000行代码;27张表/41幅图/22个思维导图轻松学
3.【专业】作者罗云是腾讯云向量数据库负责人,带领团队积累了丰富的一线经验
4.【热门】自制成功立马投入实践,带大家结合RAG实现个人知识库等大模型应用
5.【简单】附赠随书代码,随学随查——原来,构建向量数据库如此简单!

内容简介

这是一本需要“动手实践”的图书,通过带领大家从零构建一款分布式向量数据库,让大家透彻理解向量数据库的技术原理和实现细节。

本书共分为三大部分,内容由浅入深、循序渐进。“第一部分 认识向量数据库”(第1~3章)是基础篇,介绍向量数据库的基础知识,涵盖向量及数据库的基本概念、向量数据库的发展历程和核心功能。“第二部分 构建向量数据库”(第4~6章)是核心篇,详细介绍如何从零开始构建并优化向量数据库,巨细靡遗地展示数据库内核的技术实现细节并辅以代码示例、技术架构图等,旨在让大家真正实现动手写向量数据库。“第三部分 向量数据库的实践与展望”(第7~8章)是结束篇,通过实践案例展示向量数据库在AI应用中的使用方法,并尝试勾勒向量数据库的未来。

本书面向数据库开发人员、数据库管理员、数据库架构师等数据库从业人员,AI从业者,及其他对向量数据库感兴趣的读者。

作者简介

罗云

腾讯云数据库副总经理、腾讯云创始团队成员、中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)数据库与存储工作组副组长。

十余年云计算产品技术专家,在复杂分布式系统的建设和管理上实践多年并积累了丰富的经验,擅长将数据治理技术(采集、加工、存储、检索)和AI结合,在AI时代更好地发挥数据的价值。

领导多个平台或产品完成从0到1的上线与商业化运营,达到国内领先水平,其中包括:
1. 一站式 Serverless开发平台(小程序云开发)
2. TencentDB for Redis/MongoDB/KeeWiDB、Tencent Cloud VectorDB等数据库产品
3. 腾讯云数据传输服务(DTS)、数据库智能管家(DBbrain)等多款数据采集和智能化应用平台

精彩书评

王江舟|刘颖|李国良|杜小勇|刘知远|王昊奋|盖国强|杨成虎 联袂推荐

本书是罗云及其团队在AI领域探索的智慧结晶。它不仅深入揭示了向量数据库的工作原理,更提供了丰富的场景案例和实践启发。无论是AI技术的探索者,还是AI应用的创新者,都能从这本书中获得宝贵的灵感和指导。?
——王江舟,中国工程院外籍院士

罗云是云计算行业早期的从业者和资深专家,在数据库、网络和分布式系统方面具有丰富的经验。本书从实践出发,深入浅出地讲解了如何打造高性能向量数据库,推荐大家阅读。
——刘颖,腾讯云副总裁

AI的发展呼唤多模态数据的统一表征和管理,向量数据库应运而生,是数据库大家族的新宠。本书深入浅出地介绍其基本概念,从零开始、逐步深入、重视实战,是学习向量数据库很好的参考书!
——杜小勇,中国人民大学信息学院教授、教育部数据工程与知识工程重点实验室主任

本书汇集了罗云以及腾讯云数据库团队多年服务于腾讯集团及其外部客户的丰富经验。书中内容浅显易懂,非常适合对向量数据库技术感兴趣的技术人员阅读。
——李国良,清华大学教授、IEEE Fellow

在“AI平民化”浪潮中,向量数据库作为新兴技术,正迅速成为AI应用的基石。本书以其深入浅出的讲解和实战导向的内容,填补了市场空白。推荐数据库和AI相关领域的从业者阅读。
——刘知远,清华大学副教授

本书不光理论与实践并重,更是一部揭示未来数据管理方向的重要指南。如果你希望在AI时代站在技术前沿,掌握构建和应用向量数据库的核心技能,那么本书无疑是你不可或缺的良师益友。
——王昊奋,同济大学特聘研究员、OpenKG(中文开放知识图谱联盟)发起人

罗云及其团队在向量检索领域探索多年,积累了诸多先行者的宝贵经验。本书是罗云对向量数据库深刻理解和洞察的系统体现,填补了向量数据库图书的空白。相信所有读者通过动手躬行,一定能够从无到有地构建向量数据库,并真正理解其本质。
——盖国强,云和恩墨创始人、鲲鹏MVP

本书既包含向量技术理论,也有分布式数据库的实践经验,同时也阐述了相关的应用场景,不仅适合数据库领域的专业人士阅读,也适合对AI技术感兴趣的朋友参考。
——杨成虎,北京枫清科技联合创始人 & CTO

目录

第 一部分 认识向量数据库
第 1章 向量数据库基础 2
1.1 向量 2
1.1.1 什么是向量 2
1.1.2 万物皆可向量 4
1.1.3 向量间的相似度 6
1.1.4 相似度应用案例 8
1.2 数据库 11
1.2.1 什么是数据库 11
1.2.2 关系型数据库 13
1.2.3 非关系型数据库 14
1.2.4 传统数据库的限制 15
1.3 为什么需要向量数据库 16
1.3.1 向量数据和传统数据的差异 16
1.3.2 向量数据库应运而生 17
1.3.3 大模型时代的智能存储平台 18
1.4 小结 19
第 2章 向量数据库极简史 21
2.1 孕育期(1980—2012) 21
2.1.1 深度神经网络的飞速发展 22
2.1.2 深度神经网络vs向量数据库 23
2.2 诞生期(2012—2017) 24
2.3 成长期(2017年至今) 25
2.3.1 行业发展简况 26
2.3.2 代表性产品能力对比 27
2.3.3 代表性产品技术架构 28
2.4 小结 32
第3章 向量数据库的核心能力 33
3.1 基础能力 33
3.1.1 逻辑层次 34
3.1.2 索引 39
3.1.3 关键指标 42
3.2 高阶能力 43
3.2.1 动态schema 43
3.2.2 别名机制 44
3.2.3 向量化 45
3.2.4 混合查询 46
3.3 小结 47
第二部分 构建向量数据库
第4章 实现单机向量数据库 50
4.1 实现向量数据索引 50
4.1.1 FAISS核心功能 51
4.1.2 实现扁平索引 56
初始版本v0.0.1 62
4.1.3 HNSWLib核心功能 63
4.1.4 实现HNSW索引 70
版本迭代v0.0.2 73
4.2 实现混合数据索引 74
4.2.1 实现标量数据索引 74
4.2.2 统一管理入口  76
版本升级v0.1   79
4.2.3 实现过滤索引  80
版本迭代v0.1.1  86
4.3 实现系统异常恢复  87
4.3.1 数据日志持久化  87
版本迭代v0.1.2  91
4.3.2 数据快照持久化  92
版本升级v0.2  97
4.4 小结  97
第5 章 实现分布式向量数据库  99
5.1 集群数据管理  100
5.1.1 认识NuRaft  102
5.1.2 建立主从关系  106
5.1.3 实现数据复制  110
版本升级v0.3  113
5.2 集群流量管理  113
5.2.1 集群的元数据管理  114
5.2.2 统一的流量入口  117
5.2.3 读写分离  121
5.2.4 保证读写一致性  122
版本升级v0.4  123
5.3 集群异常管理  123
5.3.1 发现新主节点  123
5.3.2 发现故障从节点  125
5.3.3 实现故障切换  127
版本升级v0.5  128
5.4 集群的分片  130
5.4.1 配置集群的分片策略  130
5.4.2 根据分片策略转发请求  132
版本升级v0.6  139
5.5 小结  140
第6 章 优化向量数据库  142
6.1 性能优化  143
6.1.1 利用指令集优化向量计算  143
6.1.2 优化查询算法  144
6.1.3 优化通信协议  147
6.1.4 自定义基准测试工具  149
6.2 成本优化  154
6.2.1 多模块混合部署  155
6.2.2 单节点部署  158
6.3 易用性优化  160
6.3.1 SDK  160
6.3.2 访问鉴权  162
6.3.3 数据备份  169
6.4 小结  172
第三部分 向量数据库的实践与展望
第7 章 向量数据库实践案例  176
7.1 搭建图片查询系统  176
7.1.1 图片向量化  176
7.1.2 图片上传和查询  179
7.1.3 系统效果一览  181
7.2 搭建个人知识库  182
7.2.1 知识预处理  182
7.2.2 知识向量化  183
7.2.3 知识库管理  184
7.2.4 知识问答  185
7.2.5 系统效果一览  186
7.3 小结  187
第8 章 展望  189
8.1 从行业演进视角看  190
8.1.1 人类调度数据新范式  190
8.1.2 向量数据抹平数据格式差异  192
8.1.3 向量数据库平台化的关键  193
8.2 从行业应用视角看  194
8.2.1 RAG 简介  195
8.2.2 降低RAG 使用门槛  196
8.3 小结  197
用户名:小***爹
内容:性价比非常高🍀,可以放心购买👍,做工非常精致🌈,值得购买😜!🉑宝贝收到了,很惊喜✨,设计合理,时尚大方,继续关注,以后会回购的❥❥❥🌈质量很好,买的很合我心意💕,棒棒哒!✨需要的亲们可以放心购买
评分:8.70
用户名:s***7
内容:国内为数不多介绍向量数据库的书籍,内容还算翔实,配套代码也很有助于学习相关知识,最近向量数据库很热,还是有一定个门槛,多学习。
评分:8.71
用户名:j***4
内容:购物体验很棒,商品物美价廉,质量优秀。物流迅速,商家服务贴心,售后无忧。 向量数据库,与rag搭配,是当前的热点,学好这些才能跟上技术的进步
评分:8.92
用户名:3***3
内容:本书具有很强的指导性、启发性,可操作性较强,内容详实、论据充分,逻辑严谨、全局把握自如,应用灵活。纸书全新,包装简约环保。从整体上来看,发货及时到货很快,东西理想、五星好评,值得推荐、还会复购的。
评分:8.98
用户名:j***g
内容:这本书非常棒,是了解向量数据库的极好参考书,也是我的第一本向量数据库参考书,书中对各知识点的讲解言简意赅,很容易看懂,相关代码可以找网上下载,可以详细研读,对学习向量数据库非常有帮助,推荐大家购买。
评分:8.65