算法与数据中台 基于Google Facebook与微博实践+数据中台 让数据用起来 pdf下载

算法与数据中台 基于Google Facebook与微博实践百度网盘pdf下载

作者:
简介:算法与数据中台 基于Google Facebook与微博实践+数据中台 让数据用起来
出版社:
出版时间:
pdf下载价格:9.00¥


预览


内容介绍





9787121392887 9787111642404


书名: 数据中台:让数据用起来

作者: 付登坡 江敏 任寅姿 孙少忆

定价: 89.00元

ISBN编号: 9787111642404

是否是套装: 否

出版社名称: 机械工业出版社


内容简介.jpg

这是一部讲解数据中台建设、管理与运营的著作,旨在帮助企业将数据转化为生产力,顺利实现数字化转型。本书由国内数据中台领域的企业数澜科技官方出品,几位联合创始人亲自执笔,7位作者都是的数据人,大部分作者来自原数据中台团队。他们结合过去帮助百余家各行业头部企业建设数据中台的经验,总结了一套可落地的数据中台建设方。本书得到了包括集团联合创始人在内的多位行业专家的高度评价和。全书一共11章,从建设、管理、运营、安全等维度全方位地讲解了数据中台。1~2章全面介绍了数据中台产生的背景、发展阶段、企业应该具备的3个认知,以及什么是数据中台、数据中台的4个核心能力、数据中台的业务价值与技术价值等3~4章详细讲解了数据中台的架构设计、建设方,以及企业建设数据中台的成熟度评估和应用场景分析;5~9章深入地讲解了数据汇聚与联通、数据开发、数据体系建设、数据资产管理、数据服务体系建设等数据中台的核心模块,以及如何从0到1实现一个数据中台10~11章详细地讲解了数据中台的管理、运营和安全保障。




目录.jpg

赞誉

作者简介

前言

1章 数据中台:信息化的下一站1

1.1 数据中台产生的大背景2

1.2 数据中台的3个核心认知11

1.3 数据中台的3个发展阶段13

1.4 开启信息化的下一站16

2章 什么是数据中台20

2.1 解码数据中台22

2.2 数据中台的4个核心能力24

2.3 数据中台需要厘清的2个概念29

2.4 数据中台VS现有信息架构32

2.5 数据中台的业务价值与技术价值34

3章 数据中台建设与架构39

3.1 持续让数据用起来的价值框架40

3.2 数据中台建设方42

3.3 数据中台架构53

3.4 中台手记(一):我说服老板立项了57

4章 数据中台建设的评估与选择62

4.1 企业数据应用的成熟度评估63

4.2 企业数据中台建设的应用场景75

4.3 中台手记(二):打仗前手里得有一张“粮草”清单79

5章 数据汇聚联通:打破企业数据孤岛82

5.1 数据采集、汇聚的方法和工具83

5.2 数据交换产品90

5.3 数据存储的选择94

6章 数据开发:数据价值提炼工厂102

6.1 数据计算能力的4种类型104

6.2 离线开发110

6.3 实时开发117

6.4 算法开发120

6.5 中台手记(三):选一个适合自己的技术平台真的很重要132

7章 数据体系建设136

7.1 数据体系规划137

7.2 贴源数据层建设——全域数据统一存储140

7.3 统一数仓层建设——标准化的数据底座144

7.4 标签数据层建设——数据价值魅力所在157

7.5 应用数据层建设——灵活支撑业务需求179

7.6 中台手记():即将开启的数据淘金之旅183

8章 数据资产管理189

8.1 数据资产的定义和3个特征190

8.2 数据资产管理现状和挑战191

8.3 数据资产管理的4个目标192

8.4 数据资产管理在数据中台架构中的位置193

8.5 数据治理194

8.6 数据资产管理与数据治理的关系201

8.7 数据资产管理职能202

8.8 数据资产管理效果评估234

8.9 数据资产管理的7个成功要素239

8.10 中台手记(五):家里的这点家底可得管好了242

9章 数据服务体系建设245

9.1 补全数据应用的后“一公里”246

9.2 4种常见的数据服务249

9.3 3种常见的数据应用262

9.4 数据服务背后的产品技术274

9.5 中台手记(六):解决“数据应用后一公里”问题280

10章 数据中台运营机制284

10.1 数据中台运营效果评估模型285

10.2 数据中台运营的4个价值切入点287

10.3 数据资产运营291

10.4 数据成本运营316

10.5 数据中台运营的实践经验325

10.6 数据中台运营的要素与口诀330

10.7 中台手记(七):让数据用起来331

11章 数据安全管理335

11.1 数据安全面临的挑战336

11.2 贯穿数据全生命周期的数据安全管理体系344

11.3 大数据平台安全管理技术手段348

11.4 中台手记(八):数据安全!数据安全!数据安全!357

附录 6大行业解决方案架构图359


算法与数据中台:基于Google、Facebook与微博实践

定价:89.00元

出版社: 电子工业出版社

ISBN:9787121392887

版次:1

商品编码:12947564

品牌:博文视点

包装:平装

开本:16

出版时间:2020-08-01

用纸:胶版纸




内容简介2.jpg
本书作者依据在Google、Facebook、新浪微博及滴滴出行等中美互联网公司的实际工作经历,对算法技术、数据技术,以及围绕它们进行的技术中台建设实践进行了全面的探讨,并在此基础上对信息流推荐、计算广告及智能出行等核心互联网业务进行了案例剖析。本书具有广阔的技术视野,内容颇具深度,既适合互联网行业的技术从业者阅读,也适合计算机相关专业的高年级本科生、研究生阅读。通过阅读本书,读者能加深对机器学习、深度学习、大数据、分布式系统及技术中台等相关领域的认知与理解,并从中获得一定的启发和可借鉴的经验。


目录.jpg
1章 算法与数据中台概述 1
1.1 中台的背景和意义 1
1.2 算法与数据中台的功能价值 3
1.3 算法与数据中台的技术体系 4
1.4 算法与数据中台的实践场景 6
1.5 算法与数据中台的应用前景 7
1.6 本章总结 8
2章 中台技术之基础设施 10
2.1 研发效率系统 10
2.1.1 代码组织和构建 11
2.1.2 代码审查和任务管理 13
2.1.3 持续集成 15
2.1.4 通用压测平台 17
2.2 服务通信系统 19
2.2.1 跨进程通信框架 20
2.2.2 服务注册与发现 21
2.2.3 服务治理 24
2.3 监控报警系统 25
2.3.1 通用系统架构 25
2.3.2 指标计算模型 26
2.3.3 开源解决方案 27
2.4 链路跟踪系统 29
2.4.1 应用场景与设计目标 30
2.4.2 系统架构 30
2.5 本章总结 32
3章 中台技术之在线算法系统 33
3.1 物料检索系统 34
3.1.1 倒排检索 35
3.1.2 倒排索引实例 37
3.1.3 相似检索 38
3.1.4 相似检索实例 40
3.1.5 模型粗排 40
3.2 模型预估服务 41
3.2.1 整体架构 42
3.2.2 多框架支持 43
3.2.3 模型上线 44
3.2.4 在线预估 45
3.2.5 异构设备 46
3.2.6 性能优化 47
3.2.7 效果监控 49
3.3 策略机制引擎 50
3.3.1 整体架构 50
3.3.2 计算流解释器 51
3.3.3 Lua 解释器 52
3.4 集管理平台 53
3.4.1 多租户架构 53
3.4.2 集动态管理 54
3.4.3 集性能监控 57
3.4.4 配置动态分发 59
3.5 效果评估系统 60
3.5.1 背景介绍 61
3.5.2 设计模式 61
3.5.3 系统架构 62
3.5.4 指标计算 64
3.6 本章总结 65
4章 中台技术之机器学习平台 66
4.1 机器学习平台简介 66
4.1.1 机器学习的研发流程 67
4.1.2 机器学习的研发挑战 69
4.1.3 机器学习的研发技术 69
4.2 传统机器学习算法 73
4.2.1 线性算法 73
4.2.2 因子分解机算法 77
4.2.3 决策树算法 81
4.3 深度学习算法 84
4.3.1 发展简史 85
4.3.2 神经元模型 86
4.3.3 神经网络模型 87
4.3.4 神经网络的算法原理 88
4.4 模型框架基本原理 94
4.4.1 分布式计算架构 94
4.4.2 并行计算的同步机制 99
4.4.3 梯度更新算法 102
4.5 层结构的模型框架 108
4.5.1 Caffe 109
4.5.2 DistBelief 110
4.5.3 WBLEngine 112
4.5.4 小结 116
4.6 数据流结构的模型框架 116
4.6.1 TensorFlow 116
4.6.2 PyTorch 122
4.6.3 小结 126
4.7 复合结构的模型框架 126
4.7.1 场景特点 126
4.7.2 设计思路 127
4.7.3 架构与实现 128
4.7.4 性能优化 131
4.7.5 小结 132
4.8 机器学习平台简介 132
4.8.1 单业务线开发阶段 132
4.8.2 平台化建设阶段 133
4.8.3 业界产品 134
4.9 新浪微博 WBL 机器学习平台 135
4.9.1 用户作界面 136
4.9.2 管理中心 138
4.9.3 数据中心 140
4.9.4 调度中心 141
4.9.5 智能中心 144
4.9.6 模型中心 145
4.10 本章总结 147
5章 中台技术之分布式数据库 148
5.1 分布式数据库概述 148
5.1.1 SQL 数据库 148
5.1.2 SQL 数据库 149
5.1.3 NewSQL 数据库 150
5.2 分布式数据库技术 150
5.2.1 ACID 理论 151
5.2.2 CAP 理论 151
5.2.3 BASE 理论 153
5.2.4 数据分片策略 154
5.2.5 数据复制策略 157
5.2.6 Gossip 协议 158
5.2.7 分布式一致性协议 160
5.2.8 分布式事务协议 167
5.3 分布式数据库产品 170
5.3.1 Redis 170
5.3.2 Google BigTable 170
5.3.3 Google Spanner 173
5.4 LaserDB 分布式数据库 177
5.4.1 系统架构 178
5.4.2 数据模型 179
5.4.3 分片策略 180
5.4.4 批量加载 181
5.4.5 同步机制 182
5.4.6 高可用架构 184
5.4.7 高性能方案 185
5.5 LaserDB 应用案例分析 188
5.5.1 数据缓存 188
5.5.2 特征服务 189
5.5.3 向量存储 190
5.5.4 样本拼接 190
5.6 本章总结 191
6章 中台技术之大数据平台 192
6.1 大数据平台概述 192
6.1.1 大数据的特点 192
6.1.2 大数据平台的技术栈 193
6.2 分布式协调系统 194
6.2.1 Google Chubby 195
6.2.2 Apache ZooKeeper 196
6.2.3 Consul 197
6.3 集管理系统 199
6.3.1 Google Borg 200
6.3.2 Kubernetes 202
6.3.3 Apache YARN 203
6.4 分布式文件系统 205
6.4.1 Google GFS 205
6.4.2 Apache HDFS 207
6.4.3 Dropbo MagicPocket 209
6.5 消息管道系统 210
6.5.1 Google PubSub 211
6.5.2 Apache Kafka 213
6.6 分布式计算系统 214
6.6.1 MapReduce 214
6.6.2 Apache Spark 216
6.6.3 Apache Flink 218
6.6.4 Apache Beam 220
6.7 数据仓库与分布式查询系统 221
6.7.1 Google BigQuery 222
6.7.2 Apache Hive 223
6.7.3 Facebook Presto 224
6.7.4 Facebook Scuba 226
...........


暂时没有内容介绍,请见谅!
暂时没有目录,请见谅!