书籍详情
《21个项目玩转深度学习:基于TensorFlow的实践详解》[30M]百度网盘|亲测有效|pdf下载
  • 21个项目玩转深度学习:基于TensorFlow的实践详解

  • 出版社:电子工业出版社
  • 出版时间:2018-03-01
  • 热度:8517
  • 上架时间:2024-06-30 08:52:20
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

编辑推荐
  1.以实践、应用导向。本书希望从实践出发,用具体的例子来引导读者学习深度学习技术和TensorFlow编程技巧。2.清晰、有深度的介绍。尽量用简单的语言来描述算法的原理,做到清晰有条理。3.基于TensorFlow 新版本。TensorFlow的发展非常迅速,本书代码全部基于TensorFlow 的1.4版本(包括1.4.0和1.4.1),并介绍了TensorFlow的一些新特性。
内容简介
  《21个项目玩转深度学习——基于TensorFlow的实践详解》以实践为导向,深入介绍了深度学习技术和TensorFlow框架编程内容。通过本书,读者可以训练自己的图像识别模型、进行目标检测和人脸识别、完成一个风格迁移应用,还可以使用神经网络生成图像和文本,进行时间序列预测、搭建机器翻译引擎,训练机器玩游戏。全书共包含21个项目,分为深度卷积网络、RNN网络、深度强化学习三部分。读者可以在自己动手实践的过程中找到学习的乐趣,了解算法和编程框架的细节,让学习深度学习算法和TensorFlow的过程变得轻松和高效。本书代码基于TensorFlow 1.4及以上版本,并介绍了TensorFlow中的一些新特性。
作者简介
  何之源,现为复旦大学人工智能方向在读硕士生。针对Tensorflow早期学习案例不足的情况,在知乎等网站上发表了多篇实践文章,获得了广大读者的肯定。何之源于2012年通过信息学竞赛保送进入复旦大学学习,2016获得复旦大学理学学士学位,并荣获复旦大学优秀学生的称号。同年进入复旦大学计算机学院攻读硕士学位。在编程和机器学习领域有多年一线实践经验。
目录
前言
第1章 MNIST机器学习入门
1.1 MNIST数据集
1.1.1 简介
1.1.2 实验:将MNIST数据集保存为图片
1.1.3 图像标签的独热表示
1.2 利用TensorFlow识别MNIST
1.2.1 Softmax回归
1.2.2 两层卷积网络分类
1.3 总结
第2章 CIFAR-10与ImageNet图像识别
2.1 CIFAR-10数据集
2.1.1 CIFAR-10数据集简介
2.1.2 下载CIFAR-10数据
2.1.3 TensorFlow的数据读取机制
2.1.4 实验:将CIFAR-10数据集保存为图片形式
2.2 利用TensorFlow训练CIFAR-10识别模型
2.2.1 数据增强
2.2.2 CIFAR-10识别模型
2.2.3 训练模型
2.2.4 在TensorFlow中查看训练进度
2.2.5 测试模型效果
2.3 ImageNet图像识别模型
2.3.1 ImageNet数据集简介
2.3.2 历代ImageNet图像识别模型
2.4 总结
第3章 打造自己的图像识别模型
3.1 微调的原理
3.2 数据准备
3.3 使用TensorFlow Slim微调模型
3.3.1 下载TensorFlow Slim的源代码
3.3.2 定义新的datasets文件
3.3.3 准备训练文件夹
3.3.4 开始训练
3.3.5 训练程序行为
3.3.6 验证模型准确率
3.3.7 TensorBoard可视化与超参数选择
3.3.8 导出模型并对单张图片进行识别
3.4 总结
第4章 Deep Dream模型
4.1 Deep Dream的技术原理
4.2 TensorFlow中的Deep Dream模型实践
4.2.1 导入Inception模型
4.2.2 生成原始的Deep Dream图像
4.2.3 生成更大尺寸的Deep Dream图像
4.2.4 生成更高质量的Deep Dream图像
4.2.5 最终的Deep Dream模型
4.3 总结
第5章 深度学习中的目标检测
5.1 深度学习中目标检测的原理
5.1.1 R-CNN的原理
5.1.2 SPPNet的原理
5.1.3 Fast R-CNN的原理
5.1.4 Faster R-CNN的原理
5.2 TensorFlow Object Detection API
5.2.1 安装TensorFlow Object Detection API
5.2.2 执行已经训练好的模型
5.2.3 训练新的模型
5.2.4 导出模型并预测单张图片
5.3 总结
第6章 人脸检测和人脸识别
6.1 MTCNN的原理
6.2 使用深度卷积网络提取特征
6.2.1 三元组损失的定义
6.2.2 中心损失的定义
6.3 使用特征设计应用
6.4 在TensorFlow中实现人脸识别
6.4.1 项目环境设置
6.4.2 LFW人脸数据库
6.4.3 LFW数据库上的人脸检测和对齐
6.4.4 使用已有模型验证LFW数据库准确率
6.4.5 在自己的数据上使用已有模型
6.4.6 重新训练新模型
6.4.7 三元组损失和中心损失的定义
6.5 总结
第7章 图像风格迁移
7.1 图像风格迁移的原理
7.1.1 原始图像风格迁移的原理
7.1.2 快速图像风格迁移的原理
7.2 在TensorFlow中实现快速风格迁移
7.2.1 使用预训练模型
7.2.2 训练自己的模型
7.2.3 在TensorBoard中监控训练情况
7.2.4 项目实现细节
7.3 总结
第8章 GAN和DCGAN入门
8.1 GAN的原理
8.2 DCGAN的原理
8.3 在TensorFlow中用DCGAN生成图像
8.3.1 生成MNIST图像
8.3.2 使用自己的数据集训练
8.3.3 程序结构分析:如何将图像读入模型
8.3.4 程序结构分析:可视化方法
8.4 总结
第9章 pix2pix模型与自动上色技术
9.1 cGAN的原理
9.2 pix2pix模型的原理
9.3 TensorFlow中的pix2pix模型 1
9.3.1 执行已有的数据集
9.3.2 创建自己的数据集
9.4 使用TensorFlow为灰度图像自动上色
9.4.1 为食物图片上色
9.4.2 为动漫图片上色
9.5 总结
第10章 超分辨率:如何让图像变得更清晰
10.1 数据预处理与训练
10.1.1 去除错误图片
10.1.2 将图像裁剪到统一大小
10.1.3 为代码添加新的操作
10.2 总结
第11章 CycleGAN与非配对图像转换
11.1 CycleGAN的原理
11.2 在TensorFlow中用训练CycleGAN模型
11.2.1 下载数据集并训练
11.2.2 使用自己的数据进行训练
11.3 程序结构分析
11.4 总结
第12章 RNN基本结构与Char RNN文本生成
12.1 RNN的原理
12.1.1 经典RNN的结构
12.1.2 N VS 1 RNN的结构
12.1.3 1 VS N RNN的结构
12.2 LSTM的原理
12.3 Char RNN的原理
12.4 TensorFlow中的RNN实现方式
12.4.1 实现RNN的基本单元:RNNCell
12.4.2 对RNN进行堆叠:MultiRNNCell
12.4.3 BasicRNNCell和BasicLSTMCell的output
12.4.4 使用tf.nn.dynamic_rnn展开时间维度
12.5 使用TensorFlow实现Char RNN
12.5.1 定义输入数据
12.5.2 定义多层LSTM模型
12.5.3 定义损失
12.5.4 训练模型与生成文字
12.5.5 更多参数说明
12.5.6 运行自己的数据
12.6 总结
第13章 序列分类问题详解
13.1 N VS 1的RNN结构
13.2 序列分类问题与数据生成
13.3 在TensorFlow中定义RNN分类模型
13.3.1 定义模型前的准备工作
13.3.2 定义RNN分类模型
13.3.3 定义损失并进行训练
13.4 模型的推广
13.5 总结
第14章 词的向量表示:word2vec与词嵌入
14.1 为什么需要做词嵌入
14.2 词嵌入的原理
14.2.1 CBOW实现词嵌入的原理
14.2.2 Skip-Gram实现词嵌入的原理
14.3 在TensorFlow中实现词嵌入
14.3.1 下载数据集
14.3.2 制作词表
14.3.3 生成每步的训练样本
14.3.4 定义模型
14.3.5 执行训练
14.3.6 可视化
14.4 总结
第15章 在TensorFlow中进行时间序列预测
15.1 时间序列问题的一般形式
15.2 用TFTS读入时间序列数据
15.2.1 从Numpy数组中读入时间序列数据
15.2.2 从CSV文件中读入时间序列数据
15.3 使用AR模型预测时间序列
15.3.1 AR模型的训练
15.3.2 AR模型的验证和预测
15.4 使用LSTM模型预测时间序列
15.4.1 LSTM模型中的单变量时间序列预测
15.4.2 LSTM模型中的多变量时间序列预测
15.5 总结
第16章 神经网络机器翻译技术
16.1 Encoder-Decoder模型的原理
16.2 注意力机制
16.3 使用TensorFlow NMT搭建神经网络翻译引擎
16.3.1 示例:将越南语翻译为英语
16.3.2 构建中英翻译引擎
16.4 TensorFlow NMT源码简介
16.5 总结
第17章 看图说话:将图像转换为文字
17.1 Image Caption技术综述
17.1.1 从Encoder-Decoder结构谈起
17.1.2 将Encoder-Decoder应用到Image Caption任务中
17.1.3 对Encoder-Decoder的改进1:加入注意力机制
17.1.4 对Encoder-Decoder的改进2:加入高层语义
17.2 在TensorFlow中实现Image Caption
17.2.1 下载代码
17.2.2 环境准备
17.2.3 编译和数据准备
17.2.4 训练和验证
17.2.5 测试单张图片
17.3 总结
第18章 强化学习入门之Q Learning
18.1 强化学习中的几个核心概念
18.2 Q Learning的原理与实验
18.2.1 环境定义
18.2.2 Q函数
18.2.3 Q函数的学习策略
18.2.4 ∈-greedy策略
18.2.5 简单的Q Learning示例
18.2.6 更复杂的情况
18.3 总结
第19章 强化学习入门之SARSA算法
19.1 SARSA 算法的原理
19.1.1 通过与Q Learning对比学习SARSA算法
19.1.2 off-policy与on-policy
19.2 SARSA 算法的实现
19.3 总结
第20章 深度强化学习:Deep Q Learning
20.1 DQN算法的原理
20.1.1 问题简介
20.1.2 Deep Q Network
20.1.3 训练方法
20.2 在TensorFlow中运行DQN算法
20.2.1 安装依赖库
20.2.2 训练
20.2.3 测试
20.3 在TensorFlow中DQN算法的实现分析
20.4 总结
第21章 策略梯度算法
21.1 策略梯度算法的原理
21.1.1 Cartpole游戏
21.1.2 策略网络
21.1.3 训练策略网络
21.2 在TensorFlow中实现策略梯度算法
21.2.1 初始化
21.2.2 定义策略网络
21.2.3 训练
21.3 总结
前言
  我们正处在一个日新月异、飞速变革的时代,层出不穷的新技术每天都在冲击和改变我们的生活。人工智能无疑是其中最受关注、也是影响最深远的技术领域。它为计算机插上了翅膀,演变出许多从前根本无法想象的新技术、新应用。AlphaGoZero,一台没有任何先验知识的人工智能机器,可以在几天内通过自我博弈成长为世界第一的围棋大师,超越人类几千年积累的经验;风格迁移应用能够自动将用户的照片转变为著名的绘画艺术风格;机器可以在零点几秒内完成翻译,把一种语言译成另一种语言。此外,有关人脸识别、自动驾驶等新技术的应用也都纷纷开始落地。在过去的几年内,人工智能技术不仅在学术上取得了巨大的突破,也开始走向寻常百姓家,真正为人们的生活提供便利。
  本书主要为读者介绍这次人工智能浪潮最重要的组成部分——深度学习技术,使用的编程框架是谷歌的TensorFlow。借助于谷歌巨大的影响力,TensorFlow一经发布就引起了广泛的关注,目前(截止至2017年底)TensorFlow在Github上已经有了8万4千多个Star,是所有深度学习框架中最多的。
  鉴于目前市场上已有很多深度学习和TensorFlow的入门书籍,下面我们着重谈一谈本书与它们的不同之处,主要有以下几点:
实践、应用导向。深度学习需要深厚的数理基础,对于初学者来说不是很友好。本书希望从实践出发,用具体的例子来引导读者学习深度学习技术和TensorFlow编程技巧。我们主要从实用性和趣味性两个方面考量,选择了21个实践项目,其中既有MNIST图像识别这样的入门项目,也有目标检测、人脸识别、时间序列预测这样的实用性项目,还有一些诸如DeepDream这样的趣味性项目。读者可以在实践中找到乐趣,逐渐进步,让学习深度学习和TensorFlow的过程不再那么痛苦。
清晰、有深度的介绍。在写书过程中,我们尽量用简单的语言来描述算法的原理,做到清晰有条理。此外,深度学习是一门还在快速发展的新技术,限于篇幅所限,很多内容不能完全写到书中,我们在大部分章节的末尾列出了拓展阅读材料,有兴趣的读者可以参考拓展材料进一步学习细节知识。
基于TensorFlow1.4版本。TensorFlow的发展非常迅速,本书代码全部基于TensorFlow最新的1.4版本(包括1.4.0和1.4.1),并介绍了TensorFlow的一些新特性,如TimeSeries模块(1.3版本添加)、新的MultiRNNCell函数(1.2版本更改)等。本书的代码会在如下Github地址上提供,并会随新的TensorFlow版本的发布而同步更新:https://github.com/hzy46/Deep-Learning-21-Examples。
  本书代码推荐的运行环境为:Ubuntu14.04,Python2.7、TensorFlow1.4.0。请尽量使用类Unix系统和Python2来运行本书的代码。
 
本书主要内容
  本书共包括21章,内容编排如下:
  第1到第11章主要介绍深度卷积神经相关的项目。其中,第1~3章属于入门章节,主要讨论深度学习中最基础的图像识别问题。第4~7章讨论了其他计算机视觉相关的实践案例,如目标识别、人脸识别、图像风格迁移等。最后,8~11章介绍了GAN模型和它的几个重要变体。
  第12到第17章主要介绍RNN、LSTM相关的项目。RNN、LSTM通常用来处理序列型数据,这里第12章是一个入门章节,会详细介绍RNN和LSTM的原理、实现方法和一个应用实例——CharRNN。第13到17章讨论一些更复杂也更具体的案例,如序列分类、词嵌入表示、时间序列预测、机器翻译等。
  第18到第21章主要介绍强化学习相关的项目。作为基础,第18、19章分别介绍了相对简单的QLearning和SARSA算法,第20章和第21章介绍了更复杂的DQN和策略梯度算法。
  如何阅读本书
  在阅读此书前,读者应当了解Linux系统的基本操作,并会使用Python进行简单的编程,此外读者还需具备基础的机器学习知识。这本书章节的安排是依据读者对深度学习的了解循序渐进设立的,建议初学者从前至后阅读。由于深度学习和TensorFlow都不大易于理解,我建议读者分几遍阅读本书:
第一遍先简单的浏览一下,看一看书中都有哪些实践项目。当对基本的概念有初步的理解时,就可以尝试配置一下开发环境。
第二遍,从前至后,阅读各章中算法的原理,并运行相应的实践项目。在这个过程中,希望读者能在自己动手的过程中找到学习的乐趣。读者可以对照源代码和书中的内容,深入学习各个模型的细节,此外还可以根据自己的需求对代码进行修改。本书会涉及到大量TensorFlow中的函数,由于篇幅限制,不可能将每一个函数都介绍一遍,书中只会对比较重要的函数进行介绍,读者可以参考TensorFlow的官方文档,查看其他函数的功能说明。
第三遍再根据需要对照源程序看相关章节。此外,读者还可以参阅章节最后的拓展阅读来作进一步学习。最后,如果你是一名深度学习和TensorFlow的精通者,也可以根据需要直接跳读到相关章节,查阅你需要的内容。
  
致谢
  我首先要感谢我的父母,是他们将我养育成人,父母永远健康快乐是我最大的心愿。
  感谢互联网时代,感谢网络上数不清的优秀开发者和博主,也感谢谷歌的开源精神,让我们可以如此紧跟时代最前沿的技术,并为技术的进步做出自己微薄的贡献。
  我还要真诚地感谢电子工业出版社对这本书的认可和兴趣。感谢电子工业出版社的孙学瑛女士,她的热情推动最终促成了我与电子工业出版社的合作。感谢孙亚东编辑,他对本书的重视和诚恳的建议,在写作过程中给了我莫大的帮助。
  最后,感谢刘婧源同学给本书提出的宝贵的意见。
  由于本人水平有限,书中不足及错误之处在所难免,敬请专家和读者给予批评指正。如果您想和我进行技术交流,可以发送意见反馈邮件至hzydl21@163.com,亦可在知乎上找到我:https://www.zhihu.com/people/he-zhi-yuan-16/,此外还可以访问书友论坛//forum.broadview.com.cn。
  
何之源
  2018年1月1日