书籍详情
《深度学习之图像识别:核心技术与案例实战》[20M]百度网盘|亲测有效|pdf下载
  • 深度学习之图像识别:核心技术与案例实战

  • 出版社:机械工业出版社
  • 出版时间:2019-04-01
  • 热度:9008
  • 上架时间:2024-06-30 08:52:20
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

内容简介
  本书全面介绍了深度学习在图像处理领域中的核心技术与应用。书中不但重视基础理论的讲解,而且从第4章开始的每章都提供了一到两个不同难度的案例供读者实践,读者可以在已有代码的基础上进行修改和改进,从而加深对所学知识的理解。本书共10章,首先从深度学习的基础概念开始,介绍了神经网络的基础知识和深度学习中的优化技术;然后系统地介绍了深度学习中与数据相关的知识,包括经典数据集的设计、数据集的增强以及数据的获取与整理;接着重点针对图像开发领域,用3章内容系统地介绍了深度学习在图像分类、图像分割和目标检测3个领域的核心技术与应用,这些内容的讲解均结合实战案例展开;另外,还对深度学习中损失函数的发展、数据和模型的可视化以及模型的压缩和优化进行了详细介绍,为读者设计和训练更加实用的模型提供了指导;最后以微信小程序平台为依托,介绍了微信小程序前后端开发技术,完成了深度学习的模型部署,让本书的内容形成了一个完整的闭环。本书理论与实践结合,深度与广度兼具,特别适合深度学习领域的相关技术人员与爱好者阅读,尤其适合基于深度学习的图像从业人员阅读,以全方位了解深度学习在图像领域中的技术全貌。另外,本书还适合作为相关培训机构的深度学习教材使用。
目录
前言
第1章 神经网络基础
1.1 神经网络的生物基础与数学模型
1.1.1 神经元
1.1.2 感知机
1.1.3 BP算法
1.2 卷积神经网络基础
1.2.1 卷积神经网络的基本结构
1.2.2 卷积与权值共享
1.2.3 感受野与池化
第2章 深度学习优化基础
2.1 深度学习主流开源框架
2.1.1 Caffe简介
2.1.2 TensorFlow简介
2.1.3 PyTorch简介
2.1.4 Theano简介
2.1.5 Keras简介
2.1.6 MXNet简介
2.1.7 Chainer简介
2.2 网络优化参数
2.2.1 常用激活函数
2.2.2 参数初始化方法
2.2.3 最优化方法
2.2.4 归一化方法
2.2.5 正则化方法
第3章 深度学习中的数据
3.1 深度学习通用数据集的发展
3.1.1 MNIST数据集
3.1.2 CIFAR10和CIFAR100数据集
3.1.3 PASCAL数据集
3.1.4 ImageNet数据集
3.1.5 Microsoft COCO数据集
3.2 常见的计算机视觉任务数据集
3.2.1 人脸数据集
3.2.2 自动驾驶数据集
3.2.3 医学数据集
3.3 数据增强
3.3.1 有监督数据增强
3.3.2 无监督数据增强
3.4 数据的收集与标注
3.4.1 数据收集
3.4.2 数据标注
3.4.3 数据清洗与整理
第4章 图像分类
4.1 图像分类基础
4.1.1 图像分类问题
4.1.2 深度学习图像分类发展简史
4.1.3 评测指标与优化目标
4.1.4 图像分类的挑战
4.2 移动端实时表情分类实战
4.2.1 项目背景
4.2.2 数据预处理
4.2.3 项目方案
4.2.4 模型训练与测试
4.2.5 项目总结
4.3 细粒度图像分类实战
4.3.1 项目背景
4.3.2 项目方案
4.3.3 模型训练与测试
4.3.4 参数调试
4.3.5 项目总结
第5章 图像分割
5.1 传统图像分割方法
5.1.1 阈值法
5.1.2 区域生长法与超像素
5.1.3 图切割
5.1.4 活动轮廓模型
5.2 深度学习图像分割
5.2.1 基本流程
5.2.2 反卷积
5.2.3 多尺度与感受野
5.2.4 CRF方法
5.2.5 Image Matting与图像融合
5.3 移动端实时图像分割项目
5.3.1 项目背景
5.3.2 项目方案
5.3.3 模型训练与总结
5.4 一个实时肖像换背景项目
5.4.1 项目背景
5.4.2 项目方案
5.4.3 模型训练与测试
5.4.4 项目总结
第6章 目标检测
6.1 目标检测基础
6.1.1 检测窗口选择
6.1.2 特征提取
6.1.3 分类器
6.1.4 V-J人脸检测算法
6.2 深度学习目标检测方法
6.2.1 Selective search与R-CNN
6.2.2 RoI Pooling与SPPNet
6.2.3 Fast R-CNN与Faster R-CNN
6.2.4 YOLO方法
6.2.5 SSD方法
6.2.6 目标检测中的关键技术
6.3 实战Faster-R-CNN目标检测
6.3.1 项目背景
6.3.2 py-faster-rcnn框架解读
6.3.3 模型定义与分析
6.3.4 模型训练与测试
6.3.5 项目总结
第7章 数据与模型可视化
7.1 数据可视化
7.1.1 低维数据可视化
7.1.2 高维数据可视化
7.2 模型可视化
7.2.1 模型结构可视化
7.2.2 模型权重可视化
7.2.3 特征图可视化
7.3 可视化案例
7.3.1 项目背景
7.3.2 数据接口定义
7.3.3 网络结构定义
7.3.4 可视化代码添加
7.3.5 可视化训练指标
第8章 模型压缩
8.1 模型压缩方法
8.1.1 模型设计压缩
8.1.2 网络剪枝与量化
8.1.3 张量分解
8.1.4 模型蒸馏与迁移学习
8.2 模型压缩实战
8.2.1 网络分析
8.2.2 输入尺度和第一层卷积设计
8.2.3 网络宽度与深度压缩
8.2.4 弥补通道损失
8.2.5 总结
第9章 损失函数
9.1 分类任务损失
9.1.1 什么是0-1 loss
9.1.2 熵与交叉熵loss
9.1.3 softmax loss及其变种
9.1.4 KL散度
9.1.5 Hinge loss简介
9.1.6 Exponential loss与Logistic loss
9.1.7 多标签分类任务loss
9.2 回归任务损失
9.2.1 L1 loss与L2 loss
9.2.2 L1 loss与L2 loss的改进
9.3 常见图像任务与loss使用
9.3.1 图像基础任务
9.3.2 风格化与图像复原,超分辨重建
9.3.3 生成对抗网络
9.3.4 总结
第10章 模型部署与上线
10.1 微信小程序前端开发
10.1.1 小程序的技术特点与定位
10.1.2 Web前端基础
10.1.3 小程序开发工具
10.1.4 小程序前端目录
10.1.5 小程序前端开发
10.2 微信小程序服务端开发
10.2.1 域名注册与管理
10.2.2 服务端框架简介
10.2.3 算法搭建与实现
10.3 Caffe环境配置
10.3.1 依赖库安装
10.3.2 Caffe编译安装
前言
  前言
  机器学习、深度学习、人工智能,这些关键词在最近几年“声名鹊起”。以深度学习为代表的无监督机器学习技术在图像处理、语音识别和自然语言处理等领域里频频取得新的突破。但深度学习其实并不是一门全新的学科,其历史可以追溯到20世纪40年代。
  深度学习背后的核心技术包括神经网络的结构设计和最优化方法等,其理论体系虽然有一定进展但是尚不完备。可以说,当前的主流深度学习技术是一门应用性极强的工程技术,这种尚不完备的理论加上具有较高门槛的应用工程特点,对于初学者来说具有一定的困难。如何系统性地了解理论知识,又能够紧随理论进行全面的实践,成为一名合格的图像处理领域的深度学习算法工程师,这是本书所要解决的问题。
  笔者有超过6年的图像行业背景,最近几年也多以深度学习技术为基础进行相关项目的开发,在多年的知识积累和项目实践中,总结出了大量的经验,浓缩成了这本书。本书从深度学习的背景和基础理论开始讲起,然后介绍了深度学习中的数据及图像处理中的几大重要方向,并介绍了神经网络的可视化、优化目标、模型的优化和模型的线上部署。
  本书内容由浅入深,讲解图文并茂,紧随工业界和学术界的最新发展,理论和实践紧密结合,给出了大量的图表与案例分析。本书抛开了过多的数学理论,完整地剖析了深度学习在图像处理领域中各个维度的重要技术,而不是只停留于理论的阐述和简单的结果展示,更是从夯实理论到完成实战一气呵成。相信读者跟随着本书进行学习,将会对深度学习领域的图像处理技术和其在实际开发中的应用有更深的理解。
精彩书摘
  第1章 神经网络基础
  自计算机发展以来,人们逐渐使用计算机来代替繁杂冗余的计算及任务。在传统的编程方法中,我们需要告诉计算机如何去做,人为地将大问题划分为许多小问题,精确定义任务以便计算机执行。这些方法在解决图像识别、语音识别和自然语言处理等领域的疑难问题时,往往效果不佳;而使用神经网络处理问题时,不需要我们告诉计算机如何分解问题,而是由神经网络自发地从观测数据中进行学习,并找到解决方案。
  深度学习作为目前最热门的技术研究方向之一,为许多通过传统方法解决不了的问题提供了另一种思路。本书面对的读者需要具备基本的数学知识和计算机知识。本节将对神经网络的基础做简单的回顾。
  本章将从以下两个方面进行介绍。
  ·1.1节将从神经元到感知机再到BP算法,对神经网络的基础做概述。
  ·1.2节将对卷积神经网络的结构、核心概念进行简单介绍,这是当前深度学习模型的基础。
  1.1 神经网络的生物基础与数学模型
  深度学习并不是近几年才诞生的全新技术,而是基于传统浅层神经网络发展起来的深层神经网络的别称。本节将从神经网络的生物学基础到它的优化算法,对神经网络的基础做概述。
  1.1.1 神经元
  人工神经网络(Artificial Neural Network)简称神经网络(Neural Network,NN),是人类模拟生物神经网络的结构和功能提出的数学模型,广泛应用于计算机视觉等领域。
  人工神经网络与生物神经网络有大量的相似之处,例如两者最基础的单元都是神经元。神经元又称神经细胞,是生物神经网络的基本组成,其外观和大小在神经系统中的差异很大,但都具有相同的结构体、胞体、树突和轴突。
  胞体又名为核周体,由内质网、微管、游离核糖体、神经丝和核组成。轴突和树突是神经元的突起,在神经元间传递电信号。神经元的功能是接受信号并对其做出反应、传导兴奋、处理并储存信息以及发生细胞之间的联结等,有这些功能,动物才能迅速对环境的变化做出整合性的反应。