深度学习大佬:详解卷积神经网络

卷积神经网络(Convolutional Neural Network)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。

500

咕泡学院---秦老师

曾就职于阿里巴巴和谷歌等大型公司,一直研发搜索引擎相关搜索算法,2012年联合创立公司与政府共建北京最早的96106店招平台,2014年创立俩家公司,易达出行和蜜柚科技,并担任CTO,10余年机器学习和深度学习算法经验,擅长大型软件架构设计,技术团队搭建,机器学习与深度学习算法工程师,在算法领域有自己独创的核心AI算法。

ConvNets尝试过程

500

首个卷积神经网络模型(多伦多大学)(LeCun 88,89)

共320个运用反向传播算法训练的实例

带有步幅的卷积(子样本)

紧密相连的池化过程

500

在贝尔实验室建立的首个“真实”卷积神经网络模型(LeCun et al 89)

运用反向传播算法进行训练

USPS 编码数字:7300次训练,2000次测试

带有步幅的卷积

紧密相连的池化过程

500

卷积神经网络(vintage 1990)

滤波-双曲正切——池化——滤波-双曲正切——池化

500

多重卷积网络

架构

500

卷积神经网络的结构

卷积神经网络的卷积运算过程大致如下:

输入图像通过三个可训练的滤波器组进行非线性卷积,卷积后在每一层产生特征映射图,然后特征映射图中每组的四个像素在进行求和、加权值、加偏置,在此过程中这些像素在池化层被池化,最终得到输出值。

500

卷积神经网络的整体结构:

归一化——滤波器组——非线性计算——池化

归一化:图像白化处理的变形(可选择性)

减法运算:平均去除,高通滤波器进行滤波处理

 除法运算:局部对比规范化,方差归一化

滤波器组:维度拓展,映射

非线性:稀疏化,饱和,侧抑制

精馏,成分明智收缩,双曲正切等

池化: 空间或特征类型的聚合

最大化,Lp范数,对数概率

500

LeNet5

卷积神经网络简化模型

MNIST  (LeCun 1998)

阶段1:滤波器组——挤压——最大池化

阶段2:滤波器组——挤压——最大池化

阶段3:标准2层 MLP

500

多特征识别(Matan et al 1992)

每一层都是一个卷积层

    单一特征识别器 ——SDNN

500

滑动窗口卷积神经网络+加权有限状态机

应用

500

卷积神经网络的应用范围

信号以(多维度)数组的形式出现

具有很强局部关联性的信号

特征能够在任何位置出现的信号

目标物不因翻译或扭曲而变化的信号

一维卷积神经网络:时序信号,文本

文本分类

音乐体裁分类

用于语音识别的声学模型

时间序列预测

二维卷积神经网络:图像,时间-频率表征(语音与音频)

物体检测,定位,识别

三维卷积神经网络:视频,立体图像,层析成像

视频识别/理解

生物医学图像分析

高光谱图像分析

500

人脸检测(Vaillant et al.93, 94)

应用于大图像检测的卷积神经网络

多尺度热量图

对候选图像的非最大抑制

对256X256图像进行6秒稀疏

500

人脸检测的艺术结果状态

500

卷积神经网络在生物图像切割方面的应用

生物图像切割(Ning et al. IEEE-TIP 2005)

运用卷积神经网络在大背景下进行像素标记

卷积神经网络拥有一个像素窗口,标记中央像素

运用一个有条件的随机域进行清除

3D版连接体(Jain et al.2007)

500

场景解析/标记

500

场景解析/标记:多尺度卷积神经网络结构

每一个输出值对应一个大的输入背景

46X46全像素窗口;92X92 1/2像素窗口;182X182 1/4像素窗口

[7X7卷积运算]->[2X2池化] ->[7X7卷积运算] ->[2X2池化] ->[7X7卷积运算] ->

监督式训练全标记图像

500

方法:通过超级像素区域选出主要部分

输入图像——超像素边界参数——超像素边界——通过超像素进行主要部分投票处理——类别与区域边界对齐

多尺度卷积网络——卷积网络特征(每个像素中d=768)卷积分类——“soft”分类得分

500

场景分析/标记

无前期处理

逐帧进行

在Vittex-6 FPGA硬件上以50ms一帧运行卷积网络

但是在以太网上传输特征限制了系统的表现

500

针对远程自适应机器人视觉的卷积网络(DARPA LAGR项目2005-2008)

输入图像

标记

分类输出

500

非常深的卷积网络架构

小内核,较少二次抽样(小部分二次抽样)

VGG

GoogleNet

Resnet

500

使用卷积网络进行对象检测和定位

500

分类+定位:多重移动窗口

将带多重滑动窗口的卷积网络应用到图像上

重要提示:将卷积网络应用到一张图片上非常便宜

只要计算整个图像的卷积并把全连接层复制

500

分类+定位:滑动窗口+限定框回归

将带多重滑动窗口的卷积网络应用到图像上

对每个窗口,预测一个类别和限定框参数

即便目标不是完全包含在浏览窗口中,卷积网络也能猜测它认为这个目标是什么。

500

Deep Face

Taigman等 CVPR 2014

队列

卷积网络

度量学习

Facebook开发的自动标记方法

每天8亿张图片

500

使用卷积网络进行姿势预估和属性恢复

深度属性模型的姿势对齐网络

Zhang等 CVPR 2014 (Facebook AI Research)

500

人物检测和姿势预估

Tompson,Goroshin,Jain,Lecun,Bregler等 arxiv(2014)

500

监督卷积网络画图

使用卷积网络来画图

Dosovitskyi等 arxiv (1411:5928)

500

监督卷积网络画图

生成椅子

特征空间对椅子进行计算

500

全局(端对端)学习:能量模型

输入——卷积网络(或其他深度架构)——能量模块(潜在变量、输出)——能量

使得系统中每个模块都能进行训练。

所有模块都是同时训练的,这样就能优化全局的损失函数。

包括特征提取器,识别器,以及前后处理程序(图像模型)。

问题:反向传播在图像模型中倾斜

500

深度卷积网络(还有其他深度神经网络)

训练样本:(Xi,Yi)k=1 到 k

对象函数(边缘型损失= ReLU)

最后

大佬还整理了系列化的人工智能知识点,随机截了张图你们可以参考一下,感兴趣的话可以下方留言,我会及时回复你们的。

500

站务

全部专栏