当前位置: 首页>編程日記>正文

计算机视觉入门到实战教程

计算机视觉入门到实战教程

1 机器学习流程

  1. 数据获取
  2. 特征工程(重难点)
  3. 建立模型
  4. 评估与应用

常规套路:

  1. 收集数据并给定标签
  2. 训练一个分类器
  3. 测试与评估

2 什么是深度学习?

深度学习是一种基于无监督特征学习与特征层次结构的学习模型,用于解决代替人工实现特征工程的一种方法

深度学习(神经网络)是黑盒子

深度学习理论:

  1. 掌握深度学习模型的正向传播和反向传播,特别是链式求导法则
  2. 掌握激活函数和目标函数的作用,能够选择合适的激活函数和目标函数

特征工程的作用:

  • 数据特征决定了模型的上限
  • 预处理和特征提取是最核心的
  • 算法与参数选择决定了如何逼近这个上限

image-20220224170404427

image-20220224170451287

3 特征如何提取?

深度学习---》一种特征提取的方法

4 图像分类

图像表示:计算机眼中的图像(一张图片被表示成三维数组形式[矩阵],每个像素值从0(暗)-255(亮))

例如:300x100x3----》 300x100是图像尺寸(长x宽) 3是3个颜色通道(RGB彩色:红绿蓝)

image-20220222195042066

image-20220224190013564

image-20220224190120884

5 K近邻

image-20220222195555885

计算流程:

  1. 计算已知类别数据集中的点与当前点的距离
  2. 按照距离依序排序
  3. 选取与当前点距离最小的K个点
  4. 确定前K个点所在类别的出现概率
  5. 返回前K个点出现频率最高的类别作为当前点预测分类

image-20220222200023438

image-20220222200803146

image-20220222200840977

image-20220224190157803

image-20220222200927187

6 神经网络基础

神经网络的基本原理:前馈过程(前向)和误差反向传播(后向)

  • 前馈过程(前向):为了计算输出/损失值
  • 误差反向传播(后向):为了更新权重参数

6.1 线性函数

image-20220222203003804

image-20220222202045383

image-20220222202532164

6.2 损失函数

image-20220222204323032

image-20220226102100327

image-20220222204640813

image-20220222205705485

6.3 前向传播与反向传播

初始阶段:随机初始化权重参数W

image-20220222210457471

image-20220224191431780

6.4 梯度下降

image-20220224190342240

image-20220224190626272

image-20220224190741108

image-20220224190814599

6.5 激活函数

深度学习最常用的10个激活函数

image-20220224191022390

image-20220224192041076

6.6 参数初始化

image-20220224191210888

6.7 整体架构

image-20220224191708031

image-20220224191732583

7 卷积神经网络

最全面的卷积神经网络入门教程

卷积层:提取特征

池化层:压缩特征(降采样)

输出层:输出类别的概率值

image-20220223093920598

7.1 与传统神经网络区别

HxWxC:HxW为原始图片的大小(H为长度,W为宽度),C为RGB彩色通道的个数(C为维度)

image-20220222212924486

7.2 卷积

卷积:首先将图像分成多个小区域【目的是对于不同的小区域,得到不一样的特征】,然后选择一种计算方法【对于每个小区域来计算它们各自的特征值—>组成特征图

一文读懂深度学习中的各种卷积

7.3 卷积特征值计算方法

彩色图像:(RGB)三通道[三维]

(RGB)三通道的权重参数W随机初始化(不同)

(RGB)三通道各自单独做内积运算叠加和,加偏置项得到特征值

权重参数W需要学习来更新自己进而提取合适的特征

image-20220223095526715

image-20220223105441609

【注意】:同一个卷积层中的多个卷积核规格是相同的!!!

7.4 特征图(feature map)

特征图的个数=卷积核的个数

特征图(三维:hxwxc):hxw为特征图的大小,c为特征图的个数

image-20220223104255932

7.5 堆叠的卷积层

多次卷积

image-20220223113951584

7.6 卷积层参数

一般设步长为1,卷积核尺寸为3x3

卷积核个数根据所需特征图个数设定

image-20220223114754992

image-20220223162606941

image-20220223161846518

7.7 特征图尺寸计算

image-20220223163027676

image-20220223163156098

7.8 卷积参数共享

对每个小区域的卷积特征值计算时,不同卷积核的权重参数不变—》权值共享

每个卷积核都有一个对应的偏置参数

image-20220223165125555

image-20220223164415776

image-20220223164531559

image-20220223165350028

7.9 池化层

作用:压缩特征(降采样),即在经过卷积层后得到的原始特征图中进行筛选特征,组成新的特征图

只做筛选,不做计算!!!

image-20220223171616868

7.10 感受野

在卷积神经网络中,感受野(Receptive Field)的定义是卷积神经网络每一层输出的特征图(feature map)上的像素点在输入图片上映射的区域大小,即特征图上的一个点对应输入图上的区域

  • 两层3x3的卷积核卷积操作之后的感受野是5x5,其中卷积核(filter)的步长(stride)为1、padding为0
  • 三层3x3的卷积核卷积操作之后的感受野是7x7,其中卷积核的步长为1、padding为0

卷积神经网络中感受野的详细介绍

img

image-20220225112049930

7.11 整体架构

CONV:卷积层

RELU:激活函数

POOL:池化层

FC:全连接层

网络层数只针对做计算的层而言,如卷积层和全连接层

【注意】:

  • 卷积或池化后得到的是特征图,需要把图(三维)转换成向量(一维)才能做分类或回归任务
  • CNN是做分类还是回归任务取决于损失函数的定义与全连接层的设计

image-20220223093920598

image-20220223173435257

image-20220224140100050

8 经典CNN

CNN网络结构发展最全整理

8.1 AlexNet

2012年网络结构

训练时间:8小时

AlexNet中的6个关键点

卷积神经网络学习路线(七)| 经典网络回顾之AlexNet

image-20220224132136095

8.2 VGG

2014年网络结构

训练时间:3天

卷积神经网络学习路线(八)| 经典网络回顾之VGGNet

image-20220224133046717

image-20220224171120886

8.3 ResNet

2015年网络结构—残差网络(跳跃连接)

经典论文:Deep Residual Learning for Image Recognition(译)

再看何恺明的高引ResNet论文

卷积神经网络学习路线(十)| 里程碑式创新的ResNet

image-20220224170802833

image-20220224163857319

image-20220224171214581

image-202202241640798

image-20220224164630354

9 基于CNN构建图像识别模型

image-20220224140629165

9.1 数据增强

image-20220224144831906

9.2 迁移学习

含义:把已训练好的模型(预训练模型)权重参数迁移到新的模型来帮助新模型训练

目标:掌握迁移学习的思路,学会使用预训练权重完成新任务,并掌握冻结部分网络层的方法

方法

  1. 将预训练模型的权重参数作为新模型中权重参数的初始化
  2. 将预训练模型的权重参数直接作为新模型中权重参数的结果

套路:

  1. 先通过预训练模型来训练自己分类的那个层,前面都保持不变,训练完后保存最好的模型
  2. 再用之前保存最好的模型来训练所有层(训练所有的参数,学习率调小一点进行微调)

【图像识别】基于Matlab的迁移学习的图像分类案例

image-20220224150506508

image-20220224162125786


https://www.fengoutiyan.com/post/16217.html

相关文章:

  • 计算机视觉教程第二版答案
  • 计算机视觉教材
  • 计算机视觉教程考试题
  • 计算机视觉怎么学
  • 计算机视觉理论与方法
  • java入门与实战
  • 计算机视觉基础考试
  • 计算机视觉入门书籍
  • 鏡像模式如何設置在哪,圖片鏡像操作
  • 什么軟件可以把圖片鏡像翻轉,C#圖片處理 解決左右鏡像相反(旋轉圖片)
  • 手機照片鏡像翻轉,C#圖像鏡像
  • 視頻鏡像翻轉軟件,python圖片鏡像翻轉_python中鏡像實現方法
  • 什么軟件可以把圖片鏡像翻轉,利用PS實現圖片的鏡像處理
  • 照片鏡像翻轉app,java實現圖片鏡像翻轉
  • 什么軟件可以把圖片鏡像翻轉,python圖片鏡像翻轉_python圖像處理之鏡像實現方法
  • matlab下載,matlab如何鏡像處理圖片,matlab實現圖像鏡像
  • 圖片鏡像翻轉,MATLAB:鏡像圖片
  • 鏡像翻轉圖片的軟件,圖像處理:實現圖片鏡像(基于python)
  • canvas可畫,JavaScript - canvas - 鏡像圖片
  • 圖片鏡像翻轉,UGUI優化:使用鏡像圖片
  • Codeforces,CodeForces 1253C
  • MySQL下載安裝,Mysql ERROR: 1253 解決方法
  • 勝利大逃亡英雄逃亡方案,HDU - 1253 勝利大逃亡 BFS
  • 大一c語言期末考試試題及答案匯總,電大計算機C語言1253,1253《C語言程序設計》電大期末精彩試題及其問題詳解
  • lu求解線性方程組,P1253 [yLOI2018] 扶蘇的問題 (線段樹)
  • c語言程序設計基礎題庫,1253號C語言程序設計試題,2016年1月試卷號1253C語言程序設計A.pdf
  • 信奧賽一本通官網,【信奧賽一本通】1253:抓住那頭牛(詳細代碼)
  • c語言程序設計1253,1253c語言程序設計a(2010年1月)
  • 勝利大逃亡英雄逃亡方案,BFS——1253 勝利大逃亡
  • 直流電壓測量模塊,IM1253B交直流電能計量模塊(艾銳達光電)
  • c語言程序設計第三版課后答案,【渝粵題庫】國家開放大學2021春1253C語言程序設計答案
  • 18轉換為二進制,1253. 將數字轉換為16進制
  • light-emitting diode,LightOJ-1253 Misere Nim
  • masterroyale魔改版,1253 Dungeon Master
  • codeformer官網中文版,codeforces.1253 B
  • c語言程序設計考研真題及答案,2020C語言程序設計1253,1253計算機科學與技術專業C語言程序設計A科目2020年09月國家開 放大學(中央廣播電視大學)
  • c語言程序設計基礎題庫,1253本科2016c語言程序設計試題,1253電大《C語言程序設計A》試題和答案200901
  • 肇事逃逸車輛無法聯系到車主怎么辦,1253尋找肇事司機