【计算机视觉】1. 计算机视觉基础理论知识和框架(Basic Concepts)

news/2024/10/20 20:41:24/

什么是计算机视觉?

  • 一、什么是计算机视觉
  • 二、二个研究维度
  • 三、研究挑战
    • 3.1 像素与语义之间的GAP
    • 3.2 视觉变化
    • 3.3 光照变化
    • 3.4 尺度变化
    • 3.5 形态变化
    • 3.6 背景复杂
    • 3.7 遮挡
    • 3.8 内外
  • 四、计算机视觉框架
    • 4.1 计算机视觉基础
    • 4.2 深度学习算法理论基础
    • 4.3 深度学习算法
  • 五、计算机视觉基础内容
    • 5.1 图像预处理
    • 5.2 图像特征和描述
    • 5.3 深度学习之前的方法
  • 六 神经网络与深度学习基础
  • 七 主要研究问题
    • 7.1 图片分类
    • 7.2 目标检测
    • 7.3 图片分割
    • 7.4 图像描述
    • 7.5 图像生成 GAN

一、什么是计算机视觉

  1. 研究如何使机器看的科学
  2. 让计算机具有人类视觉的所有功能
  3. 从图像数据中,提取到有用的信息和知识
  4. 模拟人类视觉的优越能力
    a. 识别人、物体、场景
    b. 估计立体空间、距离
    c. 躲避障碍物进行导航
    d. 想象并描述故事
    e. 理解并讲解图片
  5. 弥补人类视觉的缺陷
    a. 容易忽视很多细节
    b. 不擅长精细感知,容易受幻觉干扰
    c. 主观,不擅长长时间稳定的执行同一任务

在这里插入图片描述

二、二个研究维度

  1. 语义感知
  2. 几何属性

在这里插入图片描述

三、研究挑战

3.1 像素与语义之间的GAP

在这里插入图片描述

3.2 视觉变化

在这里插入图片描述

3.3 光照变化

在这里插入图片描述

3.4 尺度变化

3.5 形态变化

3.6 背景复杂

3.7 遮挡

3.8 内外

四、计算机视觉框架

4.1 计算机视觉基础

  1. 图像预处理
  2. 图像特征及描述
  3. 传统算法

4.2 深度学习算法理论基础

  1. BP神经网络
  2. 深度学习基础

4.3 深度学习算法

  1. 图像分类:CNN => 卷积神经网络
  2. 图像检测:R-CNN => 区域卷积神经网络
  3. 图像分割:FCN => 全卷积神经网络
  4. 图像描述:RNN => 迭代神经网络
  5. 图像生成:GAN => 生成对抗网络

五、计算机视觉基础内容

5.1 图像预处理

  1. 图像显示与存储
  2. 图像增强目标
  3. 点运算
  4. 形态学处理
  5. 空间域处理:卷积
  6. 卷机的应用:【平滑、模糊、边缘检测、锐化】
  7. 频域处理:傅立叶变换,小波变换

5.2 图像特征和描述

  1. 颜色
    a. 量化颜色直方图
    b. 聚类颜色直方图
  2. 几何特征
    a. Edge
    b. Corner
    c. Blob
  3. 基于关键点的特征描述子
    a. SIFT
    b. SURF
    c. ORB
  4. 其他特征
    a. LBP
    b. Gabor

5.3 深度学习之前的方法

  1. 图像分割
    a. 基于阈值、基于边缘
    b. 基于区域、基于图论
  2. 人脸检测
    a. Haar-like 特征+ 级联分类器
  3. 行人检测
    a. HOG+SVM
    b. DPM

六 神经网络与深度学习基础

  1. 神经网络
    a. 神经元
    b. 前馈网络
    c. 梯度下降
    d. 误差反向传播
  2. 深度学习
    a. 与传统神经网络的区别
    b. 目标函数
    c. 该进的梯度下降
    d. 避免过拟合

七 主要研究问题

7.1 图片分类

一、问题:求解有没有某一个Object
二、卷积神经网络CNN

  1. 基础网络
  2. 有监督深度模型时代的起点
  3. AlexNet-> VGG -> GoogleNet -> ResNet -> ResNeXt

三、GoogleNet

  1. nception V1->V2->V3->V4
  2. Inception ResNet V1->V2

四、结构趋势

  1. 更深 8 -> 1000+
  2. 更广 1分支 -> 4分支
  3. 更多基数 1-> 32

7.2 目标检测

一、检测对象

  1. 物体检测
  2. 人脸检测
  3. 姿态检测

二、检测方法R-CNN

  1. 让基础网络具备区域输出能力
  2. 第一阶段:R-CNN -> SPP-Net -> Fast/Faster R-CNN
  3. 第二阶段:YOLO-> SSD -> R-FCN

三、目的
检测更快、更准确

四、工业应用

  1. 智能监控
  2. 辅助驾驶

7.3 图片分割

一、处理问题

  1. 前景分割
  2. 语义分割

二、检测方法FCN

  1. 让基础网络做像素输出
  2. FCN-> SegNet/ DeconvNet -> DeepLab

三、目的
语义推断、分割更精确

四、工业应用
辅助驾驶

7.4 图像描述

一、处理问题

  1. 图片描述
  2. 图片问答

二、检测方法FCN

  1. 让网络具有记忆功能,构建不定长序列数据的模型
  2. Vanilla RNN -> LSTM -> GRU

三、应用
文本序列、区域序列、视频序列

7.5 图像生成 GAN

一、网络结构

  1. 生成器网络:Generator
  2. 判别器网络:Discriminator

二、网络改进
GAN -> CGAN -> DCGAN -> wGAN
SRGAN

三、应用
样本数据分布学习


http://www.ppmy.cn/news/1116535.html

相关文章

OOM分析实战

OOM分析&实战 OOM分析&实战引言:一、JVM内存结构二、JVM OOM错误情况三、实践案例一案例二案例三 四、总结五、分析工具推荐六、参考文献 OOM分析&实战 引言: 在Java开发中,随着应用程序变得越来越复杂,内存管理问题…

面试redis主题一“什么是缓存穿透”

条件 缓存穿透是因为查询redis时发现其中没有要查询的数据,大量请求DB导致DB压力过大崩溃。这种情况大部分是因为恶意攻击。 解决方法 使用布隆过滤器 它是一种基于概率的数据结构,主要用来判断某个元素是否在集合内,它具有运行速度快&am…

java集合 list转map一些常用的方式(Stream流,,,)

Java 集合之间的转换 java集合 list转map一些常用的方式&#xff08;Stream流&#xff0c;&#xff0c;&#xff0c;&#xff09; 提示&#xff1a;帮助文档 文章目录 Java 集合之间的转换前言一、List转换为Map&#xff1f;1.1、**List**<**Object**>**转化为Map<Int…

Android13适配-Google官方照片视频选择器

官方照片选择器 图 1. 照片选择器提供了一个直观的界面&#xff0c;便于与您的应用分享照片。 照片选择器的界面可供浏览和搜索&#xff0c;并按日期降序向用户显示其媒体库中的文件。如隐私保护最佳实践 Codelab 中所示&#xff0c;照片选择器为用户提供了一种安全的内置授权…

go语言---锁

什么是锁呢&#xff1f;就是某个协程&#xff08;线程&#xff09;在访问某个资源时先锁住&#xff0c;防止其它协程的访问&#xff0c;等访问完毕解锁后其他协程再来加锁进行访问。这和我们生活中加锁使用公共资源相似&#xff0c;例如&#xff1a;公共卫生间。 死锁 死锁是…

docker 已经配置了国内镜像源,但是拉取镜像速度还是很慢(gcr.io、quay.io、ghcr.io)

前言 国内用户在使用 docker 时&#xff0c;想必都遇到过镜像拉取慢的问题&#xff0c;那是因为 docker 默认指向的镜像下载地址是 https://hub.docker.com&#xff0c;服务器在国外。 网上有关配置 docker 国内镜像源的教程很多&#xff0c;像 腾讯、阿里、网易 等等都会提供…

数据分析三剑客之一:Pandas详解

目录 1 Pandas介绍 2 Pandas的安装与导入 2.1 Pandas模块安装 2.2 Pandas模块导入 3 pandas数据结构及函数 3.1 Series结构 3.1.1 ndarray创建Series对象 3.1.2 dict创建Series对象 3.1.3 标量创建Series对象 3.1.4 位置索引访问Series数据 3.1.5 标签索引访问Series…

2023年以就业为目的学习Java还有必要吗?(文末送书)

目录 一、活力四射的 Java二、从零开始学会 Java三、准备工作四、基础知识五、进阶知识六、高级知识七、结语参与方式 大家好&#xff0c;我是哪吒。 文末送5本《Java编程动手学》 今天来探讨一个问题&#xff0c;现在学 Java 找工作还有优势吗&#xff1f; 在某乎上可以看到…