机器学习和深度学习--李宏毅(笔记与个人理解)Day17

embedded/2024/11/28 6:29:40/

Day 17Convolutional Neyral Network (CNN)

卷积神经网络一般都用在image 上面比较多一些,所以课程的例子大多数也都是image

Image Classification

the same size

image-20240412211301843

how about for pc?

image-20240412211342138

这里对于tensor 张量这个概念,我还是比较奇怪,在我认为一个矩阵也可以表示三维的空间;为什么引入tensor这个概念;

听完那个课程我悟了,tensor作为多维数组来说,更具有高维空间的特性;就拿上面的图片举例子,extremely case 我们取一维向量来表示(铺开),这样就会丢失一些空间的信息,例如绿色的格子和蓝色的某个格子其实是垂直的,仅仅相差一个垂直距离,但是展开为一根棍就很难找到这种关联

向量中某一个格子的数值表示该种颜色的强度

image-20240412211930832

好了我猜你紧接着就要说,啊啊啊这个什么weight 太大了,更新一次太麻烦啦巴拉巴拉的

Do we need “fully connected” in image processing ?

so we need some observations

Obervation1

image-20240412212206562

so not whole image ,but some patternsimage-20240412212406363

Simplification 1

image-20240412212555144

image-20240412212633482 image-20240412212645343 image-20240412213701721 image-20240412213728428

Typical Setting

image-20240412214032754

Obervation 2

image-20240412214152444
Simplification 2 sharing parameters
image-20240412214342635

Typical

image-20240412214444443

有了两种简化的方式了,我们来总结一下我们学到了什么

image-20240413201443821

CNN 的model 的bias比较大

Fully connected Layer jack of all trades master of none

Another Story

image-20240413201828912

image-20240413201924317 image-20240413202026650 image-20240413202045005 image-20240413202106520 image-20240413202133876

image-20240413202256514

这张ppt好好理解一下, 理解不了的话我给你讲讲:

首先按照Convolution 分为上下两个 part 哈,上面那个是由64个fitter (高度/厚度 =1, 因为原始图像的channel =1 是黑白图像,这里我们考虑typical的情况) 分别对原image做卷积得到的;每一个高度可以作为一个feature Map;ok ,然后我们知道 RGB 其实也是一个图像的三个channel 三个 feature Map;那么我们自然而然的认为这个厚度为64的feature map 叠起来的厚吐司 也是一个64channel 的图像;迭代为原始图像,那么下一次进行卷积的时候我们就需要64个厚度为64的fitter,也就是下面的两个64 的不同含义~ ok,打完收工

一个问题,如果fitter 一直等于 3*3 会不会严重丢失全局信息?为什么?

  • 我认为和stride有关,一直有重叠
  • 更直接的解释 从 3 * 3 到 5 * 5
image-20240413203018839

殊途同归

image-20240413203232320

boy 聪明的,比较颜色就好~ 要学会适度自学哦

image-20240413203338279

image-20240413203429558

Observation 3

image-20240413203530845
Simpification 3(Pooling)
image-20240413203649322 image-20240413203928352

subSampling 会丢失一定的信息,随着 计算机上升,下采样逐渐式微

The whole CNN……

image-20240413204126742

Flatten 拉直

Application-- 阿尔法狗

image-20240413204317466

so why CNN?

image-20240413204451266

当成一个图片,然后48个channel 表示该点处的48种情况

image-20240413204618575 image-20240413204912641 image-20240413204928830

more thinking :

CNN 好像没有办法处理影响放大缩小,或者反转的情况;so we need data augmentation ;

Spatial Transformer Layer


http://www.ppmy.cn/embedded/5250.html

相关文章

在React类组件中引用在其他文件中创建的zustand状态store

如果想在React类组件中引用在其他文件中创建的zustand状态store,您可以将创建的store导出并在类组件中引入使用。您可以在其他文件中创建zustand store,并将其导出,然后在类组件中引入并使用该store。 以下是一个示例,展示了如何…

振兴国腾GM8775C MIPIDSI桥接到双 PORT LVDS

GM8775C描述: GM8775C 型 DSI 转双通道 LVDS 发送器产品主要实现将 MIPI DSI 转单 / 双通道 LVDS 功能,MIPI 支持 1/2/3/4 通道可选,每通道最高支持 1Gbps 速率,最大支持 4Gbps 速率。LVDS 时钟频率高达 154MHz &a…

实验二:配置路由器

1.实验环境 实验用具包括两台路由器 (或交换机),一根双绞线缆台PC,一条Console线缆 2.需求描述 通过Console口配置路由器接口IP地址,实现设备通信 将两台路由器的Gig0/0接口相连.通过一台PC连接设备的Console端口并配置P地址(…

并发编程之ConcurrentHashMap源码分析

1. 主源码逻辑 final V putVal(K key, V value, boolean onlyIfAbsent) {if (key null || value null) throw new NullPointerException();// 1.计算key对应的hashint hash spread(key.hashCode());int binCount 0;// 2. 进行自旋 for (Node<K,V>[] tab table;;) {N…

ChatGPT助力论文写作:快速提升稿件质量

ChatGPT无限次数:点击直达 ChatGPT助力论文写作&#xff1a;快速提升稿件质量 随着人工智能技术的不断发展&#xff0c;ChatGPT作为一款强大的自然语言处理工具正逐渐成为许多论文作者的得力助手。本文将探讨如何利用ChatGPT提升论文写作的效率和质量&#xff0c;并结合实例演…

基于spring boot的班级综合测评管理系统

基于spring boot的班级综合测评管理系统设计与实现 开发语言&#xff1a;Java 框架&#xff1a;springboot JDK版本&#xff1a;JDK1.8 服务器&#xff1a;tomcat7 数据库&#xff1a;mysql 5.7&#xff08;一定要5.7版本&#xff09; 数据库工具&#xff1a;Navicat11 开…

vue循环发起请求,等一个请求结束后,进行下一次请求

vue循环发起请求&#xff0c;等一个请求结束后&#xff0c;进行下一次请求 async await new Promise async filesSubmitted(files, fileList) {if (files.length 0) {return this.$message.error("文件列表存在同名文件&#xff0c;请关闭文件列表后再试。");}for (…

Java 对称加密AES、DES的实现

1.AES、DES的介绍 1.1.AES介绍 AES&#xff08;Advanced Encryption Standard&#xff0c;高级加密标准&#xff09;的出现&#xff0c;是因为以前使用的DES算法密钥长度较短&#xff0c;已经不适应当今数据加密安全性的要求&#xff0c;因此2000年10月2日&#xff0c;美国政…