昇思25天学习打卡营第4天|linchenfengxue

devtools/2024/10/18 2:40:58/

需求:建立一个图像分类模型,提供自动识别有(猫、狗、飞机、汽车等等) 图片的功能

ResNet50图像分类

 图像分类是最基础的计算机视觉应用,属于有监督学习类别,如给定一张图像(猫、狗、飞机、汽车等等),判断图像所属的类别。昇思使用ResNet50网络对CIFAR-10数据集进行分类。

ResNet网络介绍

ResNet50网络是2015年由微软实验室的何恺明提出,获得ILSVRC2015图像分类竞赛第一名。在ResNet网络提出之前,传统的卷积神经网络都是将一系列的卷积层和池化层堆叠得到的,但当网络堆叠到一定深度时,就会出现退化问题。下图是在CIFAR-10数据集上使用56层网络与20层网络训练误差和测试误差图,由图中数据可以看出,56层网络比20层网络训练误差和测试误差更大,随着网络的加深,其误差并没有如预想的一样减小。

ResNet网络提出了残差网络结构(Residual Network)来减轻退化问题,使用ResNet网络可以实现搭建较深的网络结构(突破1000层)。论文中使用ResNet网络在CIFAR-10数据集上的训练误差与测试误差图如下图所示,图中虚线表示训练误差,实线表示测试误差。由图中数据可以看出,ResNet网络层数越深,其训练误差和测试误差越小。

感知机
我们这个模型会接收一张图片,然后会输出一组概率,分别是该图片为 猫、狗的概率与该图片为其他图片的概率,从而通过概率来判断这张图片是 Logo 类还是 Other 类,如下图所示:
我们将上面的模型进一步拆分,看看如何才能获得这样的一组输出。
其中输入的图片,就是输入 X,将其展开后,可以获得输入 X 为 , 而模型可以看做有两个节点,每个节点都会有一个输出,分别代表着对输入为 Logo 和 Other 的判断,但这里的输出暂时还不是概率,只是模型输出的一组数值。这一部分内容 如下图所示:
上图这个结构其实就是感知机了,中间绿色的节点叫做神经元,是感知机的最基本组成单
元。上图中的感知机只有中间一层(绿色的神经元),如果有多层神经元的话,我们就称
之为多层感知机。
那什么是神经元呢?神经元是关于输入的一个线性变换,每一个输入 x 都会有一个对应的
权值,上图中的 y 的计算方式为:
其中, 是神经元的权重, 为神经元的偏移项。权重与偏移项都是通过 模型学习到的参数。 为激活函数,激活函数是一个可选参数。 那如何将一组数值,也就是 与 转换为一组对应的概率呢?这个时候 Softmax 函数 就要登场了。它的作用就是将一组数值转换为对应的概率,概率和为 1。
卷积神经网络的最大作用就是提取出输入图片的丰富信息,然后再对接上层的一些应用,
比如前面提到的图片分类。把卷积神经网络应用到图像分类原理中,得到的模型如下图所
示:

http://www.ppmy.cn/devtools/56458.html

相关文章

Windows系统下文件夹权限详解

文章目录 问题描述文件夹属性 问题描述 今天在Win10系统下,实现文件夹设置权限,具体的方案的涉及到我们公司内部的一款加密软件,不太方便透漏,借此机会,我也重新的回顾下windows系统下的文件夹权限 文件夹属性 打开…

Linux自动化交互脚本expect开发

在日常开发任务中,运行shell脚本有时候会提示输入密码的操作,如何让脚本自动输入密码呢?这时使用expect帮我们输入,Expect是基于Tcl发展而来的,它不仅可以进行交互,还可以根据程序的提示模拟标准输入&#…

前端 CSS 经典:模拟 material 文本框

效果 思路 定义三个元素&#xff0c;文本框&#xff0c;下划线&#xff0c;占位文字。input 聚焦时通过 ~ 选中兄弟元素&#xff0c;利用 required 属性 css 中的 valid 验证&#xff0c;判断 input 中是否有输入。写入过渡效果。 实现代码 <!DOCTYPE html> <htm…

5G与自动驾驶

上篇&#xff08;5G与4G的区别-CSDN博客&#xff09;讲了4G与5G的区别&#xff0c;大家可以看到5G具备高带宽、低时延的特性&#xff0c;可以广泛应用于各种物联网场景。 今天和大家简单聊聊5G与自动驾驶。 自动驾驶依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同…

ES6中var和let的作用域问题

问题引出&#xff1a;下面的代码输出结果什么&#xff1f; for (var i 0; i < 5; i) {setTimeout(() > {console.log(i);}, 1000); }答案&#xff1a;6个5。 解析&#xff1a;根本原因是在这段代码中&#xff0c;var关键字的作用域是函数作用域。 外层的for循环一共执行…

2024HVV最新POC/EXP,目前有8000+个POC/EXP

点击"仙网攻城狮”关注我们哦~ 不当想研发的渗透人不是好运维 让我们每天进步一点点 简介 都是网上收集的POC和EXP&#xff0c;最新收集时间是2024年五月&#xff0c;需要的自取。 表里没有的可以翻翻之前的文章&#xff0c;资源比较零散没有整合起来。 文件链接&#xff…

JS逆向:由 words 、sigBytes 引发的一系列思考与实践

【作者主页】&#xff1a;小鱼神1024 【擅长领域】&#xff1a;JS逆向、小程序逆向、AST还原、验证码突防、Python开发、浏览器插件开发、React前端开发、NestJS后端开发等等 在做JS逆向时&#xff0c;你是否经常看到 words 和 sigBytes 这两个属性呢&#xff0c;比如&#xff…

RabbitMQ实践——搭建单人聊天服务

大纲 创建Core交换器用户登录发起聊天邀请接受邀请聊天实验过程总结代码工程 经过之前的若干节的学习&#xff0c;我们基本掌握了Rabbitmq各个组件和功能。本文我们将使用之前的知识搭建一个简单的单人聊天服务。 基本结构如下。为了避免Server有太多连线导致杂乱&#xff0c;下…