深度学习读书笔记 绪论

server/2024/12/4 3:49:25/

深度学习是什么?

机器学习的分支。

深度学习问题也是指从有限样例中总结出一般的规律,应用在新的未知数据上的方法。

机器学习的三个基本要素

模型

机器学习任务首要弄明白的,也就是一个机器学习任务所面对的输入空间和输出空间。

输入空间到输出空间,xy之间的关系可以用一个函数或者分布来描述的话,机器学习的目标就是找到模型来接近这个真实的函数或者分布。

假设空间

指的是所有可能的预测模型(或假设)的集合。

也就是输入空间和输出空间的中间,模型参数作为模型这个假想函数的变量,作为一种理想状态来拟合真实情况或者说真实的函数。

学习准则

如果训练集由N个独立的,同分布的样本组成。

好的模型应该让xy的值与真实情况尽可能一致。

模型使用期望风险来衡量。

期望风险则是由损失函数来量化xy和真实xy的差异,从而计算期望来定义的。

损失函数有很多种,各自有优缺点。

我们想着最后总要让这个损失函数计算的期望最低,也就是风险最小化准则。

但是期望风险无法计算,能够计算的是经验风险,也就是训练集上的损失函数量化的结果。

如果追求风险最小化,得到的是经验风险的最小化,而不是期望风险。

如果训练样本量比较小,这样容易过拟合。

过拟合:

表现为模型在训练集上错误率低,在未知数据上错误率高。

为了解决过拟合,引入正则化。

正则化:

修改损失函数,添加正则项。

优化算法

最后,确定了训练集,假设空间,学习准则之后,如何找到最优模型?

一个最优化问题。怎么找到最优参数,就是我们的优化算法要解决的事情。

参数,超参数

如果理解参数是函数的系数的话,我们的超参数就是用来定义模型结构或者优化策略的。超参数是用来得到最优参数的手段的参数。

比如聚类算法的类别个数,梯度下降法的步长等。

梯度下降

最常见的优化算法。可以理解为一个人不断下山,寻找最优(最低处)目标。有很多情况,如果优化目标函数是非凸的,就可能只能找到局部最优。为此设计了很多不同的梯度下降避免我们下山路上卡在小山沟,比如一次性走的步长不同之类的思路。

提前停止

防止过拟合。在训练集上训练,使用验证集测试模型是否最优。每次迭代,检测训练出的模型是否在验证集上最优(即准确率不再提升)。

如果在训练集上准确率不断提升,验证集却证明准确率没有提升就是过拟合了,所以我们要在验证集上准确率不再提升时提前停止。

总结

深度学习也是机器学习,在一个机器学习任务中,最开始很重要的就是输入空间和输出空间的确立。之间的真实映射我们使用假设来拟合它,假设的集合就是假设空间。之后使用一个函数来评价不同假设的效果。之后使用优化算法使目标函数最小。(或者说假设效果最好)


http://www.ppmy.cn/server/147184.html

相关文章

android 阻止返回退出

一、重写返回按钮 //2024-12-02 Override public void onBackPressed() {// 在这里添加您的拦截逻辑// Toast.makeText(this, "返回键被拦截", Toast.LENGTH_SHORT).show();// super.onBackPressed();showExitDialog(); } 二、弹出提示 private void showExitDi…

ubuntu 20.04 安装 docker 后遇到的网络问题

问题 安装docker后,无法拉取hello-world镜像,: $ docker run --rm hello-world Unable to find image hello-world:latest locally docker: Error response from daemon: Get "https://registry-1.docker.io/v2/": net/http: req…

MySQL安装部署

安装 MySQL 官方 YUM 仓库: [rootlocalhost ~]# wget https://dev.mysql.com/get/mysql80-community-release-el7-3.noarch.rpm --2024-12-02 16:14:09-- https://dev.mysql.com/get/mysql80-community-release-el7-3.noarch.rpm Resolving dev.mysql.com (dev.my…

【数据结构实战篇】用C语言实现你的私有队列

🏝️专栏:【数据结构实战篇】 🌅主页:f狐o狸x 在前面的文章中我们用C语言实现了栈的数据结构,本期内容我们将实现队列的数据结构 一、队列的概念 队列:只允许在一端进行插入数据操作,在另一端…

Linux 进程管理之struct task_struct

文章目录 前言一、任务 ID二、信号处理三、任务状态四、进程调度五、运行统计信息六、进程亲缘关系七、进程权限八、内存管理九、文件与文件系统十、进程栈10.1 用户态函数栈10.2 内核态函数栈 参考资料 前言 进程是一个应用程序运行时刻的实例(从进程的结构看&…

淘宝商品数据获取:Python爬虫技术的应用与实践

引言 随着电子商务的蓬勃发展,淘宝作为中国最大的电商平台之一,拥有海量的商品数据。这些数据对于市场分析、消费者行为研究、商品推荐系统等领域具有极高的价值。然而,如何高效、合法地从淘宝平台获取这些数据,成为了一个技术挑…

Linux vi/vim

Linux vi/vim 所有的 Unix Like 系统都会内建 vi 文书编辑器,其他的文书编辑器则不一定会存在。 但是目前我们使用比较多的是 vim 编辑器。 vim 具有程序编辑的能力,可以主动的以字体颜色辨别语法的正确性,方便程序设计。 什么是 vim&…

PostgreSQL17官网下载详细教程

PostgreSQL17官网下载详细教程 文章目录 PostgreSQL17官网下载详细教程1. 官网下载地址2. 下载1. 进入下载页2. Download the installer3. Download zip archive 3. 下载后的两种安装文件 1. 官网下载地址 https://www.postgresql.org/download/ 2. 下载 下面以下载Windows下…