机器学习常见面试题总结

embedded/2024/9/20 15:39:30/

1、泛华误差的分解

训练模型的目的——最小化损失函数——泛化误差可以分解为偏差(Biase)方差(Variance)噪声(Noise)。

bias:拟合值和真实值之间有较大的偏差。所有可能的训练数据集训练出的所有模型的输出的平均值真实模型的输出值之间的差异。

varience:反映的是拟合值波动的情况。不同的训练数据集训练出的模型输出值之间的差异。

Noise:噪声的存在是学习算法所无法解决的问题,数据的质量决定了学习的上限。假设在数据已经给定的情况下,此时上限已定,我们要做的就是尽可能的接近这个上限。

2、偏差、方差与过拟合、欠拟合的关系?

偏差(Bias)与方差(Variance) - 知乎 (zhihu.com)

 3、trade-off between bias and variance

泛华误差=偏差(Biase)+方差(Variance)+噪声(Noise)。

从本质上讲,如果你使模型更复杂并添加更多变量,你将会失去一些 Bias 但获得一些 Variance,这就是我们所说的权衡(tradeoff)。这也是为什么我们在建模的过程中,不希望这个模型同时拥有高的偏差和方差。

4、KNN对比K-means

有监督和无监督。

都是基于距离的。


http://www.ppmy.cn/embedded/30199.html

相关文章

设计模式:工厂模式

工厂是每个开发人员都应该知道的关键创造模式之一。它们是许多高级模式的主要组成部分。很长一段时间,我在不同类型的工厂模式上遇到了麻烦。此外,在同一篇文章中很难找到有关这些类型的信息。本文介绍 4 种类型的工厂模式: 工厂方法模式&…

cookie、session、token

cookie 纳入标准文档,标准浏览器需要遵守的协议之一,作为标准浏览器必须支持的。 WEB应用都是基于HTTP协议,标准的HTTP协议是无状态的。 什么是无状态? 不管是谁,不管是从哪个地方发起的请求。只要你的请求&#xff08…

西电大数据安全与隐私(现代密码学基础技能)

西电大数据安全与隐私(现代密码学基础技能) 大数据安全与隐私这门课的lab1,要求如下图: 采用的方案是RSA和AES相结合, 利用RSA来加密传输AES的密钥, 用AES的密钥来加密数据. 如果使用RSA加密数据, 虽然安全性会更高, 但效率低. AES加解密效率高, 但安全性会差一些, 所以采用RS…

服务器分类

服务器可以根据不同的标准进行分类,主要分类方式包括但不限于以下几种: 按应用层次划分: 入门级服务器:适用于小型企业或个人,处理轻量级任务。工作组级服务器:适合中小型企业部门,支持更多用户…

SpringCloud整合Gateway结合Nacos

目录 一、引入依赖 二、开启两个测试项目 2.1 order service ​编辑 2.2 user service 三、gateway项目 3.1 新建一个bootstrap.yml文件 3.2 将我们的的网关配置写道nacos里的配置里 3.3 测试:看能够根据网关路由到两个测试的项目 四、 优化 4.1 将项目打包…

【MySQL】如何在MySQL中编写循环

是谁的心啊 孤单地留下 他还好吗 我多想爱他 那永恒的泪 凝固那一句话 也许可能蒸发 是谁的爱啊 比泪水坚强 轻声呼唤 就让我融化 每一滴雨水 演化成我翅膀 向着我爱的人 追吧 🎵 飞儿乐团《月牙湾》 MySQL中的循环通常在存储过程中使用&#…

[ECE]Vivado设计流程中,“Synthesis“(综合)和 “Implementation“(实现)是两个关键步骤

是什么? Synthesis(综合): 作用: 综合是将你的HDL代码(如VHDL或Verilog)转换成门级网表的过程,这个网表描述了逻辑门和触发器的连接方式。如何运行: 你可以在Vivado中点击“Run Synthesis”(运…

HTML 标签通用属性

HTML 标签通用属性 通用HTML标签的属性 id 设定标签的ID name 设定标签的名称 class 设定标签样式的类选择器 style 设定标签样式属性 <basefont><font>标签通用的属性 face 用于文字的名称&#xff0c;可以是宋体、隶书、楷体等 size 用于设置字号的大小(从…