【机器学习核心总结】什么是KNN( K近邻算法)

news/2025/3/16 6:16:07/

什么是KNN( K近邻算法)

虽然名字中有NN,KNN并不是哪种神经网络,它全名K-Nearest-Neighbors:K近邻算法,是机器学习中常用的分类算法。

请添加图片描述

物以类聚,人以群分。KNN的基础思想很简单,要判断一个新数据的类别,就看它的邻居都是谁。

假设我们的任务是分类水果,虽然不知道新来的水果是梨还是苹果,但通过观察它的大小和颜色,我们找到了它在坐标系中的位置,再看看已经确定的苹果和梨都在哪,如果附近的苹果多,我们就认为它是苹果,反之认为它是梨。

请添加图片描述

KNN中的K指的是K个邻居,K=3就是通过距离最近的3个样本,来判断新数据的类别。

请添加图片描述

大小和颜色是数据的特征,苹果和梨是数据的标签。计算距离时既可以使用两点之间的直线距离,也就是欧式距离,也可以使用坐标轴距离的绝对值的和,也就是曼哈顿距离。

对于KNN来说,K的取值非常重要,如果K的值太小,很容易受个例影响,K的值太大,又会受到距离较远的特殊数据影响。K的取值受问题自身和数据集大小决定,很多时候要靠反复尝试。

KNN算法能做什么?

  • 根据花瓣长度、宽度等特征判断植物类别
  • 将文本分词、统计词频等处理后判断文章的类型
  • 电商、视频网站可以找到与你类似的用户,依据他们的选择推荐你可能感兴趣的商品或内容

简单好用的KNN同样存在一定的缺点,它的流程是先计算新样本和所有样本之间的距离,按由近及远的顺序排序后,再按K值确定分类,因此数据越多,KNN的计算量越大,效率也就越低,很难应用到较大的数据集中 。

请添加图片描述

http://www.ppmy.cn/news/746542.html

相关文章

减噪 低振纹|拓尔微TMI8421打印机马达驱动解决方案

打印机作为现代办公不可或缺的设备为我们的工作带来了便利,但也会遇到一些”鸡肋“问题,如产生噪音或机器发热等问题,不仅无法高效的打印文件资料还会给安静的办公室环境带来噪音干扰,打乱工作思绪...... 一台高效稳定且减噪的打…

189. 轮转数组 Python

文章目录 一、题目描述示例 1示例 2 二、代码三、解题思路 一、题目描述 给定一个整数数组 nums,将数组中的元素向右轮转 k 个位置,其中 k 是非负数。 示例 1 输入: nums [1,2,3,4,5,6,7], k 3 输出: [5,6,7,1,2,3,4] 解释: 向右轮转 1 步: [7,1,2,…

复制/粘贴丢失 换行符或者空格

例如:原文:1.123456789 2.123456789 3.123456789 复制粘贴过后变成:1.1234567892.1234567893.123456789 经过多次测试发现可能为Notepat导致。 解决方法:删除Notepat换用其他软件或者在Notepat设置中更改替换。

中文特殊字符.空格

ZC:全角空格保存:" ",以后直接复制就可以使用了 1、怎样打全角空格_百度知道.html(https://zhidao.baidu.com/question/17959114.html) 全角空格( ),与汉字一样作为GBK的…

windows复制文件能名字后加空格而不是副本或者序号么

1、首先按WinR打开运行,输入regedit回车打开注册表编辑器; 2、导航至以下位置:HKEY_CURRENT_USER\SOFTWARE\Microsoft\Windows\CurrentVersion\Explorer\ 如果在以上位置没有发现NamingTemplates项,则新建之,如下图所…

全角字符空格(可复制使用)

<view class"topic read">阅 读 题</view>

去除文件名中空格

# 批量修改文件名 import os import sysdef renameall():fileList os.listdir(r"E:\person\music") # 待修改文件夹print("修改前&#xff1a;" str(fileList)) # 输出文件夹中包含的文件currentpath os.getcwd() # 得到进程当前工作目录os.chdir(r&…