人工智能学习1——特征提取和距离

news/2025/2/11 3:45:10/

强人工智能和弱人工智能:
强人工智能:和人脑一样
弱人工智能:不一定和人脑思考方式一样,但是可以达到相同的效果,弱人工智能并不弱
——————————————————————————————————
机器学习能解决的问题:
1.人工智能只能解决有强规律的事情
2.平滑性问题 人工智能不能解决质数识别问题,因为质数本来是没有规律的
3.结果不变性 天气预报-》不变 股票预测-〉可变

特征提取-》数字量化
特征向量就是一个数组
在这里插入图片描述

天然向量化:本来就是数字
特征提取时会丢失很多客观事实,是一个信息丢失的过程

图片-》对于一个400400像素的图像-〉特征提取之后4004003(3是RGB的三通道,400400像素的每一个位置都是三维的)

黑白图片-》4004001(1是灰度,范围0~255)

视频-〉多张图片(抽取视频关键帧) 对于机器学习,图片和视频没有本质区别

中文编码:
One-hot编码
常见中文词10w个
我: 【0,1,0,0,……,0,0】
爱: 【0,0,0,1,……,0,0】
中国:【0,0,0,0,……,1,0】
multi-hot编码
我爱中国:【0,1,0,1,……、,1,0】

hot编码的缺点
所有词的差异都是相同的,看不出来词和词之间的差异,语义丢失
丧失循序性
浪费存储时间

hot编码应用场景:性别编码
特征向量化没有绝对的好,向量和需求要契合

微博社交网络,如何表示特征?
人少的时候:邻接矩阵
人多的时候:?
即使同一场景,提取特征也需要看数量级

向量化的好处:可以衡量节点之间的距离

关于距离
——————————————————————————————————
1.欧氏距离:数学中的距离,距离唯一
2.曼哈顿距离:城市街区行走,两地之间的距离,距离不唯一
3.切比雪夫距离:国际象棋国王的行走,向周围8个方向行走的距离都是1,在欧氏距离中是根号2,曼哈顿距离中是2
公式表示为:max(|x1-x2|,|y1-y2|)
在这里插入图片描述

在真实产品需求中
对两个产品之间的距离一般计算相似度,并且相似度存在一个值域范围
一般使用公式(1/1+阿尔法)来计算相似度,使得相似度处于区间(0,1】中,并且阿尔法越大,相似度越不敏感

在流形面上,距离会失效,只能找近的,近义词,不能找远的
在这里插入图片描述

欧式距离的缺点:
身高体重 150cm 40kg
【1.5,40】-》【150,40】- 〉【1500,40】
使用不同单位,对结果影响不一样,例如上述过程中就在逐步放大身高作用
所以需要做归一化
方差和量纲成正比,量纲越大,方差越大


http://www.ppmy.cn/news/1016968.html

相关文章

kubernetes部署milvus

milvus介绍 Milvus创建于2019年,其唯一目标是存储、索引和管理由深度神经网络和其他机器学习(ML)模型生成的大量嵌入向量。 嵌入向量数据库Milvus是一种专门为处理输入向量查询而设计的数据库,能够在万亿规模上对向量进行索引。与…

【FAQ】视频监控EasyCVR平台登录密码忘记?如何通过navicat连接数据库进行修改?

TSINGSEE青犀视频监控管理平台EasyCVR可以根据不同的应用场景需求,让平台在内网、专网、VPN、广域网、互联网等各种环境下进行音视频的采集、接入与多端分发。在视频能力上,平台可实现视频实时直播、云端录像、云存储、回放与检索、告警上报、视频快照、…

PS透明屏,在科技展示中,有哪些优点展示?

PS透明屏是一种新型的显示技术,它将传统的显示屏幕与透明材料相结合,使得屏幕能够同时显示图像和透过屏幕看到背后的物体。 这种技术在商业展示、广告宣传、产品展示等领域有着广泛的应用前景。 PS透明屏的工作原理是利用透明材料的特性,通…

zju代码题:4-6

一 分段函数算水费 #include <stdio.h>int main() {/*** 定义两个* 定义浮点型变量* y:水费* x:用水的吨数* */double x, y;printf("Enter x(x>=0):\n"

IMv9.0版本总结[服务端+客户端],最终版本

一、经历的版本 经历了多个版本&#xff0c;基础内容在前面&#xff0c;可以使用之前的基础环境&#xff1a; v1&#xff1a; https://blog.csdn.net/wtt234/article/details/132139454 v2&#xff1a; https://blog.csdn.net/wtt234/article/details/132144907 v3&#xff1a;…

企业举办活动邀请媒体的意义和重要性

传媒如春雨&#xff0c;润物细无声&#xff0c;大家好&#xff0c;我是51媒体网胡老师。 企业举办活动并邀请媒体的意义和重要性是多方面的&#xff0c;主要有以下一些&#xff1a; 1. 品牌曝光与宣传&#xff1a;邀请媒体参与企业活动可以提高企业的品牌曝光度。媒体报道能够…

使用Openoffice或LibreOffice实现World、Excel、PPTX在线预览

使用Openoffice或LibreOffice实现World、Excel、PPTX在线预览 预览方案使用第三方服务使用前端库转换格式 jodconverterjodconverter概述主要特性OpenOfficeLibreOffice jodconverter的基本使用添加依赖配置创建DocumentConverter实例上传与转换预览启动上传与预览World 与Spri…

【Kubernetes】Kubernetes之YAML文件详解

YAML 一、YAML 的概述1. Kubernetes 支持资源管理格式2. YAML 语法格式 二、YAML 文件1. 如何获取 api 资源相关信息2. 编写资源配置文件2.1 手动编写 yaml 文件详解K8S中的port 2.2 使用镜像生成 yaml 文件2.3 根据现有资源导出 yaml 文件 总结1. 如何获取资源清单文件&#x…