【跟马少平老师学AI】-【神经网络是怎么实现的】(七-1)词向量

news/2024/10/19 21:28:40/

一句话归纳:

1)神经网络不仅可以处理图像,还可以处理文本。

2)神经网络处理文本,先要解决文本的表示(图像的表示用像素RGB)。

3)独热编码词向量:

  • 词表:{我,在,清华大学,读书,生活,美丽的,清华园,中}
  • 词向量:

清华大学=[0,0,1,0,0,0,0,0]

清华园=[0,0,0,0,0,0,1,0]

美丽的=[0,0,0,0,0,1,0,0]

  • 特点:向量太长,每两个向量之间的距离都是一样的。

4)稠密向量:

猪向量=[1.0,0.1,1.0]

羊向量=[1.0,0.2,1.0]

熊猫=[1.0,0.3,0]

白菜=[0,1.0,1.0]

竹子=[0,1.0,0.1]

可计算向量间的距离。

5)神经网络语言模型:

  • 给定一句话的前n-1个词,预测第n个词是什么词的概率。
  • 神经网络实现的,为神经网络语言模型。

6)最大似然估计,通过让联合概率最大化估计概率的方法。

7)神经网络语言模型的似然函数:

8)对似然函数进行对数转换,取相反数,求最小值。

可以用梯度下降法了。

9)用BP算法训练的不仅是神经网络语言模型的参数,也包含词向量。

10)稠密词向量可以计算两个向量的距离,有语义意义。


http://www.ppmy.cn/news/1450343.html

相关文章

JAVA面试专题-微服务篇

Spring cloud Spring Cloud 5大组件有哪些 注册中心/配置中心:nacos 负载均衡:Ribbon 服务远程调用:Feign 服务保护:sentinel 服务网关:Gateway 微服务注册和发现 nacos和eureka的区别 负载均衡 微服务向Ribbon发送…

初识Vue-组件化开发(详解各个组件)

目录 一、组件介绍 1.概念 2.特点 3.作用 4.应用 5.分类 二、组件语法 1.定义挂载vue应用 2.注册全局组件 实例 1.自定义组件 2.计数器 3.组件的复用 4.局部组件 实例 5.Prop 6.动态Prop 7.Prop 验证 三、创建组件的关键概念和语法 1. 组件定义 2. 组件选…

分布式Hadoop环境的安装与搭建

Hadoop学习笔记 初步了解Hadoop 一、 认识Hadoop 1) Hadoop是一个处理海量数据的框架 2) 可以分布式的处理海量数据 3) 为海量数据提供高效的处理 二、 什么是大数据 1) 单位:bit、byte、kb、mb、gb、tb、pb、e…

linux jmeter ant下载并安装【2024-亲测】

环境 centos7 一、下载jmeter 在这里插入代码片wget https://dlcdn.apache.org//jmeter/binaries/apache-jmeter-5.6.3.tgz --no-check-certificate解压 tar -zxvf apache-jmeter-5.6.3.tgz复制到安装目录、设置环境变量 vim /etc/profile添加环境变量,路径改成…

4月份全球市场推出的18款网络安全热点产品和服务:生成式AI应用主导安全产品创新

CSO在线追踪了4份全球市场推出的18代表性网络安全产品和服务,从中可以观察网络安全产品创新趋势和风向。 1、Salt Security 在其API保护平台添加 OAuth安全产品 4月25日:Salt Security 在其API保护平台中添加了新的 OAuth 安全产品,以帮助组…

面试经典150题——文本左右对齐

面试经典150题 day24 题目来源我的题解方法一 模拟 题目来源 力扣每日一题;题序:68 我的题解 方法一 模拟 分情况讨论 是最后一行 ------------将所有字符串先组合在一起,然后在末尾加空格是单个单词一行 ------------ 将单个字符串先组合…

conda的一些问题

我是windows,conda下载的包下载到了c盘的.conda文件夹下,这是为什么? Conda 在 Windows 系统上默认会在用户的主目录下创建一个 .conda 文件夹,用来存储一些临时文件和包的缓存。这个路径是由 Conda 的默认配置决定的&#xff0c…

使用hutool工具导入excel Java

Hutool是一个Java工具类库,它提供了一系列实用的API,包括操作Excel的功能。要使用Hutool导入Excel,你可以使用ExcelReader类。以下是一个简单的例子,展示了如何使用Hutool导入Excel文件: import cn.hutool.poi.excel.…