新技术前沿-2024-大型语言模型LLM的本地化部署

server/2024/10/22 12:18:26/

参考快速入门LLM
参考究竟什么是神经网络

1 深度学习

1.1 神经网络和深度学习

神经网络是一种模拟人脑神经元工作方式的机器学习算法,也是深度学习算法的基本构成块。神经网络由多个相互连接的节点(也称为神经元或人工神经元)组成,这些节点被组织成层次结构。通过训练,神经网络可以学习从输入数据(例如图像、文本或声音)中提取有用的特征,并根据这些特征进行分类、预测或其他任务。
在这里插入图片描述

神经网络是一种机器学习算法,但它与传统机器学习在几个关键方面有所不同。其中一个重要的区别是神经网络能够自我学习和改进,不需要人为干预。通过训练,神经网络可以 自动从数据中提取有用的特征,这使得它在处理大规模数据集时具有优势。相比之下,传统机器学习算法通常需要手动选择和提供特征

深度学习的一个关键优势是它处理大数据的能力,随着数据量的增加,传统机器学习技术在性能和准确性方面可能会变得效率低下。而深度学习算法,由于其强大的表示能力和对数据的强大处理能力,仍然能够保持良好的性能和准确性。这使得深度学习成为数据密集型应用的理想选择,尤其适用于处理大规模数据集。

深入理解深度学习的底层结构可以帮助我们更好地设计和改进模型,以及更好地解释和调试模型的结果。虽然使用计算机自动生成输出可以提供一些初步的结果,但对深度学习结构的理解可以帮助我们更好地理解模型的工作原理,发现潜在的问题,以及进行更有针对性的改进。

(1)通过分析神经网络的结构,我们可以找到优化它的方法,来获得更好的性能。例如,我们可以调整层数或节点数,或者调整网络处理输入数据的方式,来改进网络的预测或分类准确率。
(2)此外,通过了解神经网络的结构和运作原理,可以开发出更适合特定任务的神经网络。例如,可以利用神经网络分析医学图像,以辅助疾病诊断或提高医学影像分析的准确性。在股市预测方面,神经网络也可以用于分析大量的历史数据和市场动态,以预测未来的股票价格走势。

1.2 神经网络的工作原理

每个神经元代表一个计算单元,它接收一组输入,执行一组计算,并产生一个输出,该输出被传递到下一层。就像我们大脑中的神经元一样,神经网络中的每个节点都会接收输入,对其进行处理,并将输出传递给下一个节点。
在这里插入图片描述

随着数据在网络中移动,节点之间的连接会根据数据中的模式而增强或减弱。这使得网络能够从数据中学习,并根据所学内容进行预测或决策
(1)网格的行被排列成水平的一维阵列,然后被转换为垂直阵列,形成第一层神经元。就像这样;
请添加图片描述
(2)输入层
在第一层的情况下,每个神经元对应于输入图像中的一个像素,每个神经元内的值表示该像素的激活或强度。神经网络的输入层负责接收原始数据(在本例中为图像),并将其转换为可以由网络其余部分处理的格式。在这种情况下,我们有28x28个输入像素,在输入层中总共给我们784个神经元。每个神经元的激活值是0或1,取决于输入图像中相应的像素分别是黑色还是白色。
在这里插入图片描述
(3)输出层
在这种情况下,神经网络的输出层由10个神经元组成,每个神经元代表一个可能的输出类(在这种情况下,数字0到9)。输出层中每个神经元的输出表示输入图像属于该特定类的概率。最高概率值决定了该输入图像的预测类。

(4)隐藏层
在输入层和输出层之间,我们有一个或多个隐藏层,对输入数据执行一系列非线性变换。这些隐藏层的目的是从输入数据中提取更高层次的特征,这些特征对于手头的任务更有意义。
你想在你的网络中添加多少个隐藏层取决于你。
在这里插入图片描述
隐藏层中的每个神经元接收来自前一层所有神经元的输入,并在将这些输入传递给非线性激活函数之前,对它们应用一组权重和偏置。
这个过程在隐藏层中的所有神经元上重复,直到到达输出层。

1.3 神经网络的专业术语

一、前向传播
前向传播是通过神经网络传递输入数据以生成输出的过程。它涉及通过将权重和偏置应用于输入并将结果传递通过激活函数来计算网络每一层中每个神经元的输出
在这里插入图片描述
其中y是神经网络的输出,f是非线性激活函数。
二、反向传播
反向传播是一种在训练神经网络时常用的优化算法。
请添加图片描述
反向传播算法的工作原理就是将输出层的误差反向传播回网络各层,并利用微积分中的链式法则计算损失函数相对于每个权重的梯度

它的核心思想是计算损失函数对网络中每个权重的梯度,然后根据这些梯度来更新权重,以最小化损失函数。通过不断地迭代这个过程,神经网络的权重可以得到调整和优化,从而提高网络的预测准确性和泛化能力。

反向传播算法在深度学习领域中非常重要,它是许多现代神经网络模型训练的基础。
三、神经网络的训练:基于输入数据和期望输出调整神经网络权值的过程,以提高网络预测的准确性。

四、权重:权重是指训练过程中学习的参数,它们决定了神经元之间连接的强度。神经元之间的每个连接都被赋予一个权重,该权重乘以神经元的输入值以确定其输出。
在这里插入图片描述
五、偏差:偏差是另一个学习参数,它被添加到给定层中神经元的输入加权和中。它是神经元的额外输入,有助于调整激活函数的输出。

六、非线性激活函数:非线性激活函数应用于神经元的输出,以将非线性引入网络。非线性很重要࿰


http://www.ppmy.cn/server/13377.html

相关文章

大型组网使用BFD提高可靠性

学习目标: 1. 当前现网业务存在哪些问题? 2. BFD的工作机制讲解; 3. BFD联动静态路由及OSPF实战; -- BFD - 双向转发检测 -- 通用技术 - 各厂商都支持 - 介质无关 - 协议无关 - 规划地址和配置地址: …

【python】随机模拟——赶火车问题、醉汉回家

问题描述 1.赶火车问题。2.模拟二维随机游动(醉汉回家) 1.赶火车问题。 一列列车从A站开往B站,某人每天赶往B站上车。他已经了解到火车从A站到B站的运行时间是服从均值为30min,标准差为2min的正态随机变量。火车大约下午13&#…

C++设计模式:适配器模式(十四)

1、定义与动机 定义:将一个类的接口转换成客户希望的另外一个接口。Adapter模式使得原本由于接口不兼容而不能一起工作的哪些类可以一起工作。 动机: 在软件系统中,由于应用环境的变化,常常需要将“一些现存的对象”放在新的环境…

GPT-3和自然语言处理的前沿:思考AI大模型的发展

引言 自然语言处理(NLP)是人工智能(AI)领域中最富有挑战性和活跃的研究领域之一。近年来,随着深度学习技术的发展和计算能力的提高,大型语言模型,尤其是OpenAI的GPT-3,已成为推动该…

Vue js闭包

JavaScript闭包详解 在JavaScript中,闭包是一个非常重要的概念,也是JavaScript区别于其他语言的一大特色。理解闭包不仅有助于提升我们的编程技能,还能让我们更好地利用JavaScript的特性和优势。本文将详细解析闭包的概念、原理、应用以及相…

STM32 USB虚拟串口

电路原理图 usb部分 晶振部分 usb与单片机连接 配置信息 sys配置信息 rcc配置信息 usb配置信息 虚拟串口配置信息 时钟配置信息 项目配置信息 代码 包含文件 主函数代码 实验效果 修改接收波特率依然可以正常接收,也就是说单片机可以自动适应上位机的波特率设置。…

hive SQL谓词下推

Sql 优化:谓词下推(PPD 定义 谓词下推的概念其实出现在sql中,在关联查询时(join,left join ,right join),因为涉及两个大表之间的关联(特别是在hive)造成资源消耗会比较大, 因为建议在join之前先将两个表进行过滤(hive…

软件测试(Web自动化测试)

一.自动化测试简介 1.自动化测试是一种把人工驱动的测试行为转化为机器执行的测试过程。 2.使用自动化测试需要满足的3个条件: (1)项目需求变动不频繁 (2)项目进度压力不大,时间不紧迫 (3&…