AI协助探索AI新构型的自动化创新概念

news/2025/2/3 1:28:41/

训练AI自生成输出模块化代码,生成元代码级别的AI功能单元代码,然后再由AI组织为另一个AI,实现AI开发AI的能力;用AI协助探索迭代新构型AI将会出现,并成为一种新的技术路线潮流。

有限结点,无限的连接形式,也是实现一种复杂性的方式。扩展结点、增加参数,是另一种外延式的实现复杂性的方式,这种方式,也可以看作是有限结点、动态连接形式,是等效的,当连接权重置值0,就相当于连接消除,连接构型中相当于没有这个连接。两者概念的区别是:后者这种形式的动态连接形式,是区域限定的,是在有限域上的动态,“有限域”的概念是,连接形式是在搭建模型时,初始连接形式作为一个域,是框架限定的,权重置0的连接,是在这个“有限域”的初始模型连接形式范围内的消除剪枝。进一步思考,当模型训练到一定程度后,能否引入一个迭代机制,重新跳到第一步,把模型的初始连接构型按某种规则,在训练到一定程度的模型基础上,扩展重置初始构型,这样设想的目的,把“有限域”扩展为模型自己探索的“动态域”,简单地说,预训练到一定程度的模型,按某种尝试、奖励机制,自动探索扩展初始连接构型,重新开始一轮新的训练。模型自己按某种尝试、奖励机制,自动化探索扩展初始连接构型,中间肯定会产生很多垃圾构型,那就自动淘汰,模型自动化探索扩展的初始连接构型,训练后的识别效果或收敛效率参照其前一个状态,如果退步则淘汰,如果更优则覆盖,也可以理解为AI模型自己探索设计AI模型,升级方向总是以自身效果为参照,如果AI自己会自动化升级,那是一种智能形式。AI自动化升级的一种形式是,在训练过程中调整参数的权重;现在思考,探索和扩展AI自动化升级的方式,AI自动化升级的另一种形式,除了调整参数,是否让模型可以自己探索新构型。

生物神经系统的进化,从最简单到人类复杂的大脑,这个进化是连接构型扩展的过程;而对一个既定的个体,则是连接构型框架定了以后,参数权重升级的过程。生物神经系统,就明显有两个升级模式,从最简单到人类复杂的大脑,既有结点的扩展,也有链接构型的扩展。比较大象、海豚、鲸鱼的大脑和人类大脑,神经元数量在一个量级,这里面的差别,主要是构型的差别,结点规模效应的差别不是主要,可以认为是一样的。

知识蒸馏的概念不同于模型蒸馏的概念,模型蒸馏是对模型进行压缩,而知识蒸馏是对训练数据资源进行压缩。知识蒸馏的预训练模型例子说明,知识A:人是会死的。知识B:苏格拉底是人。知识C:苏格拉底会死。三个知识,知识A、知识B、知识C可以压缩,进行知识压缩,即所谓知识蒸馏,压缩为知识A、知识B就包含了前面ABC的完整信息。互联网上的海量数据,进行知识蒸馏压缩,可以得到最核心的原子级知识,这个信息池也许不大,所以训练的计算量不需要很大,然后从这些元级数据可以形式化为无穷无尽的知识。设计一个压缩验证模型,就是给它一大堆的数据,让他输出尽可能小的数据集,这个小数据集可以包含输入的全部信息数据。比如,给它输入,知识A:人是会死的。知识B:苏格拉底是人。知识C:苏格拉底会死。三个知识,它会推出这里面内含的知识冗余,然后自动化的剪切掉冗余数据。


http://www.ppmy.cn/news/1568832.html

相关文章

图片导入到ppt之后再打印就糊掉了如何解决?

最近在做一个 p o s t e r poster poster的工作是用 P P T PPT PPT做的,结果从 v i s i o visio visio导入到 P P T PPT PPT中还是高清的,打印就糊掉了,注意如果是导出的话图片还是矢量的,但是由于有纸张的要求,所以必…

3 Yarn

3 Yarn 1. yarn的架构和原理1.1 yarn的基本介绍和产生背景1.2 hadoop 1.0 和 hadoop 2.0 的区别1.3 yarn 集群的架构和工作原理1.4 yarn 的任务提交流程 2. RM和NM的功能介绍2.1 resourceManager基本介绍2.2 nodeManager功能介绍 3. yarn的applicationMaster介绍3.1 applicatio…

使用UpdateCursor删除行

UpdateCursor除了可以编辑表或要素类的行外,还可以删除行.但要记住,在编辑会话外删除行时,更改是永久性的. 操作方法: 1.打开IDLE,新建一个脚本 2.导入arcpy和os模块 import arcpy import os 3.设置工作空间 arcpy.env.workspace "<>" 4.在with语句中新…

5.3.2 软件设计原则

文章目录 抽象模块化信息隐蔽与独立性衡量 软件设计原则&#xff1a;抽象、模块化、信息隐蔽。 抽象 抽象是抽出事物本质的共同特性。过程抽象是指将一个明确定义功能的操作当作单个实体看待。数据抽象是对数据的类型、操作、取值范围进行定义&#xff0c;然后通过这些操作对数…

小白怎样部署和使用本地大模型DeepSeek ?

1 安装Ollama &#xff08;1&#xff09; 下载Ollama 从https://ollama.com/download 下载, 根据你的系统下载对应的版本&#xff0c;支持Win, Mac ,Linux&#xff1a; 如果下载不了&#xff0c;右键复制链接地址&#xff0c;贴到迅雷&#xff0c;指定可以下载下来。 (2) 安…

ubuntu系统入门流程

学习流程 安装双系统&#xff08;win11ubuntu随便啥版本&#xff0c;博客里面下的时候自己选&#xff09; ->了解一下常见的操作系统类-> 了解ubuntu系统常见文件目录是做什么的- > 了解一些ubuntu常用指令 ->安装常用的软件&#xff08;qq、vx&#xff0c;学习的…

赛博算卦之周易六十四卦JAVA实现:六幺算尽天下事,梅花化解天下苦。

佬们过年好呀~新年第一篇博客让我们来场赛博算命吧&#xff01; 更多文章&#xff1a;个人主页 系列文章&#xff1a;JAVA专栏 欢迎各位大佬来访哦~互三必回&#xff01;&#xff01;&#xff01; 文章目录 #一、文化背景概述1.文化起源2.起卦步骤 #二、卦象解读#三、just do i…

第四章 基于本地部署的大语言模型OLlamaNeo4j图数据库的知识图谱搭建

目录 一、部署本地大语言模型Ollama 二、安装Neo4j数据库 三、应用本地大语言模型搭建知识图谱 1、导入依赖库 2、连接数据库 3、加载CSV文档 4、初始化&#xff08;载入&#xff09;大模型 5、编写实体关系识别函数 6、处理文档生成知识图谱 7、将大模型识别出的关系…