新型神经网络KAN:准确性高且易于解释

server/2025/3/11 4:13:37/

人工神经网络(ANN)是现代人工智能的核心技术,广泛应用于聊天机器人、图像生成器等领域。然而,传统的神经网络由于其复杂的结构和大量的神经元连接,往往被视为“黑匣子”,难以解释其内部工作原理。近年来,研究人员开发了一种新型神经网络——柯尔莫戈洛夫-阿诺德网络(KAN),这种网络不仅在准确性上超越了传统系统,而且具有更高的可解释性,为科学家发现新的自然规律提供了有力工具。

传统神经网络的局限性
传统神经网络由多层神经元组成,每层神经元通过突触连接,每个突触学习一个权重,决定连接的强度。神经元接收来自前一层神经元的输入信号,并根据突触连接的强度进行加权,然后通过激活函数处理输入信号,输出传递给下一层神经元。尽管这种结构在许多任务中表现出色,但其复杂的连接和大量的参数使得网络内部的工作原理难以解释,限制了其在科学研究和实际应用中的潜力。

KAN的创新之处
KAN的提出为这一问题提供了新的解决方案。与传统神经网络不同,KAN中的突触不仅学习连接的权重,还学习一个将输入映射到输出的激活函数。这使得每个连接的激活函数都不同,形成了更复杂的激活函数。而神经元则变得更简单,仅将之前所有突触的输出相加。这种设计使得KAN在学习模型数据时更加灵活,同时使用的学习参数更少。

KAN以两位研究函数结合方式的数学家柯尔莫戈洛夫和阿诺德的名字命名,其设计基于数学原理,具有更高的可解释性。研究人员在2024年4月于arXiv预印本服务器上发表了他们的研究成果,展示了KAN在科学任务中的优异表现。

KAN的科学应用
研究人员用KAN进行了一系列科学实验,展示了其在物理数据建模中的潜力。例如,他们使用KAN模拟了两个有相对速度的物体擦肩而过的速度控制问题。通过生成输入输出数据点,研究人员用部分数据训练KAN,并用其余数据进行测试。结果表明,KAN在求解偏微分方程时,精度是传统神经网络的100倍,而传统神经网络的参数是KAN的100倍。

在另一项实验中,研究人员训练KAN根据数学扭结的属性预测另一个数学扭结属性。使用约30万个参数的传统网络准确率为78%,而KAN仅使用约200个参数,准确率就达到了81.6%。此外,KAN的可视化能力使得研究人员可以直观地绘制出激活函数的形状,了解每个连接的重要程度,并通过修剪弱连接和简化激活函数,用直观的单行函数总结整个KAN。

KAN的优势与挑战
KAN的优势在于其高准确性和可解释性,能够帮助科学家发现新的自然规律。麻省理工学院的物理学家刘子鸣表示,KAN未来有望成为日常科学研究的工具,帮助研究人员生成假设并解释数据集。然而,KAN也存在一些挑战,例如每个参数的训练时间较长,无法充分利用图形处理单元加速人工智能。尽管如此,刘子鸣认为KAN在许多较小规模的物理问题方面仍具有广泛应用前景。

KAN的未来发展
目前,研究人员正在探索将KAN与卷积神经网络和转换器结合,以进一步提升其性能。例如,阿根廷圣安得利斯大学的研究团队将KAN与卷积神经网络结合,用于手写数字和衣服分类任务,取得了与传统卷积神经网络相当的性能,但使用的参数减少了约40%。其他团队也在尝试将KAN与支持大型语言模型的转换器结合,以拓展其应用范围。

刘子鸣表示,未来KAN可能会帮助物理学家发现高温超导体或控制核聚变的方法。他正在寻找一种方法,让专家将他们的先验知识插入到KAN中,例如手动选择激活函数,并使用简单的界面轻松地从中提取知识。

结论
柯尔莫戈洛夫-阿诺德网络(KAN)作为一种新型神经网络,不仅在准确性上超越了传统系统,而且具有更高的可解释性,为科学家发现新的自然规律提供了有力工具。尽管KAN在训练时间和计算资源方面存在一些挑战,但其在科学研究和实际应用中的潜力不容忽视。随着研究的深入,KAN有望成为人工智能领域的重要突破,推动科学技术的进一步发展。


http://www.ppmy.cn/server/174091.html

相关文章

nginx配置反向代理服务器,实现在https网站中请求http资源

文章目录 一、前言二、Nginx反向代理的工作原理三、Nginx反向代理的主要功能‌四、Nginx反向代理的配置和使用场景五、实战配置5.1 首先,修改宝塔面板配置5.2 接着配置代理服务器5.3 完成上面所有配置后5.4最后还要在原来的index.html文件里添加5.5 或者可以操作服务…

Map<String,Object>转换为XML报文的方法

1. 使用 JAXB (Java Architecture for XML Binding) JAXB 是 Java 标准库的一部分&#xff0c;支持将 Java 对象与 XML 相互转换。虽然 JAXB 主要用于将 Java 对象转换为 XML&#xff0c;但可以通过一些技巧将 Map<String, Object> 转换为 XML。 示例代码 import java…

firewalld富规则配置黑名单

1. 屏蔽指定 IP 地址 firewall-cmd --permanent --add-rich-rule="rule family=ipv4 source address=192.168.1.100 reject"参数说明 --permanent:将规则永久保存,重启后仍然生效。--add-rich-rule:添加一条富规则。rule family=ipv4:指定规则适用于 IPv4 地址。…

可视化大屏出圈密码:地图组件深度解析

01 组件介绍 在数据可视化大屏搭建中&#xff0c;地图组件是使用最频繁且重要的组件之一。它不但能直观展现地理方位相关信息&#xff0c;还能通过与标记点、飞线、图表等各类组件巧妙搭配&#xff0c;达成更加多元、生动的数据呈现效果&#xff0c;在众多行业领域都得到了广泛…

音视频入门基础:RTP专题(16)——RTP封装音频时,音频的有效载荷结构

一、引言 《RFC 3640》和《RFC 6416》分别定义了两种对MPEG-4流的RTP封包方式&#xff0c;这两个文档都可以从RFC官网下载&#xff1a; RFC Editor 本文主要对《RFC 3640》中的音频打包方式进行简介。《RFC 3640》总共有43页&#xff0c;本文下面所说的“页数”是指在pdf阅读…

django中序列化器serializer 的高级使用和需要注意的点

在 Django REST framework(DRF)中,序列化器(Serializer)是一个强大的工具,用于将复杂的数据类型(如 Django 模型实例)转换为 Python 原生数据类型,以便将其渲染为 JSON、XML 等格式,同时也能将接收到的外部数据反序列化为 Django 模型实例。以下将介绍序列化器的高级…

【开源免费】基于SpringBoot+Vue.JS青年公寓服务平台(JAVA毕业设计)

本文项目编号 T 233 &#xff0c;文末自助获取源码 \color{red}{T233&#xff0c;文末自助获取源码} T233&#xff0c;文末自助获取源码 目录 一、系统介绍二、数据库设计三、配套教程3.1 启动教程3.2 讲解视频3.3 二次开发教程 四、功能截图五、文案资料5.1 选题背景5.2 国内…

自学微信小程序的第十四天

DAY14 1、微信小程序为我们提供了位置API,用于实现获取当前地理位置的功能,调用wx.getLocation()方法,通过该方法的success回调函数获取定位结果。若想使用位置API,需要在微信小程序管理后台的“开发管理-接口设置”页面中申请开通,并且还需要在app.json文件中添加请求用…