机器学习可解释性

server/2024/10/19 4:27:57/

机器学习稳健性可解释性结果正确性等是人工智能安全可信应用必须解决的关键问题。

传统机器学习

  • 内置可解释性:决策树IF-Then规则,直观可理解
  • 事后可解释性:训练结束后的可解释技术
  • 特定于模型体系结构的解释
  • 与解释方法及模型无关联的解释

深度学习:

  • 全局解释:机器如何对总体进行特征判断
  • 局部解释:机器说明如何判断这个样例

可解释性深度学习的类型:

  • 语义性解释:网络中间层可视化(降维)、特征重要度(随机掩码)、损失函数的可解释性约束、对抗样本(凹槽流形)。
  • 原理性可解释:过参数化的有效性理论、网络训练的泛化研究(随机矩阵、拓扑)、网络结构的复杂度研究、深度学习的万能逼近。

语义可解释机器学习方法与理论仍然处于探索阶段,聚焦于对重要特征及网络层次结构认识的研究上,随机性带来的可解释性方面挑战需要关注。

原理性解释进展与问题

  • 过参数化模型的良性过拟合--为什么大参数量的深度学习模型没有产生过拟合(目前主要面向简单模型和具有一定特性的随机分布数据)

  • 收敛性和等效模型的研究----深度学习训练过程如何影响泛化性能(目前随机梯度下降的泛化理论适用范围仍然较弱)

  • PAC框架下的复杂度研究--深度模型的结构如何影响泛化性能(挑战:结构复杂度刻画)

  • 激活函数的研究和对比--深度模型的表达能力如何(挑战:模型非线性对表达能力的影响)激活函数在不同任务和数据中作用不同,常见的激活函数的逼近能力研究较为完善,但对网络泛化性能的贡献不理解。

  • 对抗样本存在性和对抗鲁棒型的样本复杂度--深度模型面对对抗数据时是否存在缺陷(对抗数据的存在性证明)随机网络上对抗性样本的存在性不能简单迁移到随机初始化的网络(有训练过程)上,对抗样本存在性和模型深度之间的关系不明确。

统计机器学习的原理是大数定理,面临的挑战是可学习性的可解析性
深度学习的原理是逼近,挑战是泛化性能的可解释性

可学习理论

可学习理论机器学习可信性的基础:为机器学习框架与模型是否可信提供看可解释性理论

可学习理论与模型评估依据:准确度和损失

经典学习理论:寻求错误率意义下的泛化误差上界,准确度和损失是PAC可学习理论及其拓展理论基础。

经典学习算法:以错误率的连续凸上界构造目标函数,准确度和损失学习模型评估的重要依据

以准确度或其变形为目标的模型评价不能真实反应学习模型的客观学习能力,与实际情况形成一致的随机现象,可看作两个分布的一致观测中部分是随机导致的,分布之间带有随机因素的一致性为随机一致性。如何消除随机一致性对学习理论和模型评估的影响?任务和数据复杂程度都和随即一致性强相关。

影响随即一致性的因素:

学习证据缺乏完备性和充分性、准确性(训练数据采样随机性、标签标注偏差);

学习系统随机性、非理性、不可复现(算法设计随机、模型选择随机)

以上因素道中学习过程失去客观性、合理性和可解释性

随即一致性对机器学习理论的可解释性带来的挑战:
 

  • 影响经典学习理论的理论基础

  • 影响学习模型的泛化能力

  • 影响学习模型的公平性

  • 影响学习模型客观评价

参考:山西大学 钱宇华老师会议报告:机器学习可解释性研究现状与思考_哔哩哔哩_bilibili


http://www.ppmy.cn/server/132940.html

相关文章

Electron+Vue实现两种方式的截屏功能

本次介绍的截屏功能一共有两种分别是在electron环境中与非electron环境中 非electron环境 这个环境下会有一些限制: 1.只能截浏览器中的画面 2.如果里面有iframe或者base64的图片会加载不出来(这个会有解决办法) yarn add -D js-web-scree…

设计模式:单例模式

单例模式保证一个类只有一个实例,并且提供了全局访问该实例的方法。在单例模式中,通常使用一个静态方法或者一个静态变量来保存实例。该实例被程序的所有模块共享。 具体过程: 1、定义一个单例类 2、私有化构造函数,防止外界直…

如何在Android中存储数据?

在Android中存储数据是开发过程中至关重要的一环,根据数据的类型、大小、访问频率及安全性需求,开发者可以选择多种存储方式。以下是Android中存储数据的几种主要方式,每种方式都有其特定的应用场景和优缺点。 一、SharedPreferences Share…

Redis拒绝连接问题分析与解决方案

目录 前言1. 问题描述2. Redis拒绝连接的常见原因分析2.1 Redis服务未启动2.2 Redis配置中的绑定地址问题2.3 防火墙或安全组问题2.4 Redis连接池耗尽2.5 Redis服务器负载过高2.6 权限配置问题 3. 深度解决方案和优化建议4. 总结 前言 在分布式系统中,Redis作为高性…

Java基于SSM微信小程序物流仓库管理系统设计与实现(lw+数据库+讲解等)

选题背景 随着社会的发展,社会的方方面面都在利用信息化时代的优势。互联网的优势和普及使得各种系统的开发成为必需。 本文以实际运用为开发背景,运用软件工程原理和开发方法,它主要是采用java语言技术和mysql数据库来完成对系统的设计。整个…

机器学习:opencv--光流估计

目录 前言 一、光流估计前提 1.亮度恒定 2.小运动 3.空间一致 二、光流估计案例 前言 光流估计(Optical Flow Estimation)是计算机视觉中的一种技术,用于估计在连续帧图像中物体或场景的运动。它基于假设:在短时间间隔内&am…

Spring Boot为医疗行业B2B平台带来的变革

第2章 设计技术与开发环境 2.1 相关技术介绍 2.1.1 B/S模式分析 C/S模式主要由客户应用程序(Client)、服务器管理程序(Server)和中间件(middleware)三个部件组成。客户应用程序是系统中用户与数据组件交互。服务器程序负责系统资源,如管理信息数据库的有效管理&…

【Python数据分析】利用Pandas库轻松处理大数据

【Python数据分析】利用Pandas库轻松处理大数据 在现代数据分析中,随着数据量的快速增长,处理大规模数据成为了必然的挑战。幸运的是,Python作为最受欢迎的编程语言之一,其生态系统为我们提供了强大的工具,尤其是Pand…