可靠冲突性多视角学习:通过证据驱动的多视角融合提供决策可靠性

news/2025/2/7 12:50:11/

2024年2月28日,由多位作者联合提出了一种名为可靠冲突性多视角学习(RCML)的框架,其核心贡献在于为含有冲突性实例的多视角数据提供决策结果与可靠性评估。该方法通过证据驱动的多视角融合(ECML)策略,在6个公开数据集上验证了其在准确性、可靠性和鲁棒性上的优势。

研究强调,传统方法仅通过消除冲突实例(如删除或替换)来处理多视角数据,而ECML首次将可靠性建模引入冲突性数据决策流程,填补了实际应用中对冲突实例直接决策的需求空白。

一、研究背景

多视角学习旨在通过整合多个特征视角实现对数据的全面描述,广泛应用于推荐系统、视觉理解等领域。例如,自动驾驶系统通过相机、雷达等多传感器融合环境信息,推荐系统则需整合用户生成的文本、视觉内容等多视角数据。然而,现实数据往往存在冲突性实例,即同一数据实例在不同视角下呈现矛盾信息(如用户提到千岛酱,图像显示的是汉堡)

目前遇到困难和挑战:

1、传统方法的局限性:现有研究主要通过多视角异常值检测或部分视角对齐消除冲突实例,但实际应用中需对冲突实例做出决策(如推荐系统需预测用户偏好),而非简单剔除。

2、可靠性建模缺失:现有模型(如EDL)虽能提供决策结果,但未明确评估决策的可靠性,尤其在冲突性数据中,预测结果的置信度需与冲突程度动态关联。

3、多视角融合的冲突性处理:简单平均融合可能忽视视角间冲突性差异,导致可靠性过度乐观或低估。例如,当一个视角数据质量低但被赋予过高权重时,融合结果可能更不可靠。

在实际场景中(如医疗诊断、智能推荐),模型需同时回答“决策结果是什么”和“该决策是否可靠”。ECML通过构建观点聚合策略,理论上证明其能精确建模多视角共性与视角特异性可靠性关系,为冲突性数据提供可靠决策支持。

二、让我们一起看一下ECML

ECML(证据冲突多视图学习)

ECML是针对RCML问题提出的一种解决方案。它通过以下步骤实现对冲突多视图数据的处理和决策:

1、特定视图的证据学习:ECML首先通过特定视图的证据深度神经网络(DNN)从数据中收集每个类别的支持量(证据)。这些证据用于构建狄利克雷分布,从而为每个视图生成包含置信质量、不确定性质量以及先验概率分布的意见。

2、冲突意见聚合:在多视图融合阶段,ECML提出了一种新的冲突意见聚合策略。该策略通过计算不同视图之间的冲突度(基于预测概率的投影距离和连接确定性),并根据这些冲突度来调整融合过程。当视图之间的意见冲突较大时,聚合后的不确定性会增加,从而更准确地反映决策的可靠性。

3、理论证明与优化:ECML从理论上证明了其冲突意见聚合策略可以精确地模拟多视图公共可靠性和特定视图可靠性的关系。此外,ECML还通过最小化视图之间的冲突度来优化模型,确保在训练阶段不同视图之间的一致性。

4、实验验证:在多个数据集上的实验结果表明,ECML在准确性、可靠性和鲁棒性方面均优于现有的多视图学习方法。

RCML和ECML的提出,为处理现实世界中多视图数据的冲突问题提供了新的思路和方法。RCML定义了一个新的问题场景,强调了在冲突数据中进行可靠决策的重要性;而ECML则通过证据学习和冲突意见聚合,为这一问题提供了有效的解决方案。

ECML 图示。特定于视图的 DNN 收集证据,这可以称为对每个类别的支持量。然后,我们形成由所有类别的信念量和不确定性(倒置为可靠性)组成的特定于视图的观点。最后,我们通过冲突意见聚合来整合意见。如果特定于视图的意见存在冲突,则汇总意见的不确定性可能会增加。

三、让我们来看一下ECML应用场景

通常呢,我们在工业生产线上会安装多种传感器来监测设备的运行状态,比如温度传感器、压力传感器、振动传感器等。

以前,我们主要依靠单一传感器的数据来判断设备是否正常。

比如,如果温度传感器显示设备运行温度在正常范围内,我们就会认为设备没有问题。但如果压力传感器突然显示异常,我们就会很困惑,因为不知道该相信哪个传感器。这种情况下,我们通常会派人去现场检查,这不仅耗时耗力,还可能导致生产中断。而且,以前我们很难提前预测设备故障。只有当某个传感器的数据明显超出正常范围时,我们才会意识到可能有问题。这就导致我们总是处于被动维修的状态,设备的突发故障会严重影响生产进度。

哈哈,现在有了ECML,那可就不一样了:

首先,ECML能够综合多个传感器的数据,即使这些数据之间存在冲突,也能给出更可靠的判断。比如,当温度传感器显示设备运行正常,但压力传感器显示异常时,ECML会综合考虑这两个传感器的数据,以及它们的历史数据和相关性,来判断设备的真实状态。它会告诉我们,这个异常是真正的故障迹象,还是只是传感器的误报。

其次,ECML可以提前预测设备故障。通过分析多传感器数据的趋势和模式,它能够在故障发生之前就发出预警。这样,我们就可以提前安排维修,避免设备突发故障导致的生产中断。

最后,ECML还提高了故障诊断的准确性。它能够处理来自不同传感器的复杂数据,包括非线性关系和非高斯特性。这意味着我们能够更准确地定位故障点,减少误判和漏判。

ECML让我们的工作变得更加高效和主动。避免了因为误判来回跑着去检查,同时我们能够更及时地发现和处理设备问题,避免了不必要的生产损失。

论文中提到数据集整理:

数据集:HandWritten

数据集地址:敬请期待

数据集:CUB

数据集地址:CUB-200|图像分类数据集|计算机视觉数据集

数据集:HMDB

数据集地址:HMDB大型人类动作数据集|动作识别数据集|计算机视觉数据集

数据集:Scene15

数据集地址:敬请期待

数据集:Caltech101

数据集地址:Caltech101|图像识别数据集|机器学习数据集

数据集:PIE

数据集地址:敬请期待

祝大家新年快乐!

祝大家

眼里有光,兜里有款。

日有熹,月有光,富且昌,寿而康。

好风凭借力,送你上青云。

愿每个人都能在自己的江湖里执梦为剑,潇洒快意!


http://www.ppmy.cn/news/1570070.html

相关文章

【分布式架构理论3】分布式调用(2):API 网关分析

文章目录 一、API 网关的作用1. 业务层面:简化调用复杂性2. 系统层面:屏蔽客户端调用差异3. 其他方面: 二、API 网关的技术原理1. 协议转换2. 链式处理3. 异步请求机制1. Zuul1:同步阻塞处理2. Zuul2:异步非阻塞处理 三…

HTTP异步Client源码解析

我们知道Netty作为高性能通信框架,优点在于内部封装了管道的连接通信等操作,用户只需要调用封装好的接口,便可以很便捷的进行高并发通信。类似,在Http请求时,我们通过调用HttpClient,内部使用java NIO技术&…

使用 cipher /w 清除磁盘删除残留数据(Windows) - 随笔

cipher命令是Windows 系统自带的一个用于管理文件加密和磁盘数据清除的工具。通过 cipher /w 命令,可以清除磁盘上已删除文件的残留数据,确保这些数据无法被恢复。以下是一个简易的批处理脚本,用于清除指定磁盘上的加密数据。 echo off :: 清…

排序算法与查找算法

1.十大经典排序算法 我们希望数据以一种有序的形式组织起来&#xff0c;无序的数据我们要尽量将其变得有序 一般说来有10种比较经典的排序算法 简单记忆为Miss D----D小姐 时间复杂度 &#xff1a;红色<绿色<蓝色 空间复杂度&#xff1a;圆越大越占空间 稳定性&…

DeepSeek 遭 DDoS 攻击背后:DDoS 攻击的 “千层套路” 与安全防御 “金钟罩”

当算力博弈升级为网络战争&#xff1a;拆解DDoS攻击背后的技术攻防战——从DeepSeek遇袭看全球网络安全新趋势 在数字化浪潮席卷全球的当下&#xff0c;网络已然成为人类社会运转的关键基础设施&#xff0c;深刻融入经济、生活、政务等各个领域。从金融交易的实时清算&#xf…

Lerna和Yarn Workspaces的优缺点分别是什么?

Lerna 和 Yarn Workspaces 的优缺点比较 在现代 JavaScript 开发中,管理多包结构变得越来越重要。Lerna 和 Yarn Workspaces 是两种流行的工具,帮助开发者有效地管理和组织项目中的多个包。虽然它们的目标相似,但在功能和使用体验上却各有千秋。本文将深入探讨这两者的优缺…

【starrocks学习】之将hive表数据同步到starrocks

目录 一、确认环境 二、创建StarRocks表 三、导出Hive表数据 四、将数据导入StarRocks 1.使用Broker Load 2.使用Stream Load 五、验证数据 六、注意事项 一、确认环境 确保Hive和StarRocks都已正确安装并运行。 二、创建StarRocks表 在StarRocks中创建与Hive表结构一…

二级C语言题解:十进制转其他进制、非素数求和、重复数统计

目录 一、程序填空&#x1f4dd; --- 十进制转其他进制 题目&#x1f4c3; 分析&#x1f9d0; 二、程序修改&#x1f6e0;️ --- 非素数求和 题目&#x1f4c3; 分析&#x1f9d0; 三、程序设计&#x1f4bb; --- 重复数统计 题目&#x1f4c3; 分析&#x1f9d0; 前言…