1、Unsupervised anomaly detection algorithms on real-world data: how many do we need?真实世界数据的无监督异常检测算法：我们需要多少？

Abstract：

所陈述的先前论文研究中发现表现较好的些算法：

数据的处理步骤：

通常评估异常分数比某些算法产生的二值标签更有用
异常检测评估中最常用的指标：根据ROC(接收者工作特征)曲线产生的AUC(曲线下面积)值计算每个算法-数据集组合的性能。
使用Iman-Davenport统计量(Iman and Davenport, 1980)来确定算法之间是否存在显著差异。（如果该统计量低于对应于p值0.05的期望临界值，我们应用Nemenyi事后检验(Nemenyi, 1963)，然后评估哪些算法彼此显著不同。）
，用a中的一个算法和d中的一个数据集

用户应该在什么时候应用哪种异常检测方法来解决他们的问题

根据异常对应的训练数据标签的可用性对这些技术进行分类，即监督、半监督和无监督技术。

无监督：基于GAN的架构用于比较生成图像与测试图像的瓶颈特征、

DNN非常容易受到测试时间对抗样例的影响——人类难以察觉的扰动，当将其添加到任何图像时，都会导致其高概率被错误分类。

启发式的方法是需要手动选择参数的，比如KNN。

一般来说，基于距离(KNN)和基于投影(GAN)的方法在测试阶段的计算成本很高。

Intrusion Detection 入侵检测。一个关键挑战是庞大的数据量和复杂的恶意模式，DL在此有广阔的应用前景
Fraud Detection 欺诈检测。需准确地识别欺诈交易，实时检测。曾用到LSTM、CNN等。
Healthcare and Industrial Domains 医疗保健和工业领域检测。要求准确性，易受到OOD和对抗性示例的影响。
Malware Detection 恶意软件检测。监控计算机系统的活动来检测恶意软件。
Time Series and Video Surveillance Anomaly Detection 时间序列和视频监控异常检测。基于RNN和LSTM的方法在多变量时间序列数据异常检测中表现良好。

根据异常示例标签的可用性和使用的度量类型对异常检测算法进行分类。对集成检测方法的探索可能是一个有价值的未来方向。集成方法将提供互补优势的多个检测器的输出组合成一个检测器，从而与使用单个检测器相比产生更好的性能。
Going beyond image classification 超越图像分类，超越分类问题，探索基于深度学习的对象检测、控制和规划问题中的异常设计和检测可能是未来一个具有重要影响的研究方向。
heoretical analysis and Fundamental Limits 理论分析和基本限制，在有种模式中，大多数基于启发式的防御(包括后检测和基于训练的)很容易被新的攻击打破。发展连贯的理论和方法来指导基于dl的系统异常检测的实际设计，以及对抗性示例存在的基本特征是至关重要的。

可以把神经网络看作是一个利用非线性降维对异常值进行评分的模型。

将集成学习方法与自编码器结合使用，以获得更高的精度。

Bouman, Roel et al. “Unsupervised anomaly detection algorithms on real-world data: how many do we need?” (2023).
Bulusu, Saikiran et al. “Anomalous Instance Detection in Deep Learning: A Survey.” ArXiv abs/2003.06979 (2020): n. pag.
Chen, Jinghui et al. “Outlier Detection with Autoencoder Ensembles.” SDM (2017).