【论文阅读】Twin Neural Network Regression

news/2024/11/29 9:41:58/

论文下载
GitHub
bib:

@ARTICLE{SebastianKevin2022Twin,title 		= {Twin neural network regression},author 		= {Sebastian Johann Wetzel and Kevin Ryczko and Roger Gordon Melko and Isaac Tamblyn},journal 	= {Applied AI Letters},year 		= {2022},volume 		= {3},number 		= {4},pages 	    = {e78},doi         = {10.1002/ail2.78}
}

1. 摘要

We introduce twin neural network (TNN) regression.

This method predicts differences between the target values of two different data points rather than the targets themselves.

The solution of a traditional regression problem is then obtained by averaging over an ensemble of all predicted differences between the targets of an unseen data point and all training data points.

Whereas ensembles are normally costly to produce, TNN regression intrinsically creates an ensemble of predictions of twice the size of the training set while only training a single neural network.

虽然集合通常是昂贵的生产,但TNN回归本质上创建的预测集合是训练集大小的两倍,同时只训练单个神经网络。为什么是这样的,阅读后面的内容值得注意。

Since ensembles have been shown to be more accurate than single models this property naturally transfers to TNN regression.

We show that TNNs are able to compete or yield more accurate predictions for different data sets, compared to other state-of-the-art methods.

Furthermore, TNN regression is constrained by self-consistency conditions.

We find that the violation of these conditions provides an estimate for the prediction uncertainty.

Note:
全文中主要出现了两个关键字,esembleself-consistency

2. 算法描述

在这里插入图片描述
从这张图中,可以大概的看出算法的华点。经典的神经网络主要是直接预测一个值,而TNNR是预测两个向量之间的距离。这样就将原本预测未知点的值转化为了预测已知点与未知点之间的差值。值得注意的是,twin neural network也叫孪生网络(siamese neural network),是度量学习中的内容。

从图中的环,可以同样推出self-consistency。也就是说:
( y 3 − y 1 ) + ( y 1 − y 2 ) + ( y 2 − y 3 ) = 0 (y_3-y_1) + (y_1-y_2)+(y_2-y_3) = 0 (y3y1)+(y1y2)+(y2y3)=0
F ( x 3 , x 1 ) + F ( x 1 , x 2 ) + F ( x 2 , x 3 ) = 0 (1) F(x_3, x_1) + F(x_1, x_2) + F(x_2, x_3) = 0 \tag{1} F(x3,x1)+F(x1,x2)+F(x2,x3)=0(1)
其中,等式1表述的就是self-consistency

算法细节:

  1. The training objective is to minimize the mean squared error on the training set.
  2. we employ standard gradient descent methods adadelta (and rmsprop) to minimize the loss on a batch of 16 pairs at each iteration.
  3. All data is split into 90% training, 5% validation, and 5% test data. Each run is performed on a randomly chosen different split of the data.
  4. we train on a generator which generates all possible pairs batchwise before reshuffling.

3. 实验

我一般是不会仔细看实验的,在这篇论文中我看到一个有意思的点。

3.1. | Prediction accuracy

在这里插入图片描述
论文中说,TNNR算法的优势是将训练集拓充到了二次方,但是在实际实验中,在大训练集上,TNNR反而会变差。

If the training set is very large, the number of pairs increases quadratically to a point where the TNN will in practice converge to a minimum before observing all possible pairs. At that point, the TNN begins to lose its advantages in terms of prediction accuracy.

其实,我觉得主要是模型的参数量太小,训练集变大,限制了神经网络的学习能力。

3.2. | Prediction uncertainty estimation

利用self-consistency的违反来建模预测不确定性。但是在实验部分的表述我不太能看懂。


http://www.ppmy.cn/news/259463.html

相关文章

人工智能时代已经到来,政务工业商业等各领域都将是刚需

2016年3月Google的AlphaGo战胜韩国顶尖职业围棋选手李世石绝对可以称得上近代人工智能标志性的事件。以此为时间点在Google Trends上搜索人工智能相关的关键字,比较近年流行的机器学习框架,我们可以看到近年人工智能在国内的热度在逐年攀升。   2017年…

人工智能笔记小抄

第一章 绪论 本课程的学习内容 1、智能体如何求解问题——搜索 2、智能体如何进行推理决策——谓词逻辑与归结原理 3、智能体如何描述和保存各种信息——知识表示 4、智能体如何通过训练获取和更新知识——机器学习 5、人工智能语言简介——prolog 人类的智能 什么是智…

织女---论以智能检测为核心建立智能纺织印染检测系统

织女---论以智能检测为核心建立智能纺织印染检测系统 2017李万鸿 智能纺织是纺织工业的未来,如何实现这个智能体系?这里给出一个科学合理的思路。 智能的关键在于采用深度学习技术提供智能服务功能,采用大数据、移动、物联网、人工智能、云…

[SSD核心技术:FTL 4] 话说固态硬盘里的HMB (主机内存缓冲区)

声明 主页: 元存储的博客_CSDN博客 依公开知识及经验整理,如有误请留言。 个人辛苦整理,付费内容,禁止转载。 内容摘要 1. 何为 HMB? 2. HMB 是怎么做到的? 2.1 被替代的 DRAM 2.2 HMB 如何增效 2.3 快速写缓冲器 (FWB)

如何充分利用移动硬盘_充分利用移动商务

如何充分利用移动硬盘 The previous article describes the scope that Mobile Commerce has to offer to businesses, to read it please visit : Mobile commerce : The Shifting Trend of Business 上一篇文章描述了移动商务必须提供给企业的范围,要阅读该书&…

大数据与人工智能

技术不足导致移动互联网难以催生出更多的新应用和商业模式,为突破瓶颈,新一轮更激动人心、更值得期待的技术革命风暴已经诞生,将成为未来10年乃至更长时间内IT产业发展的焦点,它的名字叫做“人工智能”(AI)…

全球及中国硬盘用铝质基板行业行业经营模式与十四五规划研究报告2022-2028年

全球及中国硬盘用铝质基板行业行业经营模式与十四五规划研究报告2022-2028年 详情内容请咨询鸿晟信合研究院! 【全新修订】:2022年3月 【撰写单位】:鸿晟信合研究网. 2021年全球硬盘用铝质基板市场规模大约为 亿元(人民币&#…

硬盘底座linux,电脑存储空间不够用? 外置硬盘底座理解下!

电脑存储空间不够用? 外置硬盘底座理解下! 2018-08-03 11:00:05 53点赞 314收藏 91评论 随着现在PC主机的容积越来越小的趋势,3.5硬盘更多的是作为外置存储盘使用,而对于一体机或笔记本用户更是如此,随着机械硬盘容量及…