【论文阅读】注意力机制与二维 TSP 问题

news/2025/1/15 12:36:32/

前置知识

注意力机制

见这篇

二维 TSP 问题

给定二维平面上 $n$ 个点的坐标 $S=\{x_i\}_{i=1}^n$ ，其中 $xi∈[0,1]2x_i\in [0,1]^2$ ，要找到一个 $1∼n1\sim n$ 的排列 $π\pi$ ，使得目标函数
$L(π∣s)=∥xπ1−xπn∥2+∑i=1n−1∥xπi−xπi+1∥2L(\pi|s)=\Vert x_{\pi_1}-x_{\pi_n} \Vert_2+\sum_{i=1}^{n-1}\Vert x_{\pi_{i}}-x_{\pi_{i+1}}\Vert_2$
尽可能小。

Pointer Networks

论文链接

随意选择 $π1\pi_1$ ，然后依次预测 $π2,π3,...,πn\pi_2,\pi_3,...,\pi_n$ 。

预测方式利用了注意力机制（加性模型）：
$u_j^i=v^T\tanh(W_1e_j+W_2d_i)$
其中 $v,W_1,W_2$ 是可学习的参数， $e_j$ 是（节点 $j$ 的）encoder 隐状态， $d_i$ 是（已选 $i - 1$ 个点的图的） decoder 隐状态。然后，直接将 softmax 后的 $u^i$ 作为输出：
$P(πi∣π1:i−1,P)=softmax(ui)P(\pi_i|\pi_{1:i-1},\mathcal{P})=\text{softmax}(u^i)$

encoder 和 decoder 的实现使用了单层 LSTM，训练使用 SGD。

网络结构

效果如下：
训练结果

传统的 RNN 的输出是固定词汇表上的分布，因此不能应对 $n$ 比训练集大的情况。而 Pointer Networks 的输出是输入序列上的分布，因此可以应对任意大小的 $n$ 。

Attention, Learn to Solve Routing Problems!

论文链接

引入强化学习，学习策略函数 $pθ(π∣s)=∏t=1npθ(πt∣s,π1:t−1)p_{\theta}(\pi|s)=\prod_{t=1}^np_{\theta}(\pi_t|s,\pi_{1:t-1})$ 。

encoder 和 decoder 套用 Transformer 结构。

http://www.ppmy.cn/news/31851.html

相关文章

第一章：命题与命题公式

第一章：命题与命题公式

1.命题与命题联结词 1.命题与命题的表示 1. 命题由一个或几个已知的前提，推导出来一个未知的结论的思维过程称为推理，推理的基本要素就是表达这些前提的一些陈述句，可以将这些陈述句理解为命题。（1）地球是行星（2）8不是素数（3）1 + 2 = 22. 命题真值一个陈述句不…

阅读更多...

时间复杂度和空间复杂度的计算

时间复杂度和空间复杂度的计算

目录算法的复杂度时间复杂的的概念时间复杂度计算方法大O的渐进表示法空间复杂的概念空间复杂的的计算方法时间和空间复杂度的应用消失的数字轮转数组算法的复杂度算法在编写成可执行程序后，运行时需要耗费时间资源和空间（内存&…

阅读更多...

数据结构-用栈实现队列

数据结构-用栈实现队列

前言： 请你仅使用两个栈实现先入先出队列。队列应当支持一般队列支持的所有操作（push、pop、peek、empty）： 实现 MyQueue 类： void push(int x) 将元素 x 推到队列的末尾 int pop() 从队列的开头移除并返回元素 int…

阅读更多...

Qt实用技巧：Qt中浮点数的相等比较方式（包括单精度和双精度）

Qt实用技巧：Qt中浮点数的相等比较方式（包括单精度和双精度）

若该文为原创文章，转载请注明原文出处本文章博客地址：https://hpzwl.blog.csdn.net/article/details/129464152 红胖子(红模仿)的博文大全：开发技术集合（包含Qt实用技术、树莓派、三维、OpenCV、OpenGL、ffmpeg、OSG、单片机、软…

阅读更多...

23种设计模式-建造者模式（Android应用场景介绍）

23种设计模式-建造者模式（Android应用场景介绍）

什么是建造者模式建造者模式是一种创建型设计模式，它允许您使用相同的创建过程来生成不同类型和表示的对象。在本文中，我们将深入探讨建造者模式的Java实现，并通过一个例子来解释其工作原理。我们还将探讨如何在Android应用程序中使用建造者…

阅读更多...

九龙证券|直逼1.5万亿！A股融资余额创年内新高，青睐这些行业和个股

九龙证券|直逼1.5万亿！A股融资余额创年内新高，青睐这些行业和个股

2023年以来，A股商场震动重复，商场走势整体先扬后抑，各路资金看法纷歧，但数据显现，融资客在此期间整体持续净买入，未受到商场动摇的明显冲击，融资余额日前已迫临1.5万亿元，创出年内新…

阅读更多...

Java Web 实战 07 - 多线程基础之单例模式

Java Web 实战 07 - 多线程基础之单例模式

大家好 , 这篇文章给大家带来的是单例模式 , 单例模式中分为懒汉模式和饿汉模式 , 懒汉模式是需要用的到的时候才去创建实例 , 而饿汉模式是程序一启动就立刻创建实例 , 在这其中还有很多其他问题需要我们去研究推荐大家跳转到这里 , 观看效果更加上一篇文章的链接我也贴在这…

阅读更多...

网络工程师面试题（面试必看）（3）

网络工程师面试题（面试必看）（3）

作者简介：一名云计算网络运维人员、每天分享网络与运维的技术与干货。座右铭：低头赶路，敬事如仪个人主页：网络豆的主页前言本系列将会提供网络工程师面试题，由多位专家整合出本系列面试题，包含上百家面试时的问题。面试必考率达到80%，本系列共86道题…

阅读更多...

最新文章