Sym-NCO:利用对称性进行神经组合优化

embedded/2024/12/22 10:53:33/


文章目录

  • Abstract
  • 1 Introduction
  • 2 组合优化马尔可夫决策过程中的对称性
    • 2.1 组合马尔可夫决策过程
    • 2.2 CO-MDP中的对称性
  • 3 对称神经组合优化
    • 3.1 通过LSym-RL正则化REINFORCE的问题和解决方案对称性
    • 3.2 通过预先识别的对称性学习不变表示: L i n v L_{inv} Linv
  • 4 相关工作
  • 5 Experiments
    • 5.1 任务和基线选择
    • 5.2 实验设置
    • 5.3 性能指标
    • 5.4 实验结果
  • 6 讨论
    • 6.1 基于正则化的对称性学习讨论
    • 6.2 限制和未来方向
    • 6.3 社会影响

Abstract

深度强化学习(DRL)基础的组合优化(CO)方法(即DRL-NCO)与传统的CO求解器相比具有显著优势,因为DRL-NCO能够学习较少依赖于特定问题的专家领域知识(启发式方法)和监督标记数据(监督学习方法)。本文提出了一种新的训练方案Sym-NCO,它是一种基于正则化的训练方案,利用各种CO问题和解决方案中的普遍对称性。利用诸如旋转和反射不变性等对称性可以显著提高DRL-NCO的泛化能力,因为它允许学习到的求解器利用同一CO问题类别中共同的对称性。我们的实验结果验证了我们的Sym-NCO在四个CO任务上大大提高了DRL-NCO方法的性能,包括旅行商问题(TSP)、带容量限制的车辆路径问题(CVRP)、奖励收集TSP(PCTSP)和定向问题(OP),而且没有利用特定问题的专家领域知识。值得注意的是,Sym-NCO不仅超越了现有的DRL-NCO方法,而且在PCTSP中以240倍更快的速度超越了竞争性的常规求解器——迭代局部搜索(ILS)。我们的源代码可在https://git


http://www.ppmy.cn/embedded/125022.html

相关文章

回到原点再出发

原文What Goes Around Comes Around作者Michael Stonebraker & Joseph M. Hellerstein其他译文https://zhuanlan.zhihu.com/p/111322429 1. 摘要 本文总结了近35年来的数据模型方案,分成9个不同的时代,讨论了每个时代的方案。我们指出,…

Golang | Leetcode Golang题解之第456题132模式

题目&#xff1a; 题解&#xff1a; func find132pattern(nums []int) bool {candidateI, candidateJ : []int{-nums[0]}, []int{-nums[0]}for _, v : range nums[1:] {idxI : sort.SearchInts(candidateI, 1-v)idxJ : sort.SearchInts(candidateJ, -v)if idxI < idxJ {ret…

【Vue】Vue 快速教程

Vue tutorial 参考&#xff1a;教程 | Vue.js (vuejs.org) 该教程需要前置知识&#xff1a;HTML, CSS, JavaScript 学习前置知识&#xff0c;你可以去 MDN Vue framework 是一个 JavaScript framework&#xff0c;以下简称 Vue&#xff0c;下面是它的特点 声明式渲染&#xff…

【CTF Web】Pikachu 本地文件包含 Writeup(文件包含漏洞+GET请求)

File Inclusion(文件包含漏洞)概述 文件包含&#xff0c;是一个功能。在各种开发语言中都提供了内置的文件包含函数&#xff0c;其可以使开发人员在一个代码文件中直接包含&#xff08;引入&#xff09;另外一个代码文件。 比如 在PHP中&#xff0c;提供了&#xff1a; includ…

Ubuntu22.04 获取docker 镜像失败如何处理

最近在使用docker 获取镜像发现 如下错误 无法正常的访问 如果能正常上网的情况下&#xff0c;可以尝试如下操作 首先进入/etc/docker/daemon.json文件 然后在里面加入下面的配置 { "registry-mirrors": ["https://docker.registry.cyou", "htt…

【原创】MacOS 上Android Studio 登录问题解决方法

在 Android Studio 右上角有一个用户登录的按钮。 登录之后&#xff0c;可以启用 Google 的人工智能代码填写功能插件&#xff0c;目前虽然是预览版&#xff0c;但是毕竟好奇&#xff0c;想用一用。 错误做法 按照正常流程打开&#xff1a;启动台-> Android Studio 点击登…

PHP如何解析配置文件

在PHP中解析配置文件有多种方法&#xff0c;具体取决于配置文件的格式。常见的配置文件格式包括INI文件、YAML文件、JSON文件以及PHP数组文件&#xff08;即PHP文件本身包含配置数组&#xff09;。下面是一些常用的方法来解析这些配置文件。 1. 解析INI文件 INI文件是最常见的…

Spring Boot 进阶-SpringBoot如何整合多数据源场景

对多数据源大家应该不陌生,一般的在单个应用都会存在一个数据库,一个文件存储。这里所说的数据库就是我们描述的数据源。那么多数据源的意思其实通俗来讲就是在一个单体应用中存在两个以上的数据库。这个时候就需要我们对多个数据源进行分别对待进行处理了。 理解多数据源的…