Sym-NCO:利用对称性进行神经组合优化

news/2024/10/9 0:45:38 标签: python


文章目录

  • Abstract
  • 1 Introduction
  • 2 组合优化马尔可夫决策过程中的对称性
    • 2.1 组合马尔可夫决策过程
    • 2.2 CO-MDP中的对称性
  • 3 对称神经组合优化
    • 3.1 通过LSym-RL正则化REINFORCE的问题和解决方案对称性
    • 3.2 通过预先识别的对称性学习不变表示: L i n v L_{inv} Linv
  • 4 相关工作
  • 5 Experiments
    • 5.1 任务和基线选择
    • 5.2 实验设置
    • 5.3 性能指标
    • 5.4 实验结果
  • 6 讨论
    • 6.1 基于正则化的对称性学习讨论
    • 6.2 限制和未来方向
    • 6.3 社会影响

Abstract

深度强化学习(DRL)基础的组合优化(CO)方法(即DRL-NCO)与传统的CO求解器相比具有显著优势,因为DRL-NCO能够学习较少依赖于特定问题的专家领域知识(启发式方法)和监督标记数据(监督学习方法)。本文提出了一种新的训练方案Sym-NCO,它是一种基于正则化的训练方案,利用各种CO问题和解决方案中的普遍对称性。利用诸如旋转和反射不变性等对称性可以显著提高DRL-NCO的泛化能力,因为它允许学习到的求解器利用同一CO问题类别中共同的对称性。我们的实验结果验证了我们的Sym-NCO在四个CO任务上大大提高了DRL-NCO方法的性能,包括旅行商问题(TSP)、带容量限制的车辆路径问题(CVRP)、奖励收集TSP(PCTSP)和定向问题(OP),而且没有利用特定问题的专家领域知识。值得注意的是,Sym-NCO不仅超越了现有的DRL-NCO方法,而且在PCTSP中以240倍更快的速度超越了竞争性的常规求解器——迭代局部搜索(ILS)。我们的源代码可在https://git


http://www.niftyadmin.cn/n/5695072.html

相关文章

TCP BIC 的拟合函数分析

前面说了这么多,还没有对 bic 的数学性质进行分析,本文补上。 tcp reno 完全依赖 ack 时钟以 rtt 为单位线性增窗,增窗速度与 rtt 负相关,如何在 rtt 比较大时增加增窗速度,这就是 bic,以二分替换遍历。 …

企业薪酬管理怎么做?

企业薪酬管理怎么做? 薪酬管理作为人力资源管理的核心议题,直接关乎员工积极性与企业效能。合理的薪酬策略能吸引、保留并激励人才,反之则可能产生负面影响。随着外部环境的变化,人才价值观多元化,薪酬管理的重要性愈…

“我养你啊“英语怎么说?别说成I raise you!成人学英语到蓝天广场附近

“我养你啊”这句经典台词出自周星驰自导自演的电影《喜剧之王》。在这部电影中,周星驰饰演的尹天仇对张柏芝饰演的柳飘飘说出了这句深情而动人的台词。这句台词出现在柳飘飘即将离去之时,尹天仇鼓起勇气,用它作为对柳飘飘个人困境的承诺&…

Java中Collections类详解

Java的集合框架(Collections Framework)是一组专门用于处理数据集合的类和接口。它提供了多种高效的数据结构和算法,帮助开发人员简化复杂的数据操作。Java的集合框架位于 java.util 包中,并且自Java 2 (JDK 1.2) 以来已经成为Jav…

BOS系统:企业运营的智能平台

引言 BOS(Business Operating System,业务操作系统)是一种为企业用户提供灵活、可扩展业务应用平台的系统。它能够支持企业快速响应市场变化,提高业务效率,并实现业务流程的优化。 什么是BOS系统? BOS系…

传奇GOM引擎架设好进游戏后提示请关闭非法外挂,重新登录,如何处理?

今天在架设一个GOM引擎的版本时,进游戏之后刚开始是弹出一个对话框,提示请关闭非法外挂,重新登录,我用的是绿盟登陆器,同时用的也是绿盟插件,刚开始我以为是绿盟登录器的问题,于是就换成原版gom…

类与对象、封装、继承和多态

文章目录 一、类与对象什么是对象什么是类什么是面向对象如何定义类如何new对象 二、继承什么是继承如何实现继承继承的特点和要求继承属性和方法不会继承父类的构造器 子类可以重写父类的方法方法重载和重写的区别Object类toString的重写super关键字 三、多态什么是多态运行时…

大模型从入门到应用——LangChain:模型(Models)-[大型语言模型(LLMs):基础知识!

LangChain系列文章: 基础知识快速入门 安装与环境配置链(Chains)、代理(Agent:)和记忆(Memory)快速开发聊天模型 模型(Models) 基础知识大型语言模型(LLMs&a…