論文の概要: Learning to Search Feasible and Infeasible Regions of Routing Problems
with Flexible Neural k-Opt
- arxiv url: http://arxiv.org/abs/2310.18264v1
- Date: Fri, 27 Oct 2023 16:51:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-30 12:54:25.740479
- Title: Learning to Search Feasible and Infeasible Regions of Routing Problems
with Flexible Neural k-Opt
- Title(参考訳): フレキシブル・ニューラルk-Optを用いた経路問題の有益かつ実用的領域の探索学習
- Authors: Yining Ma, Zhiguang Cao, Yeow Meng Chee
- Abstract要約: ルーティング問題に対する新しい学習探索(L2S)解法であるNeuOpt(NeuOpt)を提案する。
カスタマイズされたアクションファクター化法と、カスタマイズされたリカレントなデュアルストリームデコーダに基づいて、柔軟なk-opt交換を実行することを学ぶ。
- 参考スコア(独自算出の注目度): 30.510841880901655
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present Neural k-Opt (NeuOpt), a novel learning-to-search
(L2S) solver for routing problems. It learns to perform flexible k-opt
exchanges based on a tailored action factorization method and a customized
recurrent dual-stream decoder. As a pioneering work to circumvent the pure
feasibility masking scheme and enable the autonomous exploration of both
feasible and infeasible regions, we then propose the Guided Infeasible Region
Exploration (GIRE) scheme, which supplements the NeuOpt policy network with
feasibility-related features and leverages reward shaping to steer
reinforcement learning more effectively. Additionally, we equip NeuOpt with
Dynamic Data Augmentation (D2A) for more diverse searches during inference.
Extensive experiments on the Traveling Salesman Problem (TSP) and Capacitated
Vehicle Routing Problem (CVRP) demonstrate that our NeuOpt not only
significantly outstrips existing (masking-based) L2S solvers, but also
showcases superiority over the learning-to-construct (L2C) and
learning-to-predict (L2P) solvers. Notably, we offer fresh perspectives on how
neural solvers can handle VRP constraints. Our code is available:
https://github.com/yining043/NeuOpt.
- Abstract(参考訳): 本稿では,ルーティング問題に対する新しいL2S(Learning-to-search)解法であるNeuOpt(NeuOpt)を提案する。
カスタマイズされたアクションファクタライゼーション法とカスタマイズされた再帰的デュアルストリームデコーダに基づいて、柔軟なk-opt交換を行うことを学ぶ。
そこで,本研究では,本研究の先駆的な取り組みとして,Nuoptポリシネットワークに実現可能性に関連する特徴を補足し,報酬形成を活用して,強化学習をより効果的に進めるガイド・インファシブル地域探索(GIRE)手法を提案する。
さらに、推論中により多様な検索を行うために、動的データ拡張(D2A)をNeuOptに装備する。
CVRP(Traking Salesman Problem)とCVRP(Capacitated Vehicle Routing Problem)の広範な実験により、NeuOptは既存の(マスキングベース)L2Sソルバをはるかに上回るだけでなく、L2C(Learning-to-Construct)やL2P(Learning-to-predict)ソルバよりも優れていることが示された。
特に、ニューラルソルバがVRP制約をどのように扱えるか、新たな視点を提供しています。
コードはhttps://github.com/yining043/neuopt.com/。
関連論文リスト
- NavCoT: Boosting LLM-Based Vision-and-Language Navigation via Learning
Disentangled Reasoning [101.56342075720588]
Embodied AIの重要な研究課題であるVision-and-Language Navigation (VLN)は、自然言語の指示に従って複雑な3D環境をナビゲートするために、エンボディエージェントを必要とする。
近年の研究では、ナビゲーションの推論精度と解釈可能性を改善することにより、VLNにおける大きな言語モデル(LLM)の有望な能力を強調している。
本稿では,自己誘導型ナビゲーション決定を実現するために,パラメータ効率の高いドメイン内トレーニングを実現する,Navigational Chain-of-Thought (NavCoT) という新しい戦略を提案する。
論文 参考訳(メタデータ) (2024-03-12T07:27:02Z) - Fixing the NTK: From Neural Network Linearizations to Exact Convex
Programs [63.768739279562105]
学習目標に依存しない特定のマスクウェイトを選択する場合、このカーネルはトレーニングデータ上のゲートReLUネットワークのNTKと等価であることを示す。
この目標への依存の欠如の結果として、NTKはトレーニングセット上の最適MKLカーネルよりもパフォーマンスが良くない。
論文 参考訳(メタデータ) (2023-09-26T17:42:52Z) - In-Context Operator Learning with Data Prompts for Differential Equation
Problems [12.61842281581773]
本稿では、新しいニューラルネットワークベースのアプローチ、すなわちIn-Context Operator Networks (ICON)を紹介する。
ICONは、トリガーされたデータから演算子を同時に学習し、推論段階で新しい質問に適用する。
数値計算の結果,多変量微分方程式問題に対する数発の演算子学習器としてのニューラルネットワークの機能を示す。
論文 参考訳(メタデータ) (2023-04-17T05:22:26Z) - Benign Overfitting for Two-layer ReLU Convolutional Neural Networks [60.19739010031304]
ラベルフリップ雑音を持つ2層ReLU畳み込みニューラルネットワークを学習するためのアルゴリズム依存型リスクバウンダリを確立する。
緩やかな条件下では、勾配降下によってトレーニングされたニューラルネットワークは、ほぼゼロに近いトレーニング損失とベイズ最適試験リスクを達成できることを示す。
論文 参考訳(メタデータ) (2023-03-07T18:59:38Z) - Learning To Dive In Branch And Bound [95.13209326119153]
グラフニューラルネットワークを用いて特定の潜水構造を学習するためのL2Diveを提案する。
我々は、変数の割り当てを予測するために生成モデルを訓練し、線形プログラムの双対性を利用して潜水決定を行う。
論文 参考訳(メタデータ) (2023-01-24T12:01:45Z) - E2-AEN: End-to-End Incremental Learning with Adaptively Expandable
Network [57.87240860624937]
本稿では,E2-AENという,エンドツーエンドのトレーニング可能な適応拡張可能なネットワークを提案する。
以前のタスクの精度を落とさずに、新しいタスクのための軽量な構造を動的に生成する。
E2-AENはコストを削減し、あらゆるフィードフォワードアーキテクチャをエンドツーエンドで構築できる。
論文 参考訳(メタデータ) (2022-07-14T09:04:51Z) - Efficient Neural Neighborhood Search for Pickup and Delivery Problems [33.26295166939733]
我々は、ピックアップ・デリバリー問題(PDP)に対する効率的なニューラルネイバーフッド・サーチ(N2S)アプローチを提案する。
具体的には、バニラ自己注意が経路解に関する様々な種類の特徴を合成できる強力な合成注意を設計する。
また、プリエンス制約に対処するために、ピックアップ配信ノードペアの削除と再挿入を自動で学習する2つのカスタマイズデコーダを利用する。
論文 参考訳(メタデータ) (2022-04-25T02:27:59Z) - MultiAuto-DeepONet: A Multi-resolution Autoencoder DeepONet for
Nonlinear Dimension Reduction, Uncertainty Quantification and Operator
Learning of Forward and Inverse Stochastic Problems [12.826754199680474]
本稿では,微分方程式(SDE)の演算子学習のための新しいデータ駆動手法を提案する。
中心的な目標は、限られたデータを使ってより効果的に前方および逆問題を解決することである。
論文 参考訳(メタデータ) (2022-04-07T03:53:49Z) - A Study of the Mathematics of Deep Learning [1.14219428942199]
深層学習」/「深層ニューラルネットワーク」は、人工知能の最先端のタスクにますます展開されている技術的驚異です。
この論文は、これらの新しいディープラーニングのパラダイムの強力な理論基盤を構築するためのいくつかのステップを踏む。
論文 参考訳(メタデータ) (2021-04-28T22:05:54Z) - Online Limited Memory Neural-Linear Bandits with Likelihood Matching [53.18698496031658]
本研究では,探索学習と表現学習の両方が重要な役割を果たす課題を解決するために,ニューラルネットワークの帯域について検討する。
破滅的な忘れ込みに対して耐性があり、完全にオンラインである可能性の高いマッチングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-07T14:19:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。