論文の概要: A Unified Deep Reinforcement Learning Approach for Close Enough Traveling Salesman Problem
- arxiv url: http://arxiv.org/abs/2510.03065v1
- Date: Fri, 03 Oct 2025 14:49:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-06 16:35:52.433443
- Title: A Unified Deep Reinforcement Learning Approach for Close Enough Traveling Salesman Problem
- Title(参考訳): 密閉トラベリングセールスマン問題に対する一貫した深層強化学習手法
- Authors: Mingfeng Fan, Jiaqi Cheng, Yaoxin Wu, Yifeng Zhang, Yibin Yang, Guohua Wu, Guillaume Sartoretti,
- Abstract要約: 離散化方式を用いてCETSPのマルコフ決定過程(MDP)を定式化する。
本稿では,決定をノード選択と経路決定に分離する新しい統合二重デコーダDRL(UD3RL)フレームワークを提案する。
実験の結果,UD3RLはソリューションの品質と実行時間の両方において従来の手法よりも優れていた。
- 参考スコア(独自算出の注目度): 26.907414535027613
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, deep reinforcement learning (DRL) has gained traction for solving the NP-hard traveling salesman problem (TSP). However, limited attention has been given to the close-enough TSP (CETSP), primarily due to the challenge introduced by its neighborhood-based visitation criterion, wherein a node is considered visited if the agent enters a compact neighborhood around it. In this work, we formulate a Markov decision process (MDP) for CETSP using a discretization scheme and propose a novel unified dual-decoder DRL (UD3RL) framework that separates decision-making into node selection and waypoint determination. Specifically, an adapted encoder is employed for effective feature extraction, followed by a node-decoder and a loc-decoder to handle the two sub-tasks, respectively. A k-nearest neighbors subgraph interaction strategy is further introduced to enhance spatial reasoning during location decoding. Furthermore, we customize the REINFORCE algorithm to train UD3RL as a unified model capable of generalizing across different problem sizes and varying neighborhood radius types (i.e., constant and random radii). Experimental results show that UD3RL outperforms conventional methods in both solution quality and runtime, while exhibiting strong generalization across problem scales, spatial distributions, and radius ranges, as well as robustness to dynamic environments.
- Abstract(参考訳): 近年,NPハード走行セールスマン問題 (TSP) の解決により, 深層強化学習 (DRL) が注目されている。
しかし, 近縁なTSP (CETSP) には, エージェントが周辺にコンパクトな近傍に入るとノードが訪れるという, 近隣の訪問基準がもたらす課題から, 限定的な注意が払われている。
本研究では、離散化スキームを用いてCETSPのマルコフ決定プロセス(MDP)を定式化し、決定をノード選択とウェイポイント決定に分離する新しい統合デュアルデコーダDRL(UD3RL)フレームワークを提案する。
具体的には、効果的な特徴抽出に適応エンコーダを使用し、それぞれ2つのサブタスクを処理するノードデコーダとロッドデコーダが続く。
さらに、位置復号時の空間的推論を強化するため、k-nearest neighborsサブグラフ相互作用戦略を導入する。
さらに,REINFORCEアルゴリズムをカスタマイズし,UD3RLを異なる問題サイズおよび異なる近傍半径タイプ(定数およびランダム半径)を一般化可能な統一モデルとして訓練する。
実験の結果,UD3RLは,問題スケール,空間分布,半径範囲をまたいだ強い一般化と,動的環境に対するロバスト性を示しながら,ソリューションの品質と実行性の両方において従来の手法よりも優れていた。
関連論文リスト
- Deep Equilibrium Convolutional Sparse Coding for Hyperspectral Image Denoising [16.405355853358202]
ハイパースペクトル画像(HSI)はリモートセンシングにおいて重要な役割を果たすが、複雑なノイズパターンによって劣化することが多い。
分解されたHSIの物理的特性の確保は、強靭なHSIの分解に不可欠であり、深層展開法が台頭する。
本研究では,局所的空間スペクトル相関,非局所的空間自己相似性,大域的空間一貫性を統一するDeep Equilibrium Convolutional Sparse Coding(DECSC)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-21T13:35:11Z) - Solving the Pod Repositioning Problem with Deep Reinforced Adaptive Large Neighborhood Search [0.3867363075280544]
Robotic Mobile Fulfillment Systems のPod Repositioning Problem (PRP) では、ピックステーションから戻ってくるポッドの最適な保管場所を選択する。
本研究では,大規模近傍探索(ALNS)と深層強化学習(DRL)を統合した改良型解法を提案する。
DRLエージェントは、破壊修理演算子を動的に選択し、探索中に破壊度や受容閾値などのキーパラメータを調整する。
論文 参考訳(メタデータ) (2025-06-03T11:07:41Z) - Two-Timescale Model Caching and Resource Allocation for Edge-Enabled AI-Generated Content Services [55.0337199834612]
Generative AI(GenAI)は、カスタマイズされたパーソナライズされたAI生成コンテンツ(AIGC)サービスを可能にするトランスフォーメーション技術として登場した。
これらのサービスは数十億のパラメータを持つGenAIモデルの実行を必要とし、リソース制限の無線エッジに重大な障害を生じさせる。
我々は、AIGC品質とレイテンシメトリクスのトレードオフをバランスさせるために、AIGCサービスのジョイントモデルキャッシングとリソースアロケーションの定式化を導入する。
論文 参考訳(メタデータ) (2024-11-03T07:01:13Z) - Enhancing GANs with Contrastive Learning-Based Multistage Progressive Finetuning SNN and RL-Based External Optimization [0.0]
Gene Adversarial Networks (GAN) は画像合成の最前線にあり、特に病理学のような医学分野において、データの不足、患者のプライバシー、クラス不均衡といった課題に対処している。
GANでは、トレーニングの不安定性、モード崩壊、バイナリ分類からのフィードバック不足がパフォーマンスを損なう可能性がある。
これらの課題は、複雑な特徴表現と空間的詳細のため、特に高解像度の病理像で顕著である。
論文 参考訳(メタデータ) (2024-09-30T14:39:56Z) - Design Optimization of NOMA Aided Multi-STAR-RIS for Indoor Environments: A Convex Approximation Imitated Reinforcement Learning Approach [51.63921041249406]
非直交多重アクセス(Noma)により、複数のユーザが同じ周波数帯域を共有でき、同時に再構成可能なインテリジェントサーフェス(STAR-RIS)を送信および反射することができる。
STAR-RISを屋内に展開することは、干渉緩和、電力消費、リアルタイム設定における課題を提示する。
複数のアクセスポイント(AP)、STAR-RIS、NOMAを利用した新しいネットワークアーキテクチャが屋内通信のために提案されている。
論文 参考訳(メタデータ) (2024-06-19T07:17:04Z) - Graph Attention-based Deep Reinforcement Learning for solving the
Chinese Postman Problem with Load-dependent costs [2.1212179660694104]
本稿では、負荷依存コストで中国ポストマン問題(CPP-LC)に対処する新しいDRLフレームワークを提案する。
本稿では,CPP-LC問題に効果的に対応するためのエンコーダとデコーダからなるDRL,すなわちArcDRLに基づく自己回帰モデルを提案する。
また,CPP-LCのためのアルゴリズム(EA)に基づくバイオインスパイアされた新しいメタヒューリスティックソリューションを提案する。
論文 参考訳(メタデータ) (2023-10-24T04:50:32Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。