論文の概要: Quantum Reinforcement Learning with Transformers for the Capacitated Vehicle Routing Problem
- arxiv url: http://arxiv.org/abs/2602.05920v1
- Date: Thu, 05 Feb 2026 17:32:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:09.089177
- Title: Quantum Reinforcement Learning with Transformers for the Capacitated Vehicle Routing Problem
- Title(参考訳): 容量化車両ルーティング問題に対する変圧器を用いた量子強化学習
- Authors: Eva Andrés,
- Abstract要約: 本稿では、静電容量化車両ルーティング問題(CVRP)に対処する古典的および量子強化学習(RL)アプローチの比較を行う。
Advantage Actor-Critic (A2C) エージェントは古典的、完全量子的、ハイブリッドな変種で実装されている。
その結果,3つのアプローチがすべて,効果的なルーティングポリシを学習できることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper addresses the Capacitated Vehicle Routing Problem (CVRP) by comparing classical and quantum Reinforcement Learning (RL) approaches. An Advantage Actor-Critic (A2C) agent is implemented in classical, full quantum, and hybrid variants, integrating transformer architectures to capture the relationships between vehicles, clients, and the depot through self- and cross-attention mechanisms. The experiments focus on multi-vehicle scenarios with capacity constraints, considering 20 clients and 4 vehicles, and are conducted over ten independent runs. Performance is assessed using routing distance, route compactness, and route overlap. The results show that all three approaches are capable of learning effective routing policies. However, quantum-enhanced models outperform the classical baseline and produce more robust route organization, with the hybrid architecture achieving the best overall performance across distance, compactness, and route overlap. In addition to quantitative improvements, qualitative visualizations reveal that quantum-based models generate more structured and coherent routing solutions. These findings highlight the potential of hybrid quantum-classical reinforcement learning models for addressing complex combinatorial optimization problems such as the CVRP.
- Abstract(参考訳): 本稿では、古典的および量子的強化学習(RL)アプローチを比較することにより、CVRP(Capacitated Vehicle Routing Problem)に対処する。
Advantage Actor-Critic (A2C) エージェントは、古典的、完全量子的、ハイブリッドなバリエーションで実装され、トランスフォーマーアーキテクチャを統合して、自己とクロスアテンション機構を通じて車両、クライアント、デポ間の関係をキャプチャする。
実験は、20台のクライアントと4台の車両を考慮し、キャパシティの制約のある多車種シナリオに焦点を当て、10台の独立走行で実施される。
経路距離,経路コンパクト性,経路重複性を用いて性能を評価する。
その結果,3つのアプローチがすべて,効果的なルーティングポリシを学習できることが示唆された。
しかし、量子強化モデルは古典的な基準よりも優れ、より堅牢な経路構造を生み出し、ハイブリッドアーキテクチャは距離、コンパクト性、経路重なりの全体的性能を達成する。
定量的な改善に加えて、定性的な可視化により、量子ベースのモデルがより構造化され一貫性のあるルーティングソリューションを生成することが明らかになった。
これらの結果は、CVRPのような複雑な組合せ最適化問題に対処するためのハイブリッド量子古典的強化学習モデルの可能性を強調している。
関連論文リスト
- An Agentic Framework with LLMs for Solving Complex Vehicle Routing Problems [66.60904891478687]
複雑な車両ルーティング問題を解決するために,LLM (AFL) を用いたエージェントフレームワークを提案する。
AFLは生の入力から知識を直接抽出し、自己完結型コード生成を可能にする。
AFLは、コード信頼性とソリューション実現性の両方において、既存のLCMベースのベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2025-10-19T03:59:25Z) - Accelerating Vehicle Routing via AI-Initialized Genetic Algorithms [53.75036695728983]
車両ルーティング問題 (VRP) は進化的最適化における基本的なNPハード問題である。
本稿では、強化学習エージェントを事前のインスタンスで訓練し、初期解を迅速に生成する最適化フレームワークを提案する。
このフレームワークは、様々な時間予算において、現在の最先端のソルバよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-04-08T15:21:01Z) - TuneNSearch: a hybrid transfer learning and local search approach for solving vehicle routing problems [44.035549471545586]
TuneNSearchは、多種多様な車両ルーティング問題(VRP)に対処するためのハイブリッドトランスファー学習と局所探索アプローチである。
提案手法は,効率的な局所探索法により改良された高品質な解を生成するために強化学習を用いる。
論文 参考訳(メタデータ) (2025-03-16T21:34:11Z) - A Coalition Game for On-demand Multi-modal 3D Automated Delivery System [4.378407481656902]
都市環境におけるラストマイル配送に対処するため、2つのオーバーレイネットワークで運用するUAVとADRの連合ゲームを導入する。
戦略的協調が全体のルーティング効率をいかに向上させるかを把握するためのモード間の協調構造について検討する。
ミシサガ市におけるケーススタディの結果から,ラストマイル配送の応用に関するいくつかの数値実験が実施されている。
論文 参考訳(メタデータ) (2024-12-23T03:50:29Z) - Optimizing Plastic Waste Collection in Water Bodies Using Heterogeneous Autonomous Surface Vehicles with Deep Reinforcement Learning [43.17128828646846]
本稿では,多種多面体車両を用いた情報経路計画のためのモデルフリー深部強化学習フレームワークを提案する。
このシステムは、スカウトと清掃員の2つのチームを雇用している。これらのチーム間の調整は、深い強化アプローチによって達成される。
論文 参考訳(メタデータ) (2024-12-03T09:32:02Z) - Real-time system optimal traffic routing under uncertainties -- Can physics models boost reinforcement learning? [2.298129181817085]
本稿では,強化学習を物理モデルに統合し,性能,信頼性,解釈可能性を向上させるアルゴリズムであるTransRLを提案する。
物理モデルからの情報を活用することで、TransRLは最先端の強化学習アルゴリズムより一貫して優れている。
論文 参考訳(メタデータ) (2024-07-10T04:53:26Z) - Hybrid Reinforcement Learning-Based Eco-Driving Strategy for Connected
and Automated Vehicles at Signalized Intersections [3.401874022426856]
視覚知覚法は車間通信(V2I)と統合され、より高モビリティとエネルギー効率を実現する。
HRLフレームワークには3つのコンポーネントがある。ルールベースのドライビングマネージャで、ルールベースのポリシーとRLポリシーの協調を運用する。
実験により, HRL法によりエネルギー消費量を12.70%削減し, 11.75%の移動時間を省くことができた。
論文 参考訳(メタデータ) (2022-01-19T19:31:12Z) - Learning Vehicle Routing Problems using Policy Optimisation [4.093722933440819]
最先端のアプローチは強化学習を使ってポリシーを学習し、学習ポリシーは擬似解法として機能する。
これらのアプローチは、あるケースでは優れた性能を示しているが、ルーティング問題に典型的な大きな検索空間を考えると、ポリシーの貧弱さに早すぎる可能性がある。
より多くのポリシーを提供することで探索を支援するエントロピー正規化強化学習(ERRL)を提案する。
論文 参考訳(メタデータ) (2020-12-24T14:18:56Z) - A Quantum Annealing Approach for Dynamic Multi-Depot Capacitated Vehicle
Routing Problem [5.057312718525522]
本稿では,AQC(Adiabatic Quantum Computation)の原理に基づく量子コンピューティングアルゴリズムを提案する。
従来のアルゴリズムと比較して、車両ルーティング問題(VRP)のような最適化問題の解法において、計算上の利点が顕著に示された。
これは、輸送、物流、サプライチェーン管理の分野における実世界の応用におけるNPハード最適化問題である。
論文 参考訳(メタデータ) (2020-05-26T01:47:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。