Fugu-MT 論文翻訳(概要): Reinforcement Learning for Multi-Truck Vehicle Routing Problems

論文の概要: Reinforcement Learning for Multi-Truck Vehicle Routing Problems

arxiv url: http://arxiv.org/abs/2211.17078v1
Date: Wed, 30 Nov 2022 15:37:53 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-01 16:21:52.333912
Title: Reinforcement Learning for Multi-Truck Vehicle Routing Problems
Title（参考訳）: マルチトラック車両ルーティング問題に対する強化学習
Authors: Randall Correll (1), Sean J. Weinberg (1), Fabio Sanches (1), Takanori Ide (2), Takafumi Suzuki (3) ((1) QC Ware Corp Palo Alto, (2) AISIN CORPORATION Tokyo, (3) Aisin Technical Center of America San Jose)
Abstract要約: 我々は,複雑なサプライチェーンを実現する車両ルーティングのためのエンコーダ・デコーダモデルの新たな拡張を開発する。私たちのモデルは、たとえ少数のトラックでのみ訓練されたとしても、大規模なサプライチェーンに組み込んで、実行可能なソリューションを実現できるかを示します。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Vehicle routing problems and other combinatorial optimization problems have been approximately solved by reinforcement learning agents with policies based on encoder-decoder models with attention mechanisms. These techniques are of substantial interest but still cannot solve the complex routing problems that arise in a realistic setting which can have many trucks and complex requirements. With the aim of making reinforcement learning a viable technique for supply chain optimization, we develop new extensions to encoder-decoder models for vehicle routing that allow for complex supply chains using classical computing today and quantum computing in the future. We make two major generalizations. First, our model allows for routing problems with multiple trucks. Second, we move away from the simple requirement of having a truck deliver items from nodes to one special depot node, and instead allow for a complex tensor demand structure. We show how our model, even if trained only for a small number of trucks, can be embedded into a large supply chain to yield viable solutions.
Abstract（参考訳）: 車両ルーティング問題や他の組合せ最適化問題は、注意機構を持つエンコーダ・デコーダモデルに基づくポリシー付き強化学習エージェントによって概ね解決されている。これらの技術はかなりの関心があるが、多くのトラックと複雑な要求を持つ現実的な環境で発生する複雑なルーティング問題をまだ解決できない。強化学習をサプライチェーン最適化の実行可能な技術にすることを目的として,今日の古典計算と将来量子コンピューティングを用いた複雑なサプライチェーンを可能にする車両ルーティングのためのエンコーダ・デコーダモデルの拡張を新たに開発した。 2つの主要な一般化を行う。まず,本モデルでは,複数トラックの経路問題を可能にする。第二に、トラックがノードから1つの特別なデポノードにアイテムを配送するという単純な要件から脱却し、代わりに複雑なテンソル需要構造を許容する。私たちのモデルは、たとえ少数のトラックでのみ訓練されたとしても、大規模なサプライチェーンに組み込んで、実行可能なソリューションを実現できるかを示します。

関連論文リスト

A Multiagent Path Search Algorithm for Large-Scale Coalition Structure Generation [61.08720171136229]
結合構造生成はマルチエージェントシステムにおける基本的な計算問題である。我々はCSGの多エージェントパス探索アルゴリズムであるSALDAEを開発し、連立構造グラフ上で運用する。
論文参考訳（メタデータ） (2025-02-14T15:21:27Z)
ArCHer: Training Language Model Agents via Hierarchical Multi-Turn RL [80.10358123795946]
大規模言語モデルを微調整するためのマルチターンRLアルゴリズムを構築するためのフレームワークを開発する。我々のフレームワークは階層的なRLアプローチを採用し、2つのRLアルゴリズムを並列に実行している。実験により,ArCHerはエージェントタスクの効率と性能を大幅に向上させることがわかった。
論文参考訳（メタデータ） (2024-02-29T18:45:56Z)
Deep Reinforcement Learning for Multi-Truck Vehicle Routing Problems with Multi-Leg Demand Routes [0.9423257767158634]
既存のエンコーダ・デコーダのアテンションモデルに新たな拡張を加えて,複数のトラックとマルチレグルーティング要求を処理できるようにした。私たちのモデルには、少数のトラックやノードに対してトレーニングを行い、大きなサプライチェーンに組み込んで、多数のトラックやノードに対するソリューションを提供するという利点があります。
論文参考訳（メタデータ） (2024-01-08T21:13:07Z)
Solving the Team Orienteering Problem with Transformers [46.93254771681026]
車両群のためのルートプランニングは、荷物の配送、監視、輸送といった応用において重要な課題である。本稿では,チームオリエンテーリング問題を高速かつ高精度に解決できる多エージェント経路計画システムを提案する。
論文参考訳（メタデータ） (2023-11-30T16:10:35Z)
Fair collaborative vehicle routing: A deep multi-agent reinforcement learning approach [49.00137468773683]
協力的な車両ルーティングは、キャリアがそれぞれの輸送要求を共有し、互いに代表して輸送要求を実行することで協力するときに発生する。従来のゲーム理論解の概念は、特性関数がエージェントの数とともに指数関数的にスケールするので、計算に費用がかかる。我々は,この問題を,深層マルチエージェント強化学習を用いて解決した連立交渉ゲームとしてモデル化することを提案する。
論文参考訳（メタデータ） (2023-10-26T15:42:29Z)
MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文参考訳（メタデータ） (2023-02-02T18:27:20Z)
Quantum Neural Networks for a Supply Chain Logistics Application [0.0]
複数のトラックと複雑な需要構造を備えたサプライチェーンロジスティクスのための車両ルーティングという,重要な問題に関する1つのハイブリッドアルゴリズムについて検討する。量子回路を組み込んだニューラルネットワークを用いて強化学習を行う。人間のトラックの割り当てに匹敵する結果が得られます。
論文参考訳（メタデータ） (2022-11-30T15:35:53Z)
Supply Chain Logistics with Quantum and Classical Annealing Algorithms [0.0]
ノイズの多い中間スケール量子(NISQ)ハードウェアは、実用上重要なフルスケール最適化問題とほとんど互換性がない。本研究では,サプライチェーンのロジスティクスにおいて,企業の運用規模において,実質的な商業価値,多輪車経路の問題について検討する。我々の研究は、NASQデバイスをハイブリッド方式で応用するための車両ルーティング以外のコンテキストに適用可能な一連の技術を提供し、商業的関心事の大規模問題に応用する。
論文参考訳（メタデータ） (2022-05-09T17:36:21Z)
Optimizing Tensor Network Contraction Using Reinforcement Learning [86.05566365115729]
本稿では,グラフニューラルネットワーク(GNN)と組み合わせた強化学習(RL)手法を提案する。この問題は、巨大な検索スペース、重い尾の報酬分布、そして困難なクレジット割り当てのために非常に難しい。 GNNを基本方針として利用するRLエージェントが,これらの課題にどのように対処できるかを示す。
論文参考訳（メタデータ） (2022-04-18T21:45:13Z)
Automated Reinforcement Learning (AutoRL): A Survey and Open Problems [92.73407630874841]
AutoRL(Automated Reinforcement Learning)には、AutoMLの標準的なアプリケーションだけでなく、RL特有の課題も含まれている。我々は共通の分類法を提供し、各領域を詳細に議論し、今後の研究者にとって関心のあるオープンな問題を提起する。
論文参考訳（メタデータ） (2022-01-11T12:41:43Z)
A Deep Reinforcement Learning Approach for Solving the Traveling Salesman Problem with Drone [6.364514310476583]
本稿では,デコーダの隠れ状態が動作シーケンスを表現できるアテンション-LSTMデコーダハイブリッドモデルを提案する。このようなハイブリッドモデルが,ソリューションの品質と計算効率の両面において,純粋に注意に基づくモデルを改善することを実証的に実証した。 min-max Capacitated Vehicle Routing Problem (mmCVRP) に関する実験により、ハイブリッドモデルは注意ベースモデルよりも複数車両の協調ルーティングに適していることを確認した。
論文参考訳（メタデータ） (2021-12-22T04:59:44Z)
Deep Policy Dynamic Programming for Vehicle Routing Problems [89.96386273895985]
本稿では,学習ニューラルの強みと動的プログラミングアルゴリズムの強みを組み合わせた深層ポリシー動的プログラミング(d pdp)を提案する。 D PDPは、例の解からエッジを予測するために訓練されたディープニューラルネットワークから派生したポリシーを使用して、DP状態空間を優先し、制限する。本研究では,旅行セールスマン問題 (TSP) と車両ルーティング問題 (VRP) の枠組みを評価し,ニューラルネットワークが(制限された)DPアルゴリズムの性能を向上させることを示す。
論文参考訳（メタデータ） (2021-02-23T15:33:57Z)
Multi-intersection Traffic Optimisation: A Benchmark Dataset and a Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文参考訳（メタデータ） (2021-01-24T03:55:39Z)
UPDeT: Universal Multi-agent Reinforcement Learning via Policy Decoupling with Transformers [108.92194081987967]
タスクに適合する1つのアーキテクチャを設計し、汎用的なマルチエージェント強化学習パイプラインを最初に試行する。従来のRNNモデルとは異なり、トランスフォーマーモデルを用いてフレキシブルなポリシーを生成する。提案方式はUPDeT(Universal Policy Decoupling Transformer)と名付けられ,動作制限を緩和し,マルチエージェントタスクの決定プロセスをより説明しやすいものにする。
論文参考訳（メタデータ） (2021-01-20T07:24:24Z)
Multi-Agent Routing Value Iteration Network [88.38796921838203]
疎結合グラフの学習値に基づいてマルチエージェントルーティングを行うことができるグラフニューラルネットワークに基づくモデルを提案する。最大25ノードのグラフ上で2つのエージェントでトレーニングしたモデルでは,より多くのエージェントやノードを持つ状況に容易に一般化できることが示されている。
論文参考訳（メタデータ） (2020-07-09T22:16:45Z)
Learning to Solve Vehicle Routing Problems with Time Windows through Joint Attention [6.155158115218501]
複数のツアーの協調行動空間に注意を払って複数のルートを同時に開始・拡張できる政策モデルを開発する。時間窓付き車両経路問題の3つの変種に関する総合的な実験において、我々のモデルであるJAMPRは、異なる問題サイズでうまく機能し、既存の最先端建設モデルより優れていることを示す。
論文参考訳（メタデータ） (2020-06-16T12:08:10Z)
A Quantum Annealing Approach for Dynamic Multi-Depot Capacitated Vehicle Routing Problem [5.057312718525522]
本稿では,AQC(Adiabatic Quantum Computation)の原理に基づく量子コンピューティングアルゴリズムを提案する。従来のアルゴリズムと比較して、車両ルーティング問題(VRP)のような最適化問題の解法において、計算上の利点が顕著に示された。これは、輸送、物流、サプライチェーン管理の分野における実世界の応用におけるNPハード最適化問題である。
論文参考訳（メタデータ） (2020-05-26T01:47:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。