Fugu-MT 論文翻訳(概要): Reinforcement Learning to Optimize the Logistics Distribution Routes of Unmanned Aerial Vehicle

論文の概要: Reinforcement Learning to Optimize the Logistics Distribution Routes of Unmanned Aerial Vehicle

arxiv url: http://arxiv.org/abs/2004.09864v1
Date: Tue, 21 Apr 2020 09:42:03 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-11 07:50:42.583630
Title: Reinforcement Learning to Optimize the Logistics Distribution Routes of Unmanned Aerial Vehicle
Title（参考訳）: 無人航空機の物流分布経路最適化のための強化学習
Authors: Linfei Feng
Abstract要約: 本稿では,複数のノフライゾーンを含む複雑な環境下でUAVの経路計画を実現するための改良手法を提案する。その結果,このような複雑な状況に適応するモデルの有効性と効率性が示された。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Path planning methods for the unmanned aerial vehicle (UAV) in goods delivery have drawn great attention from industry and academics because of its flexibility which is suitable for many situations in the "Last Kilometer" between customer and delivery nodes. However, the complicated situation is still a problem for traditional combinatorial optimization methods. Based on the state-of-the-art Reinforcement Learning (RL), this paper proposed an improved method to achieve path planning for UAVs in complex surroundings: multiple no-fly zones. The improved approach leverages the attention mechanism and includes the embedding mechanism as the encoder and three different widths of beam search (i.e.,~1, 5, and 10) as the decoders. Policy gradients are utilized to train the RL model for obtaining the optimal strategies during inference. The results show the feasibility and efficiency of the model applying in this kind of complicated situation. Comparing the model with the results obtained by the optimization solver OR-tools, it improves the reliability of the distribution system and has a guiding significance for the broad application of UAVs.
Abstract（参考訳）: 商品配送における無人航空機(UAV)の経路計画手法は,顧客ノードと配送ノード間の"Last Kilometer"における多くの状況に適した柔軟性のために,産業や学術者から注目されている。しかし, 従来の組合せ最適化手法では, 複雑な状況が問題となっている。本稿では,最先端の強化学習(Reinforcement Learning, RL)に基づき, 複雑な環境下でUAVの経路計画を実現するための改良手法を提案する。改良されたアプローチはアテンション機構を利用し、エンコーダとしての埋め込み機構とデコーダとしてのビームサーチの3つの異なる幅(~1,5,10)を含む。政策勾配は、推論中に最適な戦略を得るためにRLモデルを訓練するために利用される。その結果,このような複雑な状況に適応するモデルの有効性と効率性が示された。最適化解法 OR-tools による結果との比較により, 分散システムの信頼性が向上し, UAV の広汎な適用に向けた指針となる。

関連論文リスト

Efficient Onboard Vision-Language Inference in UAV-Enabled Low-Altitude Economy Networks via LLM-Enhanced Optimization [61.55616421408666]
低高度経済ネットワーク(LAENets)は、航空監視、環境検知、セマンティックデータ収集など、様々な応用を可能にしている。オンボードビジョン(VLM)は、リアルタイムな推論を提供するが、オンボードの動的ネットワーク条件は限られている。動的LEENet条件下での通信効率を向上させるUAV対応LEENetシステムを提案する。
論文参考訳（メタデータ） (2025-10-11T05:11:21Z)
Preference Optimization for Combinatorial Optimization Problems [54.87466279363487]
強化学習(Reinforcement Learning, RL)は、ニューラルネットワーク最適化のための強力なツールとして登場した。大幅な進歩にもかかわらず、既存のRLアプローチは報酬信号の減少や大規模な行動空間における非効率な探索といった課題に直面している。統計的比較モデルを用いて定量的報酬信号を定性的選好信号に変換する新しい手法であるPreference Optimizationを提案する。
論文参考訳（メタデータ） (2025-05-13T16:47:00Z)
Attention-based UAV Trajectory Optimization for Wireless Power Transfer-assisted IoT Systems [19.680892841701674]
本稿では,グラフトランスを用いた意図に基づくUAVトラジェクトリ最適化フレームワークを提案する。 ATOMでは、すべてのIoTDの自己アテンション特性を計算するためにグラフエンコーダが使用される。 TENMAは改良されたアクター・クリティカル法を用いてATOMを訓練し、システムの真の報酬をベースラインとして適用して、批評家ネットワークのばらつきを低減する。
論文参考訳（メタデータ） (2025-02-23T02:57:06Z)
Learning from Reward-Free Offline Data: A Case for Planning with Latent Dynamics Models [79.2162092822111]
我々は,一連のナビゲーションタスクにおいて,強化学習(RL)と制御に基づく手法を体系的に評価する。我々は、JEPA(Joint Embedding Predictive Architecture)を使用して、潜在ダイナミクスモデルを使用し、それを計画に使用します。その結果,モデルベースプランニングではレイアウトが不明瞭になるのに対して,モデルフリーのRLは高品質なデータから恩恵を受けることがわかった。
論文参考訳（メタデータ） (2025-02-20T18:39:41Z)
Preventing Local Pitfalls in Vector Quantization via Optimal Transport [77.15924044466976]
我々はシンクホーンアルゴリズムを用いて最適な輸送問題を最適化する新しいベクトル量子化法であるOptVQを紹介する。画像再構成タスクの実験では,OptVQが100%のコードブック利用を実現し,現在最先端のVQNを超越していることが示された。
論文参考訳（メタデータ） (2024-12-19T18:58:14Z)
Enhancing Spectrum Efficiency in 6G Satellite Networks: A GAIL-Powered Policy Learning via Asynchronous Federated Inverse Reinforcement Learning [67.95280175998792]
ビームフォーミング,スペクトルアロケーション,リモートユーザ機器(RUE)アソシエイトを最適化するために,GAILを利用した新しいポリシー学習手法を提案する。手動チューニングなしで報酬関数を自動的に学習するために、逆RL(IRL)を用いる。提案手法は従来のRL手法よりも優れており,コンバージェンスと報酬値の14.6%の改善が達成されている。
論文参考訳（メタデータ） (2024-09-27T13:05:02Z)
UAV-enabled Collaborative Beamforming via Multi-Agent Deep Reinforcement Learning [79.16150966434299]
本稿では,UAVを用いた協調ビームフォーミング多目的最適化問題 (UCBMOP) を定式化し,UAVの伝送速度を最大化し,全UAVのエネルギー消費を最小化する。ヘテロジニアス・エージェント・信頼領域ポリシー最適化(HATRPO)を基本フレームワークとし,改良されたHATRPOアルゴリズム,すなわちHATRPO-UCBを提案する。
論文参考訳（メタデータ） (2024-04-11T03:19:22Z)
Reinforcement Learning for Solving Stochastic Vehicle Routing Problem [0.09831489366502298]
本研究では、車両ルーティング問題(SVRP)解決における強化学習(RL)と機械学習(ML)技術の利用のギャップを解消する。本稿では,SVRPのキーソースを包括的に扱う新しいエンドツーエンドフレームワークを提案する。提案モデルでは,広く採用されている最先端のメユーリスティックよりも優れた性能を示し,旅行コストの3.43%削減を実現している。
論文参考訳（メタデータ） (2023-11-13T19:46:22Z)
Enhancing Secrecy in UAV RSMA Networks: Deep Unfolding Meets Deep Reinforcement Learning [0.8287206589886881]
我々は、複数の無人航空機(UAV)速度軌道(SMAR)における秘密のネットワークを考える。提案した深部強化学習(DRL)は,他のDRL法よりも優れた性能を示した。
論文参考訳（メタデータ） (2023-09-30T12:26:24Z)
A Hybrid Framework of Reinforcement Learning and Convex Optimization for UAV-Based Autonomous Metaverse Data Collection [16.731929552692524]
本稿では,UAVが基地局(BS)のカバー範囲を広げて道路側ユニット(RSU)で生成したメタバースデータを収集する,UAV支援型メタバースネットワークについて考察する。データ収集効率を改善するため、リソース割り当てとトラジェクトリ制御をシステムモデルに統合する。提案するUAV支援Metaverseネットワークシステムモデルに基づいて,時間系列最適化問題を協調的に解くために,強化学習と凸最適化を備えたハイブリッドフレームワークを設計する。
論文参考訳（メタデータ） (2023-05-29T11:49:20Z)
Joint Optimization of Deployment and Trajectory in UAV and IRS-Assisted IoT Data Collection System [25.32139119893323]
無人航空機(UAV)は多くのモノのインターネット(IoT)システムに適用できる。 UAV-IoT無線チャネルは、時には木や高層建築物によってブロックされることがある。本稿では,UAVの展開と軌道を最適化することで,システムのエネルギー消費を最小化することを目的とする。
論文参考訳（メタデータ） (2022-10-27T06:27:40Z)
Transferable Deep Reinforcement Learning Framework for Autonomous Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文参考訳（メタデータ） (2021-05-28T08:45:37Z)
Efficient UAV Trajectory-Planning using Economic Reinforcement Learning [65.91405908268662]
UAV間でタスクを分散するための経済取引に触発された新しい強化学習アルゴリズムであるREPlannerを紹介します。エージェントが協力し、リソースを競うことができるマルチエージェント経済ゲームとして、パス計画問題を策定します。 UAV協力によるタスク分布の計算を行うため、Swarmサイズの変化に対して非常に耐性が高い。
論文参考訳（メタデータ） (2021-03-03T20:54:19Z)
Optimization-driven Deep Reinforcement Learning for Robust Beamforming in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文参考訳（メタデータ） (2020-05-25T01:42:55Z)
Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文参考訳（メタデータ） (2020-02-21T07:29:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。