Fugu-MT 論文翻訳(概要): 2-Level Reinforcement Learning for Ships on Inland Waterways

論文の概要: 2-Level Reinforcement Learning for Ships on Inland Waterways

arxiv url: http://arxiv.org/abs/2307.16769v1
Date: Tue, 25 Jul 2023 08:42:59 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-06 11:21:18.801121
Title: 2-Level Reinforcement Learning for Ships on Inland Waterways
Title（参考訳）: 内陸水路における船舶の2段階強化学習
Authors: Martin Waltz, Niklas Paulig, Ostap Okhrin
Abstract要約: 本稿では、深部強化学習(DRL)に基づく内陸水路(IW)における自動表面車両(ASV)の制御のための現実的なモジュール化フレームワークを提案する。フレームワークは、高レベルローカルパス計画(LPP)ユニットと低レベルパス追従(PF)ユニットの2つのレベルで構成され、それぞれDRLエージェントで構成されている。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper proposes a realistic modularized framework for controlling autonomous surface vehicles (ASVs) on inland waterways (IWs) based on deep reinforcement learning (DRL). The framework comprises two levels: a high-level local path planning (LPP) unit and a low-level path following (PF) unit, each consisting of a DRL agent. The LPP agent is responsible for planning a path under consideration of nearby vessels, traffic rules, and the geometry of the waterway. We thereby leverage a recently proposed spatial-temporal recurrent neural network architecture, which is transferred to continuous action spaces. The PF agent is responsible for low-level actuator control while accounting for shallow water influences on the marine craft and the environmental forces winds, waves, and currents. Both agents are thoroughly validated in simulation, employing the lower Elbe in northern Germany as an example case and using real AIS trajectories to model the behavior of other ships.
Abstract（参考訳）: 本稿では、深部強化学習(DRL)に基づく内陸水路(IW)における自動表面車両(ASV)制御のための現実的なモジュール化フレームワークを提案する。高レベルローカルパス計画(LPP)ユニットと低レベルパス追従(PF)ユニットの2つのレベルで構成され、それぞれDRLエージェントで構成されている。 LPPエージェントは、近くの船舶、交通規則、水路の幾何学を考慮に入れた経路を計画する責任がある。これにより,最近提案されている空間-時間的リカレントニューラルネットワークアーキテクチャを,連続的な動作空間に転送する。 PFエージェントは、船舶および環境力の風、波、電流に対する浅い水の影響を考慮しつつ、低レベルのアクチュエータ制御を担っている。どちらのエージェントもシミュレーションで徹底的に検証されており、ドイツ北部のエルベ低地を例に挙げ、実際のAIS軌道を用いて他の船の挙動をモデル化している。

関連論文リスト

Multi-Waypoint Path Planning and Motion Control for Non-holonomic Mobile Robots in Agricultural Applications [0.0]
無人移動ロボットは、非構造農業環境をナビゲートできるという需要が高まっている。草地における雑草制御のようなタスクは、順序のない座標の集合を通して効率的な経路計画を必要とする。本稿では,Dubins Traveling Salesman問題に基づくグローバルパスプランナを組み合わせた統合ナビゲーションフレームワークを提案する。
論文参考訳（メタデータ） (2025-07-31T08:56:24Z)
Learning to Reason and Navigate: Parameter Efficient Action Planning with Large Language Models [63.765846080050906]
本稿では,大規模言語モデル (PEAP-LLM) を用いたパラメータ効率の高いアクションプランナを提案する。実験により,提案したREVERIEモデルが従来の最先端モデルよりも優れていることが示された。
論文参考訳（メタデータ） (2025-05-12T12:38:20Z)
Toward Dependency Dynamics in Multi-Agent Reinforcement Learning for Traffic Signal Control [8.312659530314937]
適応的な信号制御のためのデータ駆動型アプローチとして強化学習(RL)が出現する。本稿では,DQN-DPUS(Deep Q-Network)のための動的強化更新戦略を提案する。提案手法は最適探索を犠牲にすることなく収束速度を向上できることを示す。
論文参考訳（メタデータ） (2025-02-23T15:29:12Z)
Bayesian Critique-Tune-Based Reinforcement Learning with Adaptive Pressure for Multi-Intersection Traffic Signal Control [0.5399800035598185]
本稿では,多区間信号制御(BCT-APLight)のための適応的圧力を用いた批判-テュンベース強化学習を提案する。 BCT-APLightは、7つの実世界のデータセット上の他の最先端(SOTA)メソッドよりも優れている。
論文参考訳（メタデータ） (2024-12-18T14:33:25Z)
Integrated Sensing and Communications for Low-Altitude Economy: A Deep Reinforcement Learning Approach [20.36806314683902]
低高度経済(LAE)のための統合センシング・通信(ISAC)システムについて検討する。所定の飛行期間における通信総和レートは、GBSとUAVの軌道でのビームフォーミングを共同最適化することにより最大化する。本稿では, 深部強化学習(DRL)技術を活用して, 深部LAE-ISAC(Deep LAE-ISAC)と呼ばれる新しいLEE指向ISAC方式を提案する。
論文参考訳（メタデータ） (2024-12-05T11:12:46Z)
Navigation in a simplified Urban Flow through Deep Reinforcement Learning [0.9217021281095907]
都市環境における無人航空機(UAV)は、環境への影響を最小限に抑える戦略を必要とする。我々の目標は、都市環境下での無人航法を可能にするDRLアルゴリズムを開発することである。
論文参考訳（メタデータ） (2024-09-26T15:05:15Z)
AD-H: Autonomous Driving with Hierarchical Agents [64.49185157446297]
我々は,ハイレベル命令と低レベル制御信号を中間言語駆動の命令に接続することを提案する。我々は、AD-Hという階層型マルチエージェント駆動システムを用いて、このアイデアを実装した。
論文参考訳（メタデータ） (2024-06-05T17:25:46Z)
Safety Aware Autonomous Path Planning Using Model Predictive Reinforcement Learning for Inland Waterways [2.0623470039259946]
モデル予測強化学習(MPRL)と呼ばれる強化学習に基づく新しい経路計画手法を提案する。 MPRLは、船が従うための一連のウェイポイントを計算する。提案手法を2つのシナリオで実証し,Frenetフレームを用いた経路計画とPPOエージェントに基づく経路計画との比較を行った。
論文参考訳（メタデータ） (2023-11-16T13:12:58Z)
ETPNav: Evolving Topological Planning for Vision-Language Navigation in Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。 ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文参考訳（メタデータ） (2023-04-06T13:07:17Z)
Robust Path Following on Rivers Using Bootstrapped Reinforcement Learning [0.0]
本稿では,内陸海域における自律型表面容器(ASV)の航行制御のための深層強化学習(DRL)エージェントを開発した。最先端のブートストラップ付きQ-ラーニングアルゴリズムと多用途のトレーニング環境ジェネレータを組み合わせることで、堅牢で正確な舵制御を実現する。
論文参考訳（メタデータ） (2023-03-24T07:21:27Z)
SEA: Bridging the Gap Between One- and Two-stage Detector Distillation via SEmantic-aware Alignment [76.80165589520385]
細粒度情報を抽象化する性質から,SEA (SEmantic-Aware Alignment) 蒸留法を命名した。 1段検出器と2段検出器の両方において、挑戦的な物体検出タスクにおいて、最先端の新たな結果が得られる。
論文参考訳（メタデータ） (2022-03-02T04:24:05Z)
Risk-based implementation of COLREGs for autonomous surface vehicles using deep reinforcement learning [1.304892050913381]
深層強化学習(DRL)は幅広い応用の可能性を示している。本研究は,海上衝突防止国際規則(COLREG)のサブセットをDRLに基づく経路追従と障害物回避システムに組み込んだものである。得られた自律エージェントは、訓練シナリオ、孤立した遭遇状況、実世界のシナリオのAISに基づくシミュレーションにおいて、経路追従とCOLREG準拠の衝突回避を動的に補間する。
論文参考訳（メタデータ） (2021-11-30T21:32:59Z)
Trajectory Planning for Autonomous Vehicles Using Hierarchical Reinforcement Learning [21.500697097095408]
不確実かつ動的条件下で安全な軌道を計画することは、自律運転問題を著しく複雑にする。 RRT(Rapidly Exploring Random Trees)のような現在のサンプリングベース手法は、高い計算コストのため、この問題には理想的ではない。軌道計画のための階層型強化学習構造とPID(Proportional-Integral-Derivative)コントローラを提案する。
論文参考訳（メタデータ） (2020-11-09T20:49:54Z)
Optimization-driven Deep Reinforcement Learning for Robust Beamforming in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文参考訳（メタデータ） (2020-05-25T01:42:55Z)
Model-based Reinforcement Learning for Decentralized Multiagent Rendezvous [66.6895109554163]
目標を他のエージェントと整合させる人間の能力の下にあるのは、他人の意図を予測し、自分たちの計画を積極的に更新する能力である。分散型マルチエージェントレンデブーのためのモデルに基づく強化学習手法である階層型予測計画(HPP)を提案する。
論文参考訳（メタデータ） (2020-03-15T19:49:20Z)
Federated Learning in the Sky: Joint Power Allocation and Scheduling with UAV Swarms [98.78553146823829]
無人航空機(UAV)は様々なタスクを実行するために機械学習(ML)を利用する必要がある。本稿では,UAVスワム内に分散学習(FL)アルゴリズムを実装するための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2020-02-19T14:04:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。