論文の概要: Decision Transformer-Based Drone Trajectory Planning with Dynamic Safety-Efficiency Trade-Offs
- arxiv url: http://arxiv.org/abs/2507.21506v2
- Date: Wed, 30 Jul 2025 06:25:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-31 11:57:45.852728
- Title: Decision Transformer-Based Drone Trajectory Planning with Dynamic Safety-Efficiency Trade-Offs
- Title(参考訳): 動的安全効率トレードオフを用いた決定変換器に基づくドローン軌道計画
- Authors: Chang-Hun Ji, SiWoon Song, Youn-Hee Han, SungTae Moon,
- Abstract要約: ドローンの軌道プランナーは、安全効率のトレードオフを動的に調整できなければならない。
伝統的なプランナーは、このトレードオフを調整するために複数のパラメータを調整するために専門家の知識を必要とします。
本稿では,1つのパラメータであるReturn-to-Go(RTG)を高温パラメータとして活用する決定変換器に基づくトラジェクトリプランナを提案する。
- 参考スコア(独自算出の注目度): 0.02678472239880052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A drone trajectory planner should be able to dynamically adjust the safety-efficiency trade-off according to varying mission requirements in unknown environments. Although traditional polynomial-based planners offer computational efficiency and smooth trajectory generation, they require expert knowledge to tune multiple parameters to adjust this trade-off. Moreover, even with careful tuning, the resulting adjustment may fail to achieve the desired trade-off. Similarly, although reinforcement learning-based planners are adaptable in unknown environments, they do not explicitly address the safety-efficiency trade-off. To overcome this limitation, we introduce a Decision Transformer-based trajectory planner that leverages a single parameter, Return-to-Go (RTG), as a \emph{temperature parameter} to dynamically adjust the safety-efficiency trade-off. In our framework, since RTG intuitively measures the safety and efficiency of a trajectory, RTG tuning does not require expert knowledge. We validate our approach using Gazebo simulations in both structured grid and unstructured random environments. The experimental results demonstrate that our planner can dynamically adjust the safety-efficiency trade-off by simply tuning the RTG parameter. Furthermore, our planner outperforms existing baseline methods across various RTG settings, generating safer trajectories when tuned for safety and more efficient trajectories when tuned for efficiency. Real-world experiments further confirm the reliability and practicality of our proposed planner.
- Abstract(参考訳): 無人機の軌道プランナーは、未知の環境における様々なミッション要求に応じて、安全効率のトレードオフを動的に調整できなければならない。
伝統的な多項式ベースのプランナーは計算効率と滑らかな軌道生成を提供するが、このトレードオフを調整するために複数のパラメータをチューニングするために専門家の知識を必要とする。
さらに、注意深いチューニングであっても、結果として得られる調整は、望ましいトレードオフを達成できない可能性がある。
同様に、強化学習に基づくプランナーは未知の環境で適応可能であるが、安全効率のトレードオフに明示的に対処するものではない。
この制限を克服するために、単一パラメータであるReturn-to-Go (RTG) を 'emph{temperature parameter} として活用し、安全性と効率のトレードオフを動的に調整する決定変換器ベースのトラジェクトリプランナを導入する。
本フレームワークでは,RTGは直感的に軌道の安全性と効率を測定するため,専門家の知識を必要としない。
構造化グリッドと非構造化ランダム環境の両方におけるGazeboシミュレーションを用いて,本手法の有効性を検証する。
実験の結果,RTGパラメータの調整だけで安全効率のトレードオフを動的に調整できることがわかった。
さらに, 各種RTG設定において, 既存のベースライン法よりも安全トラジェクトリを, より効率的なトラジェクトリを, より効率的なトラジェクトリを生成できる。
実世界の実験は、提案したプランナーの信頼性と実用性をさらに確認する。
関連論文リスト
- Graphormer-Guided Task Planning: Beyond Static Rules with LLM Safety Perception [4.424170214926035]
本稿では,大規模言語モデルと構造化安全モデリングを組み合わせたリスク対応タスク計画フレームワークを提案する。
提案手法は,空間的および文脈的危険因子を抽出し,動的セマンティック安全グラフを構築する。
既定の安全性制約に依存する既存の手法とは異なり、我々のフレームワークはコンテキスト認識型リスク認識モジュールを導入している。
論文 参考訳(メタデータ) (2025-03-10T02:43:54Z) - LaPlaSS: Latent Space Planning for Stochastic Systems [8.529245639496274]
本稿では,自律型移動エージェントのリスクバウンド計画に対する「ジェネレーテッド・アンド・テスト」アプローチを提案する。
我々は変分オートエンコーダを用いて潜在線形力学モデルを学習し、計画問題を潜在空間にエンコードして候補軌道を生成する。
我々のアルゴリズムであるLaPlaSSは、学習力学を持つ実世界のエージェントに対して有界リスクを持つ軌道計画を生成することができることを示した。
論文 参考訳(メタデータ) (2024-04-10T14:52:35Z) - DATT: Deep Adaptive Trajectory Tracking for Quadrotor Control [62.24301794794304]
Deep Adaptive Trajectory Tracking (DATT)は、学習に基づくアプローチであり、現実世界の大きな乱れの存在下で、任意の、潜在的に実現不可能な軌跡を正確に追跡することができる。
DATTは、非定常風場における可溶性および非実用性の両方の軌道に対して、競争適応性非線形およびモデル予測コントローラを著しく上回っている。
適応非線形モデル予測制御ベースラインの1/4未満である3.2ms未満の推論時間で、効率的にオンラインで実行することができる。
論文 参考訳(メタデータ) (2023-10-13T12:22:31Z) - HALO: Hazard-Aware Landing Optimization for Autonomous Systems [1.5414037351414311]
本稿では,ハザード検出,最適着陸軌道生成,緊急計画課題に対処する認識計画手法を提案する。
本研究では,HALSS(Hazard-Aware Landing Site Selection)とAdaptive Deferred-Decision Trajectory Optimization(Adaptive Deferred-Decision Trajectory Optimization,-DDTO)という2つの新しいアルゴリズムを開発し,統合し,認識と計画の課題に対処する。
シミュレーションした火星環境を用いたアプローチの有効性を実証し, 組み合わせた認識計画法が着地成功率を高めることを示す。
論文 参考訳(メタデータ) (2023-04-04T07:20:06Z) - Meta-Learning Priors for Safe Bayesian Optimization [72.8349503901712]
メタ学習アルゴリズムであるF-PACOHを構築し,データ不足の設定において確実な定量化を実現する。
コアコントリビューションとして、安全に適合した事前をデータ駆動で選択するための新しいフレームワークを開発する。
ベンチマーク関数と高精度動作系において,我々のメタ学習先行が安全なBOアプローチの収束を加速することを示す。
論文 参考訳(メタデータ) (2022-10-03T08:38:38Z) - RAPTOR: End-to-end Risk-Aware MDP Planning and Policy Learning by
Backpropagation [12.600828753197204]
PyTorch (RAP) を用いたリスクアウェアプランニング(リスクアウェアプランニング)を導入する。
本研究では, 非線形ナビゲーション, HVAC制御, 線形貯水池制御を含む3つの高次要素について, これら2種類のRAPTORを評価し, 比較した。
論文 参考訳(メタデータ) (2021-06-14T09:27:19Z) - PILOT: Efficient Planning by Imitation Learning and Optimisation for
Safe Autonomous Driving [16.151534376618034]
計画品質、安全性、効率の適切なバランスは、自動運転の大きな課題である。
我々は、模倣ニューラルネットワークと効率的なオプティマイザを組み合わせた計画フレームワークであるPILOTを提案する。
PILOTは,計画品質を犠牲にすることなく,それを模倣する専門家と比較して,ランタイムの7倍の削減を実現している。
論文 参考訳(メタデータ) (2020-11-01T14:18:45Z) - Learning Control Barrier Functions from Expert Demonstrations [69.23675822701357]
制御障壁関数(CBF)に基づく安全な制御器合成のための学習に基づくアプローチを提案する。
最適化に基づくCBFの学習手法を解析し、基礎となる力学系のリプシッツ仮定の下で証明可能な安全保証を享受する。
私たちの知る限りでは、これらはデータから確実に安全な制御障壁関数を学習する最初の結果です。
論文 参考訳(メタデータ) (2020-04-07T12:29:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。