論文の概要: Uncertainty Guided Exploratory Trajectory Optimization for Sampling-Based Model Predictive Control
- arxiv url: http://arxiv.org/abs/2604.12149v1
- Date: Mon, 13 Apr 2026 23:55:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.166991
- Title: Uncertainty Guided Exploratory Trajectory Optimization for Sampling-Based Model Predictive Control
- Title(参考訳): サンプリングベースモデル予測制御のための不確実性誘導探索軌道最適化
- Authors: O. Goktug Poyrazoglu, Yukang Cao, Rahul Moorthy, Volkan Isler,
- Abstract要約: 提案手法は, 構成空間のより優れたカバレッジを実現するために, 適切に分離されたサンプルを生成するトラジェクトリ最適化アルゴリズムである。
また,UGE-TOをサンプリングベースモデル予測制御手法に統合したUGE-MPCを提案する。
- 参考スコア(独自算出の注目度): 18.70552952249317
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Trajectory optimization depends heavily on initialization. In particular, sampling-based approaches are highly sensitive to initial solutions, and limited exploration frequently leads them to converge to local minima in complex environments. We present Uncertainty Guided Exploratory Trajectory Optimization (UGE-TO), a trajectory optimization algorithm that generates well-separated samples to achieve a better coverage of the configuration space. UGE-TO represents trajectories as probability distributions induced by uncertainty ellipsoids. Unlike sampling-based approaches that explore only in the action space, this representation captures the effects of both system dynamics and action selection. By incorporating the impact of dynamics, in addition to the action space, into our distributions, our method enhances trajectory diversity by enforcing distributional separation via the Hellinger distance between them. It enables a systematic exploration of the configuration space and improves robustness against local minima. Further, we present UGE-MPC, which integrates UGE-TO into sampling-based model predictive controller methods. Experiments demonstrate that UGE-MPC achieves higher exploration and faster convergence in trajectory optimization compared to baselines under the same sampling budget, achieving 72.1% faster convergence in obstacle-free environments and 66% faster convergence with a 6.7% higher success rate in the cluttered environment compared to the best-performing baseline. Additionally, we validate the approach through a range of simulation scenarios and real-world experiments. Our results indicate that UGE-MPC has higher success rates and faster convergence, especially in environments that demand significant deviations from nominal trajectories to avoid failures. The project and code are available at https://ogpoyrazoglu.github.io/cuniform_sampling/.
- Abstract(参考訳): 軌道最適化は初期化に大きく依存する。
特に、サンプリングベースのアプローチは初期解に非常に敏感であり、限られた探索によって複雑な環境において局所的なミニマに収束する。
Incertainty Guided Exploratory Trajectory Optimization (UGE-TO)を提案する。
UGE-TOは不確実楕円体によって誘導される確率分布として軌道を表す。
アクション空間内でのみ探索するサンプリングベースのアプローチとは異なり、この表現はシステムダイナミクスとアクション選択の両方の効果を捉えている。
本手法は, 運動空間に加え, 力学の影響を我々の分布に組み込むことで, ヘリンジャー距離を介して分布分離を行うことにより軌道の多様性を高める。
構成空間の体系的な探索を可能にし、局所ミニマに対する堅牢性を向上させる。
さらに,UGE-TOをサンプリングベースモデル予測制御手法に統合したUGE-MPCを提案する。
実験により、UGE-MPCは、同じサンプリング予算下でのベースラインよりも高速な軌道最適化の探索と高速な収束を実現し、障害物のない環境で72.1%の高速収束を実現し、66%の高速収束を実現した。
さらに,シミュレーションシナリオや実世界の実験を通じて,そのアプローチを検証する。
以上の結果から,UGE-MPCは成功率が高く収束速度も速いことが示唆された。
プロジェクトとコードはhttps://ogpoyrazoglu.github.io/cuniform_sampling/.comで公開されている。
関連論文リスト
- P^2O: Joint Policy and Prompt Optimization [74.45293488495592]
RLVR(Reinforcement Learning with Verifiable Rewards)は、大規模言語モデル(LLM)の推論能力を高めるための強力なパラダイムとして登場した。
プロンプト最適化とポリシー最適化を相乗化する新しいフレームワークであるP2Oを提案する。
論文 参考訳(メタデータ) (2026-03-23T12:08:47Z) - Heteroscedastic Bayesian Optimization-Based Dynamic PID Tuning for Accurate and Robust UAV Trajectory Tracking [12.655695094805159]
HBO-PID は Heteroscedastic Bayesian Optimization フレームワークと古典的なコントローラを統合する新しい制御アルゴリズムである。
位置精度は24.7%から42.9%向上し、角精度は40.9%から78.4%向上した。
論文 参考訳(メタデータ) (2025-12-30T14:21:17Z) - Enhancing Adversarial Transferability by Balancing Exploration and Exploitation with Gradient-Guided Sampling [82.52485740425321]
アドリアックは、ディープニューラルネットワークの堅牢性にとって重要な課題である。
敵攻撃の伝達性は、爆発(最大攻撃能力)と探索(クロスモデル一般化の促進)のジレンマに直面している
論文 参考訳(メタデータ) (2025-11-01T05:43:47Z) - Trust Region Constrained Measure Transport in Path Space for Stochastic Optimal Control and Inference [49.11857020431547]
信頼領域に基づく戦略は,対象尺度の先行から幾何的アニーリングと解釈できることを示す。
我々は,新しい手法が性能を大幅に向上させることができることを,複数の最適制御応用で実証した。
論文 参考訳(メタデータ) (2025-08-17T22:10:35Z) - A Trust-Region Method for Graphical Stein Variational Inference [3.5516599670943774]
スタイン変分法 (SVI) は、サンプル位置を情報理論尺度に共同最適化してサンプルセットを生成するサンプルベースの近似推論手法である。
本稿では,これらの課題に対処する新しい信頼条件付きアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-21T16:59:01Z) - Optimizing Diffusion Models for Joint Trajectory Prediction and Controllable Generation [49.49868273653921]
拡散モデルは、自律運転における共同軌道予測と制御可能な生成を約束する。
最適ガウス拡散(OGD)と推定クリーンマニフォールド(ECM)誘導を導入する。
提案手法は生成過程の合理化を図り,計算オーバーヘッドを低減した実用的な応用を実現する。
論文 参考訳(メタデータ) (2024-08-01T17:59:59Z) - PCB-RandNet: Rethinking Random Sampling for LIDAR Semantic Segmentation
in Autonomous Driving Scene [15.516687293651795]
大規模LiDAR点雲のセマンティックセグメンテーションのための新しいポーラシリンダバランスランダムサンプリング法を提案する。
さらに,セグメント化性能を向上し,異なるサンプリング法下でのモデルのばらつきを低減するため,サンプリング一貫性損失が導入された。
提案手法は,SemanticKITTIベンチマークとSemanticPOSSベンチマークの両方で優れた性能を示し,それぞれ2.8%と4.0%の改善を実現している。
論文 参考訳(メタデータ) (2022-09-28T02:59:36Z) - Optimization of Annealed Importance Sampling Hyperparameters [77.34726150561087]
Annealed Importance Smpling (AIS) は、深層生成モデルの難易度を推定するために使われる一般的なアルゴリズムである。
本稿では、フレキシブルな中間分布を持つパラメータAISプロセスを提案し、サンプリングに少ないステップを使用するようにブリッジング分布を最適化する。
我々は, 最適化AISの性能評価を行い, 深部生成モデルの限界推定を行い, 他の推定値と比較した。
論文 参考訳(メタデータ) (2022-09-27T07:58:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。