論文の概要: Parameter-Robust MPPI for Safe Online Learning of Unknown Parameters
- arxiv url: http://arxiv.org/abs/2601.02948v1
- Date: Tue, 06 Jan 2026 11:44:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.659645
- Title: Parameter-Robust MPPI for Safe Online Learning of Unknown Parameters
- Title(参考訳): 未知パラメータの安全なオンライン学習のためのパラメータロバストMPPI
- Authors: Matti Vahs, Jaeyoun Choi, Niklas Schmid, Jana Tumova, Chuchu Fan,
- Abstract要約: 本稿では,オンラインパラメータ学習と安全制約を統合したフレームワークを提案する。
PRMPPIは、Stein Variational Gradient Descentを通じてパラメータに対する粒子ベースの信念を維持している。
実験では、成功率の向上、トラッキングエラーの低減、ベースラインよりも正確なパラメータ推定が示されている。
- 参考スコア(独自算出の注目度): 23.009285809189056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robots deployed in dynamic environments must remain safe even when key physical parameters are uncertain or change over time. We propose Parameter-Robust Model Predictive Path Integral (PRMPPI) control, a framework that integrates online parameter learning with probabilistic safety constraints. PRMPPI maintains a particle-based belief over parameters via Stein Variational Gradient Descent, evaluates safety constraints using Conformal Prediction, and optimizes both a nominal performance-driven and a safety-focused backup trajectory in parallel. This yields a controller that is cautious at first, improves performance as parameters are learned, and ensures safety throughout. Simulation and hardware experiments demonstrate higher success rates, lower tracking error, and more accurate parameter estimates than baselines.
- Abstract(参考訳): 動的環境に展開されるロボットは、重要な物理パラメータが不確実であったり、時間とともに変化しても安全でなければならない。
本稿では,オンラインパラメータ学習と確率論的安全性制約を統合するフレームワークPRMPPI制御を提案する。
PRMPPIは、Stein Variational Gradient Descentを通じてパラメータに対する粒子ベースの信念を維持し、コンフォーマル予測を用いて安全性の制約を評価し、名目上のパフォーマンス駆動と安全性重視のバックアップの両方を並列に最適化する。
これにより、最初は慎重なコントローラが得られ、パラメータが学習されるにつれてパフォーマンスが向上し、全体の安全性が保証される。
シミュレーションとハードウェア実験は、ベースラインよりも高い成功率、低い追跡誤差、より正確なパラメータ推定を示す。
関連論文リスト
- Harmonious Parameter Adaptation in Continual Visual Instruction Tuning for Safety-Aligned MLLMs [49.76354497916853]
Harmonious Adaptation (HPA)は、集中型パラメータ分割、調和型パラメータ選択、パラメータ調整からなるポストトレーニングフレームワークである。
HPAは、既存のベースラインよりも高い安全性を維持し、忘れを軽減します。
CVITベンチマークと安全性評価データセットの実験は、HPAが既存のベースラインよりも高い安全性を維持し、忘れを軽減していることを示している。
論文 参考訳(メタデータ) (2025-11-25T10:34:51Z) - Rethinking Safety in LLM Fine-tuning: An Optimization Perspective [56.31306558218838]
我々は、本質的にトレードオフではなく、最適化の貧弱な選択が、しばしば安全上の問題を引き起こすことを示し、敵のプロンプトに対する有害な応答として測定する。
安全性能を保ったパラメータ空間における簡易指数移動平均(EMA)運動量法を提案する。
複数のデータセットにまたがるLlamaファミリーに関する実験は、安全性の問題が特別な介入なしに回避できることを実証している。
論文 参考訳(メタデータ) (2025-08-17T23:46:36Z) - Real-Time Adaptive Safety-Critical Control with Gaussian Processes in
High-Order Uncertain Models [14.790031018404942]
本稿では,不確実なパラメータを持つシステムを対象とした適応型オンライン学習フレームワークを提案する。
まず,差分スパースGPアルゴリズムを改良するために,まず忘れ係数を積分する。
第2フェーズでは,高次制御バリア関数に基づく安全フィルタを提案する。
論文 参考訳(メタデータ) (2024-02-29T08:25:32Z) - Sensitivity-Aware Visual Parameter-Efficient Fine-Tuning [91.5113227694443]
私たちは新しいビジュアルを提案します。
Sensuous-Aware Fine-Tuning (SPT) スキーム。
SPTはタスク固有の重要な位置にトレーニング可能なパラメータを割り当てる。
ダウンストリーム認識タスクの幅広い実験により,SPTは既存のPEFT法と相補的であることが示された。
論文 参考訳(メタデータ) (2023-03-15T12:34:24Z) - Probabilities Are Not Enough: Formal Controller Synthesis for Stochastic
Dynamical Models with Epistemic Uncertainty [68.00748155945047]
複雑な力学系のモデルにおける不確実性を捉えることは、安全なコントローラの設計に不可欠である。
いくつかのアプローチでは、安全と到達可能性に関する時間的仕様を満たすポリシーを形式的な抽象化を用いて合成する。
我々の貢献は、ノイズ、不確実なパラメータ、外乱を含む連続状態モデルに対する新しい抽象的制御法である。
論文 参考訳(メタデータ) (2022-10-12T07:57:03Z) - Meta-Learning Priors for Safe Bayesian Optimization [72.8349503901712]
メタ学習アルゴリズムであるF-PACOHを構築し,データ不足の設定において確実な定量化を実現する。
コアコントリビューションとして、安全に適合した事前をデータ駆動で選択するための新しいフレームワークを開発する。
ベンチマーク関数と高精度動作系において,我々のメタ学習先行が安全なBOアプローチの収束を加速することを示す。
論文 参考訳(メタデータ) (2022-10-03T08:38:38Z) - Online Parameter Estimation for Safety-Critical Systems with Gaussian
Processes [6.122161391301866]
オンラインパラメータ推定のためのガウス過程(GP)に基づくベイズ最適化フレームワークを提案する。
パラメータ空間の応答面上の効率的な探索戦略を用いて、最小限の機能評価で大域最適解を求める。
我々は,パラメータの変化を考慮したシミュレーションにおいて,アクティベートされた平面振子と安全臨界振子について実演する。
論文 参考訳(メタデータ) (2020-02-18T20:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。