論文の概要: Conformal Prediction in The Loop: A Feedback-Based Uncertainty Model for Trajectory Optimization
- arxiv url: http://arxiv.org/abs/2510.16376v1
- Date: Sat, 18 Oct 2025 07:11:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:38.972218
- Title: Conformal Prediction in The Loop: A Feedback-Based Uncertainty Model for Trajectory Optimization
- Title(参考訳): ループの等角予測:軌道最適化のためのフィードバックベース不確かさモデル
- Authors: Han Wang, Chao Ning,
- Abstract要約: コンフォーマル予測(CP)は、カバレッジ保証を備えた不確実性セットを構築するための強力な統計機械学習ツールである。
本稿では,リスク制約を伴ってThorizonを縮小する新しいフィードバックベースCP(Fb-CP)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 3.761729592527251
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conformal Prediction (CP) is a powerful statistical machine learning tool to construct uncertainty sets with coverage guarantees, which has fueled its extensive adoption in generating prediction regions for decision-making tasks, e.g., Trajectory Optimization (TO) in uncertain environments. However, existing methods predominantly employ a sequential scheme, where decisions rely unidirectionally on the prediction regions, and consequently the information from decision-making fails to be fed back to instruct CP. In this paper, we propose a novel Feedback-Based CP (Fb-CP) framework for shrinking-horizon TO with a joint risk constraint over the entire mission time. Specifically, a CP-based posterior risk calculation method is developed by fully leveraging the realized trajectories to adjust the posterior allowable risk, which is then allocated to future times to update prediction regions. In this way, the information in the realized trajectories is continuously fed back to the CP, enabling attractive feedback-based adjustments of the prediction regions and a provable online improvement in trajectory performance. Furthermore, we theoretically prove that such adjustments consistently maintain the coverage guarantees of the prediction regions, thereby ensuring provable safety. Additionally, we develop a decision-focused iterative risk allocation algorithm with theoretical convergence analysis for allocating the posterior allowable risk which closely aligns with Fb-CP. Furthermore, we extend the proposed method to handle distribution shift. The effectiveness and superiority of the proposed method are demonstrated through benchmark experiments.
- Abstract(参考訳): コンフォーマル予測(CP)は、カバレッジ保証付き不確実性セットを構築するための強力な統計機械学習ツールであり、不確実な環境での軌道最適化(TO)など、意思決定タスクの予測領域の生成に広く採用されている。
しかし、既存の手法では、決定は予測領域に一方向依存するシーケンシャルなスキームを主に採用しており、その結果、意思決定からの情報をCPに指示するために送り返すことができない。
本稿では,ミッションタイム全体にわたって,共同リスク制約を課した新しいフィードバックベースCP(Fb-CP)フレームワークを提案する。
具体的には、実現された軌道を十分に活用して、後部許容リスクを調整することにより、CPベースの後部リスク計算法を開発し、予測領域を更新するために将来の時間に割り当てる。
このようにして、実現された軌道の情報はCPに継続的に送り返され、予測領域の魅力的なフィードバックベースの調整と、軌道性能のオンライン改善が実現される。
さらに、これらの調整が予測領域のカバレッジ保証を一貫して維持し、証明可能な安全性を確保することを理論的に証明する。
さらに,Fb-CPと密接に一致した後方許容リスクを割当てる理論的収束解析を用いた意思決定型反復的リスク割当アルゴリズムを開発した。
さらに,分散シフトを扱うために提案手法を拡張した。
提案手法の有効性と優位性をベンチマーク実験により実証した。
関連論文リスト
- On the System Theoretic Offline Learning of Continuous-Time LQR with Exogenous Disturbances [3.701656361145375]
線形二次規制 (LQR) 戦略のオフライン設計を不確実な乱れを伴う解析を行う。
我々のアプローチは、適応動的プログラミングの基本的な学習ベースのフレームワークの上に構築されている。
論文 参考訳(メタデータ) (2025-09-20T17:14:27Z) - Efficient Safety Alignment of Large Language Models via Preference Re-ranking and Representation-based Reward Modeling [84.00480999255628]
大規模言語モデル(LLM)の安全性アライメントのための強化学習アルゴリズムは,分散シフトの課題に直面している。
現在のアプローチでは、ターゲットポリシーからのオンラインサンプリングを通じてこの問題に対処するのが一般的である。
モデル固有の安全判断能力を活用して報酬信号を抽出する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-13T06:40:34Z) - Volume-Sorted Prediction Set: Efficient Conformal Prediction for Multi-Target Regression [9.559062601251464]
マルチターゲット回帰における不確実性のための新しい手法であるVolume-Sorted Prediction Set (VSPS)を紹介する。
複雑な高次元設定における情報予測モデルを維持しながら,VSPSがより小さく,より多くの領域を生成することを示す。
論文 参考訳(メタデータ) (2025-03-04T02:34:59Z) - Calibrated Probabilistic Forecasts for Arbitrary Sequences [58.54729945445505]
実際のデータストリームは、分散シフトやフィードバックループ、敵アクターによって予測不可能に変化する可能性がある。
データがどのように進化するかに関わらず、有効な不確実性推定を保証するための予測フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-27T21:46:42Z) - Recursively Feasible Shrinking-Horizon MPC in Dynamic Environments with Conformal Prediction Guarantees [23.32696414512787]
我々は、ミッション中に制御不能なエージェントと相互作用する決定論的自律システムを制御することを検討する。
既存の作業は、未知のエージェントに対して高い信頼度予測領域を導出し、これらの領域をMPCに適した安全制約の設計に統合する。
我々は,新たな予測領域がオンライン化されるにつれて,安全制約の段階的緩和を通じて再帰的実現性を保証する縮小水平MPCを提案する。
論文 参考訳(メタデータ) (2024-05-17T16:07:03Z) - End-to-end Conditional Robust Optimization [6.363653898208231]
条件付きロバスト最適化(CRO)は、不確実な定量化と堅牢な最適化を組み合わせることで、高利得アプリケーションの安全性と信頼性を促進する。
本稿では,CROモデルの学習方法として,所定の決定の実証的リスクと,それをサポートする文脈不確実性セットの条件付きカバレッジの質の両方を考慮に入れた,新しいエンドツーエンドアプローチを提案する。
提案したトレーニングアルゴリズムは,従来の推定値を上回って,アプローチを最適化する決定を生成する。
論文 参考訳(メタデータ) (2024-03-07T17:16:59Z) - Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.758009422067]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。
本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文 参考訳(メタデータ) (2023-12-07T15:55:58Z) - Conformal Contextual Robust Optimization [21.2737854880866]
データ駆動による確率論的意思決定問題を予測するアプローチは、安全クリティカルな設定における不確実な領域の不確実性のリスクを軽減することを目指している。
本稿では,CPO(Conformal-Then-Predict)フレームワークを提案する。
確率列最適化による意思決定問題。
論文 参考訳(メタデータ) (2023-10-16T01:58:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。