論文の概要: Conformal Prediction in The Loop: A Feedback-Based Uncertainty Model for Trajectory Optimization
- arxiv url: http://arxiv.org/abs/2510.16376v1
- Date: Sat, 18 Oct 2025 07:11:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:38.972218
- Title: Conformal Prediction in The Loop: A Feedback-Based Uncertainty Model for Trajectory Optimization
- Title(参考訳): ループの等角予測:軌道最適化のためのフィードバックベース不確かさモデル
- Authors: Han Wang, Chao Ning,
- Abstract要約: コンフォーマル予測(CP)は、カバレッジ保証を備えた不確実性セットを構築するための強力な統計機械学習ツールである。
本稿では,リスク制約を伴ってThorizonを縮小する新しいフィードバックベースCP(Fb-CP)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 3.761729592527251
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conformal Prediction (CP) is a powerful statistical machine learning tool to construct uncertainty sets with coverage guarantees, which has fueled its extensive adoption in generating prediction regions for decision-making tasks, e.g., Trajectory Optimization (TO) in uncertain environments. However, existing methods predominantly employ a sequential scheme, where decisions rely unidirectionally on the prediction regions, and consequently the information from decision-making fails to be fed back to instruct CP. In this paper, we propose a novel Feedback-Based CP (Fb-CP) framework for shrinking-horizon TO with a joint risk constraint over the entire mission time. Specifically, a CP-based posterior risk calculation method is developed by fully leveraging the realized trajectories to adjust the posterior allowable risk, which is then allocated to future times to update prediction regions. In this way, the information in the realized trajectories is continuously fed back to the CP, enabling attractive feedback-based adjustments of the prediction regions and a provable online improvement in trajectory performance. Furthermore, we theoretically prove that such adjustments consistently maintain the coverage guarantees of the prediction regions, thereby ensuring provable safety. Additionally, we develop a decision-focused iterative risk allocation algorithm with theoretical convergence analysis for allocating the posterior allowable risk which closely aligns with Fb-CP. Furthermore, we extend the proposed method to handle distribution shift. The effectiveness and superiority of the proposed method are demonstrated through benchmark experiments.
- Abstract(参考訳): コンフォーマル予測(CP)は、カバレッジ保証付き不確実性セットを構築するための強力な統計機械学習ツールであり、不確実な環境での軌道最適化(TO)など、意思決定タスクの予測領域の生成に広く採用されている。
しかし、既存の手法では、決定は予測領域に一方向依存するシーケンシャルなスキームを主に採用しており、その結果、意思決定からの情報をCPに指示するために送り返すことができない。
本稿では,ミッションタイム全体にわたって,共同リスク制約を課した新しいフィードバックベースCP(Fb-CP)フレームワークを提案する。
具体的には、実現された軌道を十分に活用して、後部許容リスクを調整することにより、CPベースの後部リスク計算法を開発し、予測領域を更新するために将来の時間に割り当てる。
このようにして、実現された軌道の情報はCPに継続的に送り返され、予測領域の魅力的なフィードバックベースの調整と、軌道性能のオンライン改善が実現される。
さらに、これらの調整が予測領域のカバレッジ保証を一貫して維持し、証明可能な安全性を確保することを理論的に証明する。
さらに,Fb-CPと密接に一致した後方許容リスクを割当てる理論的収束解析を用いた意思決定型反復的リスク割当アルゴリズムを開発した。
さらに,分散シフトを扱うために提案手法を拡張した。
提案手法の有効性と優位性をベンチマーク実験により実証した。
関連論文リスト
- DiffusionRollout: Uncertainty-Aware Rollout Planning in Long-Horizon PDE Solving [28.440795270548705]
DiffusionRolloutは自己回帰拡散モデルのための新しい選択的ロールアウト計画戦略である。
本稿では,自動回帰ロールアウト時のステップサイズを適応的に選択する機構を導入し,長期予測の信頼性を向上させる。
論文 参考訳(メタデータ) (2026-02-14T06:08:05Z) - Distribution-informed Online Conformal Prediction [53.674678995825666]
更新ルールに基礎となるデータパターンを組み込んだオンラインコンフォメーション予測アルゴリズムである Conformal Optimistic Prediction (COP) を提案する。
COPは予測可能なパターンが存在する場合により厳密な予測セットを生成し、見積もりが不正確な場合でも有効なカバレッジ保証を保持する。
我々は,COPが有効なカバレッジを実現し,他のベースラインよりも短い予測間隔を構築できることを証明した。
論文 参考訳(メタデータ) (2025-12-08T17:51:49Z) - On the System Theoretic Offline Learning of Continuous-Time LQR with Exogenous Disturbances [3.701656361145375]
線形二次規制 (LQR) 戦略のオフライン設計を不確実な乱れを伴う解析を行う。
我々のアプローチは、適応動的プログラミングの基本的な学習ベースのフレームワークの上に構築されている。
論文 参考訳(メタデータ) (2025-09-20T17:14:27Z) - Adaptive Conformal Prediction Intervals Over Trajectory Ensembles [50.31074512684758]
将来の軌道は、自律運転、ハリケーン予測、疫病モデルといった領域で重要な役割を果たしている。
本稿では,サンプル軌道を理論的カバレッジ保証付き校正された予測区間に変換する共形予測に基づく統一的なフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-18T21:14:07Z) - Efficient Safety Alignment of Large Language Models via Preference Re-ranking and Representation-based Reward Modeling [84.00480999255628]
大規模言語モデル(LLM)の安全性アライメントのための強化学習アルゴリズムは,分散シフトの課題に直面している。
現在のアプローチでは、ターゲットポリシーからのオンラインサンプリングを通じてこの問題に対処するのが一般的である。
モデル固有の安全判断能力を活用して報酬信号を抽出する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-13T06:40:34Z) - Volume-Sorted Prediction Set: Efficient Conformal Prediction for Multi-Target Regression [9.559062601251464]
マルチターゲット回帰における不確実性のための新しい手法であるVolume-Sorted Prediction Set (VSPS)を紹介する。
複雑な高次元設定における情報予測モデルを維持しながら,VSPSがより小さく,より多くの領域を生成することを示す。
論文 参考訳(メタデータ) (2025-03-04T02:34:59Z) - Calibrated Probabilistic Forecasts for Arbitrary Sequences [58.54729945445505]
実際のデータストリームは、分散シフトやフィードバックループ、敵アクターによって予測不可能に変化する可能性がある。
データがどのように進化するかに関わらず、有効な不確実性推定を保証するための予測フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-27T21:46:42Z) - Recursively Feasible Shrinking-Horizon MPC in Dynamic Environments with Conformal Prediction Guarantees [23.32696414512787]
我々は、ミッション中に制御不能なエージェントと相互作用する決定論的自律システムを制御することを検討する。
既存の作業は、未知のエージェントに対して高い信頼度予測領域を導出し、これらの領域をMPCに適した安全制約の設計に統合する。
我々は,新たな予測領域がオンライン化されるにつれて,安全制約の段階的緩和を通じて再帰的実現性を保証する縮小水平MPCを提案する。
論文 参考訳(メタデータ) (2024-05-17T16:07:03Z) - End-to-end Conditional Robust Optimization [6.363653898208231]
条件付きロバスト最適化(CRO)は、不確実な定量化と堅牢な最適化を組み合わせることで、高利得アプリケーションの安全性と信頼性を促進する。
本稿では,CROモデルの学習方法として,所定の決定の実証的リスクと,それをサポートする文脈不確実性セットの条件付きカバレッジの質の両方を考慮に入れた,新しいエンドツーエンドアプローチを提案する。
提案したトレーニングアルゴリズムは,従来の推定値を上回って,アプローチを最適化する決定を生成する。
論文 参考訳(メタデータ) (2024-03-07T17:16:59Z) - Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.758009422067]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。
本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文 参考訳(メタデータ) (2023-12-07T15:55:58Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Conformal Contextual Robust Optimization [21.2737854880866]
データ駆動による確率論的意思決定問題を予測するアプローチは、安全クリティカルな設定における不確実な領域の不確実性のリスクを軽減することを目指している。
本稿では,CPO(Conformal-Then-Predict)フレームワークを提案する。
確率列最適化による意思決定問題。
論文 参考訳(メタデータ) (2023-10-16T01:58:27Z) - Selective Classification via One-Sided Prediction [54.05407231648068]
片側予測(OSP)に基づく緩和は、実際に関係する高目標精度体制において、ほぼ最適カバレッジが得られるSCスキームをもたらす。
理論的には,SCとOSPのバウンダリ一般化を導出し,その手法が小さな誤差レベルでのカバレッジにおいて,技術手法の状態を強く上回ることを示す。
論文 参考訳(メタデータ) (2020-10-15T16:14:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。