論文の概要: Risk-Aware Rulebooks for Multi-Objective Trajectory Evaluation under Uncertainty
- arxiv url: http://arxiv.org/abs/2603.04603v1
- Date: Wed, 04 Mar 2026 21:06:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.916197
- Title: Risk-Aware Rulebooks for Multi-Objective Trajectory Evaluation under Uncertainty
- Title(参考訳): 不確実性を考慮した多目的軌道評価のためのリスク対応ルールブック
- Authors: Tichakorn Wongpiromsarn,
- Abstract要約: 本稿では,システムと環境間の不確実な相互作用が存在する場合のシステム軌跡を評価するためのリスク対応形式について述べる。
我々は,各系軌道が環境に与える影響を明示的にモデル化し,環境応答の分布に基づく軌道の評価を行う。
- 参考スコア(独自算出の注目度): 0.9875942542881044
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a risk-aware formalism for evaluating system trajectories in the presence of uncertain interactions between the system and its environment. The proposed formalism supports reasoning under uncertainty and systematically handles complex relationships among requirements and objectives, including hierarchical priorities and non-comparability. Rather than treating the environment as exogenous noise, we explicitly model how each system trajectory influences the environment and evaluate trajectories under the resulting distribution of environment responses. We prove that the formalism induces a preorder on the set of system trajectories, ensuring consistency and preventing cyclic preferences. Finally, we illustrate the approach with an autonomous driving example that demonstrates how the formalism enhances explainability by clarifying the rationale behind trajectory selection.
- Abstract(参考訳): 本稿では,システムと環境間の不確実な相互作用が存在する場合のシステム軌跡を評価するためのリスク対応形式について述べる。
提案された形式主義は不確実性の下での推論をサポートし、階層的優先順位や非互換性を含む要求と目的の間の複雑な関係を体系的に扱う。
環境を外因性ノイズとして扱うのではなく、各系軌道が環境に与える影響をモデル化し、環境応答の分布に基づいて軌道を評価する。
フォーマリズムがシステムトラジェクトリの集合の事前順序を誘導し、一貫性を確保し、循環的嗜好を防ぐことを証明している。
最後に, 軌道選択の理論的根拠を明らかにすることによって, 形式主義が説明可能性を高めることを示す自律運転例を用いて, アプローチを説明する。
関連論文リスト
- Statistical Contraction for Chance-Constrained Trajectory Optimization of Non-Gaussian Stochastic Systems [0.0]
このフレームワークは共形推論を用いて任意の参照軌跡を囲む閉ループ力学に対する信頼セットを生成する。
適切な制約の締め付けにより、基準軌跡上の統計的に妥当な決定論的制約をトラクタブルに修正することができる。
これにより、安全クリティカルな現実世界のアプリケーションにおいて、ニューラルネットワークメトリクスのような学習ベースのモーションプランナとコントローラを活用、検証するフォーマルなパスが可能になる。
論文 参考訳(メタデータ) (2026-03-07T08:01:20Z) - On the Plasticity and Stability for Post-Training Large Language Models [54.757672540381236]
塑性と安定性勾配の矛盾として根本原因を同定する。
本稿では,確率的衝突解決法(PCR)を提案する。
PCRはトレーニングの軌道を著しく滑らかにし、様々な推論タスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-02-06T07:31:26Z) - CURVE: Learning Causality-Inspired Invariant Representations for Robust Scene Understanding via Uncertainty-Guided Regularization [30.613712415224473]
CURVEは、変動不確実性モデリングと不確実性誘導構造正規化を統合し、高分散関係を抑制するフレームワークである。
具体的には,環境依存的変動から不変な相互作用力学を解離させ,スパースかつ領域安定なトポロジを促進させる。
実験により,CURVEをゼロショット転送と低データのsim-to-real適応で評価し,領域安定なスパーストポロジの学習能力を検証するとともに,分布シフト下でのリスク予測を支援するための信頼性の高い不確実性推定を行う。
論文 参考訳(メタデータ) (2026-01-28T08:15:56Z) - Admissibility Alignment [0.0]
本稿では,不確実性を考慮した意思決定のための新しい制御プレーンシステムアーキテクチャMAP-AIを提案する。
モンテカルロによる結果分布の推定と、許容性制御された政策選択を通じてアライメントを実施する。
本研究では,アライメント評価を意思決定自体に統合し,適応性制御された行動選択機構を実現する方法を示す。
論文 参考訳(メタデータ) (2026-01-05T05:58:19Z) - Certified Neural Approximations of Nonlinear Dynamics [51.01318247729693]
安全クリティカルな文脈では、神経近似の使用は、基礎となるシステムとの密接性に公式な境界を必要とする。
本稿では,認証された一階述語モデルに基づく新しい,適応的で並列化可能な検証手法を提案する。
論文 参考訳(メタデータ) (2025-05-21T13:22:20Z) - Embodied World Models Emerge from Navigational Task in Open-Ended Environments [5.785697934050656]
プロシージャ的に生成された平面迷路を解決するために,スパース報酬のみで訓練された反復エージェントが,方向,距離,障害物レイアウトなどの計量概念を自律的に内部化できるかどうかを問う。
トレーニングの後、エージェントは、下層の空間モデルにヒントを与える行動である、見えない迷路において、常に準最適経路を生成する。
論文 参考訳(メタデータ) (2025-04-15T17:35:13Z) - Know Where You're Uncertain When Planning with Multimodal Foundation Models: A Formal Framework [54.40508478482667]
認識と計画生成の不確実性を解消し、定量化し、緩和する包括的枠組みを提案する。
本稿では,知覚と意思決定の独特な性質に合わせた手法を提案する。
この不確実性分散フレームワークは, 変動率を最大40%削減し, タスク成功率をベースラインに比べて5%向上させることを示した。
論文 参考訳(メタデータ) (2024-11-03T17:32:00Z) - Stochasticity in Motion: An Information-Theoretic Approach to Trajectory Prediction [9.365269316773219]
本稿では、軌道予測における不確実性モデリングの課題を全体論的アプローチで解決する。
情報理論を基礎とした本手法は,不確実性を測定する理論的に原理化された方法を提供する。
従来の作業とは異なり、我々のアプローチは最先端のモーション予測器と互換性があり、より広い適用性を実現している。
論文 参考訳(メタデータ) (2024-10-02T15:02:32Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Reliable Off-policy Evaluation for Reinforcement Learning [53.486680020852724]
シーケンシャルな意思決定問題において、非政治評価は、目標政策の期待累積報酬を推定する。
本稿では、1つまたは複数のログデータを用いて、ロバストで楽観的な累積報酬推定を提供する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-08T23:16:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。