論文の概要: Conformal Orbit-Valid Trust Horizons for Equivariant World Models
- arxiv url: http://arxiv.org/abs/2606.24946v1
- Date: Tue, 23 Jun 2026 06:44:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:05:30.064378
- Title: Conformal Orbit-Valid Trust Horizons for Equivariant World Models
- Title(参考訳): 等変世界モデルのための等角軌道V型信頼ホライズン
- Authors: Hongbo Wang,
- Abstract要約: グループ対称性を持つ潜在世界モデルに対する信頼-水平認証について検討する。
安定監査50点中0点の反保守的違反を観察する。
- 参考スコア(独自算出の注目度): 6.230579198456525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learned world models are useful only over horizons on which their rollout error remains controlled. We study trust-horizon certification for latent world models with known group symmetries. Given a one-step latent residual and a finite-time expansion estimate, we form a raw horizon curve and calibrate it with a split-conformal multiplicative factor. On the reproducible audit set, the conformal factor is $γ_α=1.0$: the raw certificate is already conservative under the audit protocol. Across 50 stable audits, we observe zero anti-conservative violations, corresponding to an exact-binomial 95% upper bound of 5.8% on the violation rate. Our main structural result is that exact equivariance transports a calibrated trust-horizon curve over the group orbit: when the environment dynamics, encoder, predictor, action transform, and latent metric satisfy the stated equivariance/invariance conditions, rollout errors and trust horizons are orbit-constant. Empirically, the implemented models exhibit small orbit-transport residuals, with median 1.1% and maximum 4.1% over 14 orbit audits. The certificate is also non-vacuous (median certified-to-measured horizon ratio 0.67). A certificate-level calibration-cost study shows two complementary regimes. On a symmetric 2D substrate, equivariant, plain, and augmented models are all orbit-valid from a single calibration sector -- no separation, because the substrate already makes non-equivariant baselines approximately orbit-robust. A 3D yaw audit shows the other regime: the equivariant model obtains a one-sector safe and non-vacuous orbit-valid certificate, while healthy non-equivariant baselines pay violation, slack, sharpness, or additional-sector cost. The certificate is a conservative, distributional audit rather than a global reachability guarantee, and certificate-guided subgoal spacing is not confirmed in the current 3D CEM-MPC behavior layer.
- Abstract(参考訳): 学習された世界モデルは、ロールアウトエラーが制御されている地平線上でのみ有用である。
グループ対称性を持つ潜在世界モデルに対する信頼-水平認証について検討する。
一段階の潜伏残差と有限時間展開推定を与えられた場合、原地平線曲線を形成し、それを分割等角乗算係数でキャリブレーションする。
再現可能な監査セットでは、コンフォメーション係数は$γ_α=1.0$である。
また,50回の安定監査において,違反率5.8%の95%の正二項上限に対応する保存防止違反がゼロとなることを観察した。
環境力学,エンコーダ,予測器,行動変換,潜時計量が記述された等分散/不変条件を満たす場合,ロールアウト誤差と信頼地平線は軌道定数である。
実験的に、実装されたモデルは小さな軌道輸送残差を示し、中央値は1.1%、最大は14回の軌道オーディションで4.1%である。
また、証明書は空白ではない(中間認証地平線比0.67)。
証明書レベルの校正コストの研究は、2つの補完的な体制を示している。
対称な2D基板上では、同変、平ら、強化されたモデルは、すべて単一のキャリブレーションセクターからの軌道価であり、分離はない。
等変モデルは1セクタの安全かつ非空洞の軌道価証明書を取得し、健全な非等変基線は違反、スラック、シャープネス、追加セクタコストを支払う。
この証明書は、グローバルなリーチビリティ保証というよりも、保守的な配布監査であり、現在の3D CEM-MPCの動作層では、証明書誘導サブゴールスペーシングは確認されていない。
関連論文リスト
- Scale Buys Interpolation, Structure Buys a Horizon: Certified Predictability for Equivariant World Models [6.230579198456525]
世界モデルの平均誤差は、予測が信頼できるかどうか、どのくらいの間、何も言わない。
等変ラテント世界モデルに対しては、予測可能な地平線の計算可能で多段階の証明を与える。
40-D Lorenz-96では、$mathbbZN$-equivariantネットワークのみが完全なリャプノフスペクトルを回復する。
論文 参考訳(メタデータ) (2026-06-11T09:21:28Z) - Measuring the Symmetry--Data Exchange Rate [0.2538209532048867]
同一の軌道サイズと一致した計算値を持つ間違った群制御は制約を伴わないよりも悪いことを示す。
相対交換率beta_diff = 1.28は、理論ブートストラップ1.0と符号と桁違いに一致している。
手法的貢献 -- 共有拡散の欠点をキャンセルする相対レート推定器、間違ったグループ制御、および予め特定された失敗分類 - は、強度をパラメータ化できる帰納バイアスに転送される。
論文 参考訳(メタデータ) (2026-05-31T08:17:40Z) - Expectation Consistency Loss: Rethink Confidence Calibration under Covariate Shift [7.333172294727063]
一般的な信頼性校正法は、トレーニングとテストデータは独立で、同一に分散されていると仮定する。
本稿では、対象領域の信頼性を校正するために、教師なし領域適応損失を提案する。
予測誤差 (ECE) と同一のサンプル量を持つECL損失を計算し, ECL損失に対する理論的根拠付きミニバッチトレーニング可能なスキームを提供する。
論文 参考訳(メタデータ) (2026-05-20T11:45:39Z) - Discovery of Hidden Miscalibration Regimes [52.452902154360565]
モデルは何らかの入力を体系的に過信し、他人を過信することがある。
対応する誤校正分野を定義し,それを推定するための診断フレームワークを提案する。
提案手法は,入力空間のキャリブレーションを意識した表現を学習し,学習幾何学におけるカーネルの平滑化による符号付き局所的誤校正を推定する。
論文 参考訳(メタデータ) (2026-05-13T13:07:50Z) - The Geometric Canary: Predicting Steerability and Detecting Drift via Representational Stability [0.0]
表現の対距離構造の整合性である幾何学的安定性は、2つの関数に対処することを示す。
教師なしの安定性は、現実のタスクを操るために完全に失敗します。
ドリフト検出に優れ、トレーニング後のアライメントでCKAよりも2倍近い幾何変化を計測する。
論文 参考訳(メタデータ) (2026-04-20T01:24:45Z) - Information Fidelity in Tool-Using LLM Agents: A Martingale Analysis of the Model Context Protocol [69.11739400975445]
モデルコンテキストプロトコル(MCP)エージェントにおけるエラー蓄積を解析するための最初の理論的枠組みを紹介する。
累積歪みが線形成長と高確率偏差を$O(sqrtT)$で表すことを示す。
主な発見は、意味重み付けは歪みを80%減らし、周期的再接地は、エラー制御の約9ステップごとに十分である。
論文 参考訳(メタデータ) (2026-02-10T21:08:53Z) - CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal [84.71254539482369]
検証可能な報酬を伴うグループ相対的強化学習(RLVR)は、しばしば、すでに失敗している最も情報に富むデータを浪費する。
エラーを監督するマルチモーダル推論のための,障害中心のポストトレーニングフレームワークであるCAREを提案する。
CAREは正確さを改善し、スムーズさをトレーニングすると同時に、障害からの学習信号のシェアを明示的に増やします。
論文 参考訳(メタデータ) (2025-12-22T16:34:21Z) - Label Distributionally Robust Losses for Multi-class Classification:
Consistency, Robustness and Adaptivity [55.29408396918968]
多クラス分類のためのラベル分布ロバスト(LDR)損失という損失関数群について検討した。
我々の貢献は、多クラス分類のためのLDR損失のトップ$kの一貫性を確立することによって、一貫性と堅牢性の両方を含んでいる。
本稿では,各インスタンスのクラスラベルの雑音度に個別化温度パラメータを自動的に適応させる適応型LDR損失を提案する。
論文 参考訳(メタデータ) (2021-12-30T00:27:30Z) - Distribution-free binary classification: prediction sets, confidence
intervals and calibration [106.50279469344937]
分布自由条件における二項分類のための不確実性定量化(キャリブレーション、信頼区間、予測セット)の3つの概念について検討する。
固定幅と一様質量の両双対の双対確率に対する信頼区間を導出する。
我々の「三脚」定理の結果として、双有理確率に対するこれらの信頼区間は分布自由キャリブレーションに繋がる。
論文 参考訳(メタデータ) (2020-06-18T14:17:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。