論文の概要: Scale Buys Interpolation, Structure Buys a Horizon: Certified Predictability for Equivariant World Models
- arxiv url: http://arxiv.org/abs/2606.13092v1
- Date: Thu, 11 Jun 2026 09:21:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.691822
- Title: Scale Buys Interpolation, Structure Buys a Horizon: Certified Predictability for Equivariant World Models
- Title(参考訳): Scaleが補間を買収、StructureはHorizonを買収:等変世界モデルの予測可能性認定
- Authors: Hongbo Wang,
- Abstract要約: 世界モデルの平均誤差は、予測が信頼できるかどうか、どのくらいの間、何も言わない。
等変ラテント世界モデルに対しては、予測可能な地平線の計算可能で多段階の証明を与える。
40-D Lorenz-96では、$mathbbZN$-equivariantネットワークのみが完全なリャプノフスペクトルを回復する。
- 参考スコア(独自算出の注目度): 6.230579198456525
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scale buys interpolation; structure buys a certified horizon. A world model's average error says nothing about whether a particular prediction can be trusted, or for how long. For equivariant latent world models we give a computable, multi-step certificate of the predictable horizon: $T$-step rollout error is provably constant over each symmetry orbit (Theorem A) and stratified channel-by-channel by the predictor's Lyapunov spectrum, $T_j(ε)\sim\log(1/ε)/λ_j$. The horizon is two-sided -- a matching lower bound makes approximate equivariance provably horizon-limited -- and the certificate is exclusive to structure: orbit-constant error characterizes equivariance, so no non-equivariant model has it at any scale. Empirically, on 40-D Lorenz-96 only a $\mathbb{Z}_N$-equivariant network recovers the full Lyapunov spectrum ($R^2{=}0.98$); dense and recurrent baselines fail. Because the spectrum is faithful, the certificate acts, a priori: under a fixed sensing budget a $c\times$-inflated certificate provably needs $c\times$ the budget, and the equivariant certificate meets a budget its inflated dense counterpart cannot -- with zero calibration data. The same read-out, unchanged, audits public pretrained world models training-free: TD-MPC2 checkpoints land on the certificate's own scope taxonomy -- calibrated where strongly expansive (ratio 0.94-1.02), optimistic where weakly expansive, correctly abstaining where contracting -- a map a deployed monitor replicates cell-by-cell, out-of-sample. Across the official 1M-317M multitask ladder, calibration does not improve with parameters. On V-JEPA 2-AC (1B, real robot data) the measured cross-check correctly overrides an over-promising tangent spectrum -- the cross-validated audit, not the raw number, is the deployable object. Scale buys interpolation, not a calibrated horizon.
- Abstract(参考訳): スケールは補間を買い、構造は認定された地平線を買います。
世界モデルの平均誤差は、特定の予測が信頼できるかどうか、どのくらいの期間、何も言わない。
等変ラテント世界モデルに対しては、予測可能な水平線の計算可能で多段階の証明を与える:$T$-step ロールアウト誤差は各対称性軌道(定理A)上で証明可能定数であり、予測子のリアプノフスペクトルによる成層チャネルバイチャネル、$T_j(ε)\sim\log(1/ε)/λ_j$である。
水平線は二辺であり、一致した下界は、ほぼ同値を証明可能地平線に制限する -- そして証明は構造に排他的である: 軌道定数誤差は同値を特徴付けるので、任意のスケールで非同値モデルがそれを持つことはない。
40-次元ローレンツ-96 上では、$\mathbb{Z}_N$-equivariant ネットワークのみが完全なリャプノフスペクトル (R^2{=}0.98$) を回復する。
固定された検知予算の下では、$c\times$-inflated certificateは、確実に$c\times$ the budgetを必要とし、同変証明書は、その膨らませた高密度な証明書が、キャリブレーションデータを持たない予算を満たす。
TD-MPC2チェックポイントは、証明書自身のスコープ分類に着地する -- 強く拡張可能な場所(比0.94-1.02)を校正する。
公式の1M-317Mマルチタスク・ラダーでは、パラメータでは校正は改善されない。
V-JEPA 2-AC(1B、実際のロボットデータ)では、測定されたクロスチェックがオーバーライドしすぎるタンジェントスペクトルを正しくオーバーライドする。
スケールは校正地平線ではなく補間を購入する。
関連論文リスト
- Is Spurious Correlation Removal Always Learnable? [56.28155520961125]
不変学習は、構造が統計的に識別可能であっても失敗することがある。
ブラックボックスサンプリング可能な教師付きスパースリカバリプリミティブの下では、実証可能な多次元環境が存在する。
合成および実際のデータセットは、予測されたギャップと遷移を示し、単純な多様性診断を動機付ける。
論文 参考訳(メタデータ) (2026-06-11T05:49:43Z) - Wavelet Variance Equipartition as a Threshold for World-Model Quality and Quantum Kernel TN-Simulability [0.0]
我々はウェーブレットスケーリング指数$$を臨界診断として同定する。
振幅符号化された量子カーネルの古典的シミュラビリティのシャープな遷移境界として$=1/2$を確立する。
この分散は、厳密には$Var[X] = (d-2)$としてスケールする。
論文 参考訳(メタデータ) (2026-05-12T05:41:12Z) - Adaptive Calibration in Non-Stationary Environments [44.81344039432424]
複数のキャリブレーション対策の下で適応的なキャリブレーション保証を実現するアルゴリズムの組を開発する。
我々の手法は先行研究(Hu et al., 2026, Luo et al., 2025)の上に構築され、基礎となる基底真理付近でより微細な分解を割り当てる予測空間の非一様分割を導入する。
論文 参考訳(メタデータ) (2026-05-12T04:06:40Z) - Correction and Corruption: A Two-Rate View of Error Flow in LLM Protocols [51.56484100374058]
そこで本研究では,単一プロトコルステップを正確なマッチングタスクで監査するためのペアアウトカム計測インタフェースを提案する。
各インスタンスについて、インターフェースはベースラインの正当性ビットと後ステップの正当性ビットを記録する。
これらのレートは精度の変化を予測し、種、混合物、パイプライン間でテスト可能な再利用可能な経験的インターフェースを定義する。
論文 参考訳(メタデータ) (2026-04-20T13:25:40Z) - The Geometric Canary: Predicting Steerability and Detecting Drift via Representational Stability [0.0]
表現の対距離構造の整合性である幾何学的安定性は、2つの関数に対処することを示す。
教師なしの安定性は、現実のタスクを操るために完全に失敗します。
ドリフト検出に優れ、トレーニング後のアライメントでCKAよりも2倍近い幾何変化を計測する。
論文 参考訳(メタデータ) (2026-04-20T01:24:45Z) - Minimax Optimality and Spectral Routing for Majority-Vote Ensembles under Markov Dependence [6.908972852063454]
主要声楽アンサンブルは、多種多様なほぼ独立した基礎学習者に対して平均化することにより、ばらつきの低減を実現する。
固定次元マルコフ集合における離散的な分類のために、この現象のミニマックス的特徴付けを行う。
合成マルコフ連鎖、2次元空間格子、128データセットのUCRアーカイブ、アタリDQNアンサンブルに関する実験は、理論的な予測を検証している。
論文 参考訳(メタデータ) (2026-04-15T02:32:30Z) - Reinforcement Learning from Multi-Source Imperfect Preferences: Best-of-Both-Regimes Regret [71.69884486156359]
我々は, 累積的不完全化予算を用いて, エンフルティソースの不完全性選好からエピソードRLを考察した。
我々は,最良な登録行動を示す,後悔$tildeO(sqrtK/M+)$の統一アルゴリズムを提案する。
論文 参考訳(メタデータ) (2026-03-20T19:34:53Z) - Optimal Unconstrained Self-Distillation in Ridge Regression: Strict Improvements, Precise Asymptotics, and One-Shot Tuning [61.07540493350384]
自己蒸留(英: Self-distillation, SD)とは、教師自身の予測と地道の混合で学生を訓練する過程である。
任意の予測リスクに対して、各正規化レベルにおいて、最適に混合された学生がリッジ教師に改善されることが示される。
本稿では,グリッド探索やサンプル分割,再構成なしに$star$を推定する一貫したワンショットチューニング手法を提案する。
論文 参考訳(メタデータ) (2026-02-19T17:21:15Z) - Witness wedges in fidelity-deviation plane: separating teleportation advantage and Bell-inequality violation [0.0]
我々は、2つの相補的なメリットの図形の合同幾何学を通して量子テレポーテーションを解析するための統一的な枠組みを開発する。
特に、任意の測定ペア$(F D)$は、等方性資源の可視性推定に移植することができる。
論文 参考訳(メタデータ) (2025-11-26T05:43:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。