論文の概要: When Does LeJEPA Learn a World Model?
- arxiv url: http://arxiv.org/abs/2605.26379v1
- Date: Mon, 25 May 2026 22:56:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.498813
- Title: When Does LeJEPA Learn a World Model?
- Title(参考訳): LeJEPAはいつ世界モデルを学ぶのか?
- Authors: David Klindt, Yann LeCun, Randall Balestriero,
- Abstract要約: 世界の真の自由度を揺るがす表現は、信頼できる計画や構成的一般化を支持できない。
我々は,LJEPAが非線形観測から世界の潜伏変数を線形に復元することを証明した。
本研究では,2次元の例から1024次元の潜伏物体まで,分布の短縮や画素ベースのロボット制御を含む実験により,この理論を検証した。
- 参考スコア(独自算出の注目度): 48.74247491501631
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A representation that scrambles the true degrees of freedom of the world cannot support reliable planning or compositional generalization. We prove that LeJEPA (alignment plus Gaussian regularization) linearly recovers the world's latent variables from nonlinear observations, a property known as linear identifiability, in a broad class of worlds where latents evolve under stationary, additive-noise transitions. Our main result is that among all such worlds, the Gaussian is the unique latent distribution for which this guarantee holds. The forward direction rests on a spectral decomposition in which each degree of nonlinearity is strictly penalized by alignment, making the linear map the optimum; the converse rules out every non-Gaussian alternative. We further prove an approximate identifiability result where the guarantee degrades gracefully, and show that linear, orthogonal identifiability enables optimal latent-space planning. We validate the theory with experiments ranging from 2D examples to 1024-dimensional latents, including distributional ablations and pixel-based robotic control. Our theory turns an empirically successful recipe into a mathematical guarantee, providing the foundation for building World Models that provably recover the structure of the world.
- Abstract(参考訳): 世界の真の自由度を揺るがす表現は、信頼できる計画や構成的一般化を支持できない。
線形識別可能性(英語版)と呼ばれる性質である非線形観測から、LJEPA(アライメントとガウス正則化)が線形に世界の潜伏変数を復元することを証明している。
我々の主な結果は、そのような世界の中で、ガウス分布は、この保証が成り立つ唯一の潜伏分布であるということである。
前方方向は、各非線形性の次数がアライメントによって厳格に罰せられ、線型写像を最適とするスペクトル分解に依拠する。
さらに、保証が優雅に低下する近似的識別可能性の結果を証明し、線形直交的識別性が最適潜在空間計画を可能にすることを示す。
本研究では,2次元の例から1024次元の潜伏物体まで,分布の短縮や画素ベースのロボット制御を含む実験により,この理論を検証した。
私たちの理論は、経験的に成功したレシピを数学的保証に変え、世界の構造を確実に回復する世界モデルを構築する基盤を提供する。
関連論文リスト
- Consistent Geometric Deep Learning via Hilbert Bundles and Cellular Sheaves [68.683840670745]
本稿では,多様体上の無限次元信号に対する新しい畳み込み学習フレームワークを提案する。
HilbNetsと、より一般的には、2段階のサンプリング手順により、畳み込み操作を実装できるようにします。
我々の結果は、古典ラプラシア語に基づくフレームワークを、各点の信号が自身のヒルベルト空間に存在するような設定へと持ち上げることで、幾何学的学習の全体範囲を広げる。
論文 参考訳(メタデータ) (2026-05-07T15:08:58Z) - Reasoning on the Manifold: Bidirectional Consistency for Self-Verification in Diffusion Language Models [30.607422839762553]
BMC(Bidirectional Manifold Consistency)は、トレーニングなし、教師なしのメトリクスである。
BMCは、根拠となる真理の答えなしに、解の有効性の堅牢な判別器として機能する。
本研究は,dLLMの正当性を示す頑健な指標として,固有幾何安定性を確立した。
論文 参考訳(メタデータ) (2026-04-17T10:17:16Z) - Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing [1.0312968200748118]
Rectified Flowモデルは最先端の世代品質を実現するが、正確なタスクのためにそれらを制御することは依然として困難である。
現在のアプローチは「幾何学的ロック」に苦しむ逆法に基づくガイダンスに分岐する
Score-Guided Proximal Projectionは,決定論的最適化と縮尺サンプリングのギャップを埋める統一フレームワークである。
論文 参考訳(メタデータ) (2026-03-05T23:44:45Z) - Generalized Linear Markov Decision Process [9.219628236765933]
一般化線形モデル(GLM)を用いた一般化線形MDP(GLMDP)フレームワークモデル報酬
一般化悲観的値イテレーション(GPEVI)と半教師付き変種(SS-GPEVI)の2つのオフラインRLアルゴリズムを開発した。
提案アルゴリズムは,政策準最適性に関する理論的保証を達成し,報酬ラベルが高価あるいは制限された設定におけるサンプル効率の向上を実証する。
論文 参考訳(メタデータ) (2025-06-01T03:50:41Z) - Disentangled Representation Learning with the Gromov-Monge Gap [65.73194652234848]
乱れのないデータから歪んだ表現を学習することは、機械学習における根本的な課題である。
本稿では,2次最適輸送に基づく非交叉表現学習手法を提案する。
提案手法の有効性を4つの標準ベンチマークで示す。
論文 参考訳(メタデータ) (2024-07-10T16:51:32Z) - Generative Locally Linear Embedding [5.967999555890417]
線形局所埋め込み(LLE)は非線形スペクトル次元減少および多様体学習法である。
GLLE(Generative LLE)という,新しいLLEの2つの生成バージョンを提案する。
シミュレーションの結果,提案手法はデータの展開や部分多様体の生成に有効であることがわかった。
論文 参考訳(メタデータ) (2021-04-04T02:59:39Z) - On the Stability of Nonlinear Receding Horizon Control: A Geometric
Perspective [72.7951562665449]
産業における非線形回帰制御(RHC)戦略の広範な採用には30年以上がかかる。
本稿では,グローバル・ジオメトリの役割を理解するための第一歩として,グローバル・ベース・コントロールの役割について述べる。
論文 参考訳(メタデータ) (2021-03-27T22:59:37Z) - GELATO: Geometrically Enriched Latent Model for Offline Reinforcement
Learning [54.291331971813364]
オフライン強化学習アプローチは、近近法と不確実性認識法に分けられる。
本研究では,この2つを潜在変動モデルに組み合わせることのメリットを実証する。
提案したメトリクスは、分布サンプルのアウトの品質と、データ内のサンプルの不一致の両方を測定します。
論文 参考訳(メタデータ) (2021-02-22T19:42:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。