論文の概要: One Lens, Many Worlds : A Capability-Typed Interface for World-Model Interpretability
- arxiv url: http://arxiv.org/abs/2606.09936v1
- Date: Sun, 07 Jun 2026 19:27:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.065626
- Title: One Lens, Many Worlds : A Capability-Typed Interface for World-Model Interpretability
- Title(参考訳): ワンレンズと多世界 : 世界モデル解釈のための機能型インタフェース
- Authors: Bhavith Chandra Challagundla, Sanskar Pandey, Param Thakkar, Rishikesh Mallagundla, Yugandhar Reddy Gogireddy, Wenhao Lu, Hindol Roy Choudhury, Shravani Challagundla, Mohamed Deraz Nasr, Spursh Deshpande,
- Abstract要約: 本稿では,能率型アダプタを中心に構成された,オープンソースの解釈可能性基板WorldModelLensを提案する。
各モデルは、必要な4つのメソッド(エンコード、トランジション、初期状態、サンプル)を実装し、オプションのヘッドセットを宣言する。
単一のフックとキャッシュ層は、タイムインデクシングされたアクティベーション、イマジネーションのロールアウト、このインターフェースに対する介入リプレイを公開する。
- 参考スコア(独自算出の注目度): 2.550140611921313
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: World models are now built on substantially different computational substrates. Latent recurrent state-space models such as PlaNet and the Dreamer family compress observations into recurrent states; token-based models such as IRIS quantize observations into a learned codebook and predict autoregressively with a transformer; and joint-embedding predictive architectures such as I-JEPA predict in a learned latent space with no pixel decoder. The interpretability methods applied to these models, including probing, activation patching, sparse autoencoders, and surprise analysis, share a common set of primitives, yet they are re-implemented from scratch for each architecture because existing hook-and-cache tooling assumes a transformer language model with no notion of actions, environment steps, or imagined rollouts. We argue that this fragmentation reflects the tooling rather than the models, and that the shared structure of world models is captured by a small typed interface. We present WorldModelLens, an open-source interpretability substrate organized around a capability-typed adapter: every model implements four required methods (encode, transition, initial state, sample) and declares a set of optional heads (decode, reward, continue, actor, critic) through an explicit capability descriptor, so that reinforcement-learning and self-supervised world models are first-class without either imitating the other. A single hook and cache layer exposes time-indexed activations, imagination rollouts, and intervention replay over this interface, allowing each analysis to be written once.
- Abstract(参考訳): 世界モデルは今では、かなり異なる計算基板上に構築されている。
PlaNetやDreamerファミリーのような遅延状態空間モデルは、観測結果を繰り返し状態に圧縮し、IRISのようなトークンベースのモデルは、学習したコードブックに量子化し、変圧器で自己回帰的に予測し、I-JEPAのような予測アーキテクチャは、学習した潜時空間でピクセルデコーダなしで予測する。
プロービング、アクティベーションパッチ、スパースオートエンコーダ、サプライズ分析など、これらのモデルに適用される解釈可能性メソッドは、共通のプリミティブセットを共有しているが、既存のフック・アンド・キャッシュツールでは、アクションや環境ステップ、想像されたロールアウトの概念を持たないトランスフォーマー言語モデルを想定しているため、各アーキテクチャのスクラッチから再実装されている。
この断片化は、モデルよりもツーリングを反映しており、世界モデルの共有構造は、小さな型付きインターフェースによって捉えられている、と我々は主張する。
各モデルは、必要な4つのメソッド(エンコード、トランジション、初期状態、サンプル)を実装し、明示的な機能記述子を通じてオプションヘッド(デコード、報酬、継続、アクター、批評家)のセットを宣言し、強化学習と自己管理された世界モデルは、他方を模倣することなくファーストクラスとなる。
単一のフックとキャッシュ層は、タイムインデックス化されたアクティベーション、イマジネーションのロールアウト、インターフェース上の介入リプレイを公開し、各分析を一度書くことができる。
関連論文リスト
- Latent Particle World Models: Self-supervised Object-centric Stochastic Dynamics Modeling [51.40150411616207]
実世界のマルチオブジェクトデータセットに拡張された自己教師型オブジェクト中心の世界モデルであるLatent Particle World Model (LPWM)を紹介する。
LPWMは、ビデオデータから直接キーポイント、バウンディングボックス、オブジェクトマスクを自律的に発見する。
私たちのアーキテクチャは、純粋にビデオからエンドツーエンドにトレーニングされ、アクション、言語、イメージ目標に対するフレキシブルな条件付けをサポートします。
論文 参考訳(メタデータ) (2026-03-04T19:36:08Z) - A Lightweight Library for Energy-Based Joint-Embedding Predictive Architectures [58.26804959656713]
JEPA(Joint-Embedding Predictive Architectures)を用いた表現と世界モデルを学習するためのオープンソースのライブラリであるEB-JEPAを提案する。
JEPAsは、ピクセル空間ではなく表現空間で予測することを学び、生成モデリングの落とし穴を避ける。
これらの表現がどのように行動条件付き世界モデルを駆動し、Two Roomsナビゲーションタスクで97%の計画成功率を達成するかを示す。
論文 参考訳(メタデータ) (2026-02-03T14:56:24Z) - Universal Sparse Autoencoders: Interpretable Cross-Model Concept Alignment [6.614005142754584]
ユニバーサルスパースオートエンコーダ(英: Universal Sparse Autoencoders、USAEs)は、複数のディープニューラルネットワークにまたがる解釈可能な概念を明らかにするためのフレームワークである。
USAEは、複数のモデルの内部アクティベーションを一度に再構築し解釈できる普遍的な概念空間を学ぶ。
論文 参考訳(メタデータ) (2025-02-06T02:06:16Z) - Promises and Pitfalls of Generative Masked Language Modeling: Theoretical Framework and Practical Guidelines [74.42485647685272]
GMLM(Generative Masked Language Models)に焦点を当てる。
我々は,マルコフ連鎖の入力として使用されるマスキングにより,データ分布の条件付き確率に適合するモデルを訓練し,モデルからサンプルを抽出する。
我々は,T5モデルを並列デコーディングに適応させ,最小品質の犠牲を伴って機械翻訳における2~3倍の高速化を実現した。
論文 参考訳(メタデータ) (2024-07-22T18:00:00Z) - Slot Structured World Models [0.0]
最先端のアプローチでは、フィードフォワードエンコーダを使用して、オブジェクトの埋め込みを抽出し、潜在グラフニューラルネットワークを使用して、オブジェクトの埋め込み間の相互作用をモデル化する。
Slot Structured World Models (SSWM)は、オブジェクト中心のエンコーダと潜在グラフベースの動的モデルを組み合わせた世界モデルのクラスである。
論文 参考訳(メタデータ) (2024-01-08T21:19:30Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Decoupling Global and Local Representations via Invertible Generative
Flows [47.366299240738094]
標準画像ベンチマークによる実験結果から, 密度推定, 画像生成, 教師なし表現学習の観点から, モデルの有効性が示された。
この研究は、確率に基づく目的を持つ生成モデルが疎結合表現を学習でき、明示的な監督を必要としないことを示した。
論文 参考訳(メタデータ) (2020-04-12T03:18:13Z) - CAZSL: Zero-Shot Regression for Pushing Models by Generalizing Through
Context [13.217582954907234]
本研究では、文脈認識モデルを構築することにより、物理世界のモデルを一般化できるディープラーニングエージェントを設計する問題について検討する。
本稿では、文脈対応ゼロショット学習(CAZSL)モデル、シームズネットワークを利用したアプローチ、埋め込み空間、文脈変数に基づく正規化を提案する。
提案した学習アルゴリズムを最近リリースされたOmnipushデータセット上でテストし、メタ学習機能のテストを可能にした。
論文 参考訳(メタデータ) (2020-03-26T01:21:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。