論文の概要: Dual-Channel Grounded World Modeling (DCGWM): Structural Prevention of Objective Interference Collapse via Heterogeneous External Grounding with Inward-Only Gradient Flow
- arxiv url: http://arxiv.org/abs/2606.18688v1
- Date: Wed, 17 Jun 2026 04:55:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.010933
- Title: Dual-Channel Grounded World Modeling (DCGWM): Structural Prevention of Objective Interference Collapse via Heterogeneous External Grounding with Inward-Only Gradient Flow
- Title(参考訳): デュアルチャネルグラウンドド・ワールド・モデリング(DCGWM):内向き勾配流による異種外乱による客観干渉崩壊の構造的防止
- Authors: Akshay Hazare,
- Abstract要約: 我々は、2つの異なる外部信号に基づいてJEPAベースの世界モデルにおける障害モードを特定する。
共有潜在空間における共同学習は、支配チャネルが従属チャネルの表現部分空間を体系的に崩壊させる原因となる。
我々は,OICを分割した潜在空間を通して構造的に防止するデュアルチャネルグラウンドド・ワールド・モデリングを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Joint Embedding Predictive Architectures (JEPAs) are a leading approach to world model representation learning. We identify a failure mode in JEPA-based world models grounded against two qualitatively distinct external signals: physical dynamics (sparse, high-magnitude, constraint-satisfying gradient corrections) and social-behavioral dynamics (diffuse, distribution-matching corrections). We term this Objective Interference Collapse (OIC): we argue that joint learning in a shared latent space causes the dominant channel to systematically collapse the subordinate channel's representational subspace, in a manner not resolvable by loss weighting alone. We propose Dual-Channel Grounded World Modeling (DCGWM), designed to structurally prevent OIC through a partitioned latent space (physical subspace Z_p, behavioral subspace Z_b) with inward-only gradient flow. A Physical Grounding Channel updates only Z_p via VICReg-style alignment to physical measurements; a Social-Behavioral Grounding Channel updates only Z_b via alignment to trajectories from an emergent multi-agent simulation. An Inter-Channel Interface Module couples the subspaces at the task level without cross-subspace gradients. An Asymmetric Grounding Adherence Loss penalizes rollout drift with a hard hinge for physical violations and a soft KL for behavioral divergence. A Generative Rendering Layer is architecturally isolated from the latent world model. We present three theoretical results: the partition removes the gradient-interference pathway implicated in OIC; each grounded subspace inherits anti-collapse guarantees from its alignment objective; and generative isolation is necessary under a stated assumption on the generative objective's geometry. This manuscript establishes the problem formulation and architecture; experimental validation is ongoing and will be reported in a future revision.
- Abstract(参考訳): JEPA(Joint Embedding Predictive Architectures)は、世界モデル表現学習における主要なアプローチである。
物理力学(スパース,ハイマグニチュード,制約満足度勾配補正)と社会行動力学(拡散,分布マッチング補正)の2つの定性的に異なる外部信号に基づいて,JEPAベースの世界モデルにおける障害モードを同定する。
我々は、この目的干渉衝突(OIC: Objective Interference Collapse)と呼ぶ: 共有潜在空間における共同学習は、支配チャネルが従属チャネルの表現的部分空間を系統的に崩壊させる原因であり、損失重み付けだけで解決できない方法である。
本稿では,内向き勾配流を伴う分割潜在空間(物理部分空間Z_p,行動部分空間Z_b)を通してOICを構造的に防止するDual-Channel Grounded World Modeling (DCGWM)を提案する。
物理接地チャンネルは、VICRegスタイルのアライメントのみを物理測定に更新し、社会行動接地チャンネルは、創発的なマルチエージェントシミュレーションからのトラジェクトリへのアライメントを介してZ_bのみを更新する。
チャンネル間インタフェースモジュールは、サブスペース間の勾配なしでタスクレベルでサブスペースを結合する。
非対称グラウンドリング・アジェンス・ロスは、物理的違反に対するハードヒンジと行動分岐のためのソフトKLでロールアウトドリフトを罰する。
生成レンダリング層は、アーキテクチャ上、潜在世界モデルから分離されている。
分割はOICに含まれる勾配干渉経路を除去し,各接地部分空間はアライメント目的から反崩壊保証を継承する。
この写本は、問題定式化とアーキテクチャを確立しており、実験的な検証が進行中であり、今後の改訂で報告される予定である。
関連論文リスト
- Hierarchical Consistency Learning for Test-time Adaptation in Camouflage Perception [50.278200968044665]
カモフラージュされた物体検出(COD)は、物理的属性を通して背景から最小限の知覚差を示すターゲットをローカライズすることを目的としている。
既存のメソッドは、静的なTrain-then-freezeパラダイムによって制約されており、ドメインの剛性と依存性のアノテーションに悩まされている。
動的表現再構成のためのテスト時間適応を統合した階層的一貫性学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-25T09:57:46Z) - Beyond Point-Wise Matching: Structural Representation Alignment for Accelerating Diffusion Transformers [93.3976834364707]
本稿では,特徴写像のリレーショナル幾何における整合性を実現する構造的RePresentation AlignmentフレームワークであるsREPAを提案する。
モデルが事前訓練された特徴から全体的空間配置と構造的相関を内包するように促すことにより、sREPAはより高速でより安定した収束を達成する。
論文 参考訳(メタデータ) (2026-05-16T12:01:04Z) - Empowering Heterogeneous Graph Foundation Models via Decoupled Relation Alignment [20.128308877213044]
Decoupled Relation Subspace Alignment (DRSA)は、新しいプラグアンドプレイ関係駆動フレームワークである。
特徴的意味論を関係構造から切り離すことによってパラダイムを根本的にシフトさせる。
ユニバーサルプリプロセッシングモジュールとしてシームレスに統合することができる。
論文 参考訳(メタデータ) (2026-05-01T15:31:36Z) - Hyperbolic Enhanced Representation Learning for Incomplete Multi-view Clustering [57.38215918201251]
本稿では,不完全なマルチビュークラスタリングのためのハイパーボリック拡張表現学習フレームワークであるHERLを提案する。
ポアンカレボール内で操作すると、HERLは表現学習を強化するために構造を意識した潜在空間を構築する。
HERLは最先端のアプローチよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2026-04-18T10:50:46Z) - The Global Neural World Model: Spatially Grounded Discrete Topologies for Action-Conditioned Planning [0.9137554315375919]
我々は、トポロジカル量子化を実現する自己安定化フレームワークであるGNWM(Global Neural World Model)を提案する。
JEPA(Joint-Embedding Predictive Architecture)として活動する
筆者らは, このアーキテクチャにより, 「グリッドスナッピング」 を固有誤差補正機構として利用することにより, 自己回帰ロールアウト時の多様体のドリフトを防止することができることを示した。
論文 参考訳(メタデータ) (2026-04-17T15:12:15Z) - Fluxamba: Topology-Aware Anisotropic State Space Models for Geological Lineament Segmentation in Multi-Source Remote Sensing [6.815807403335458]
トポロジ対応の機能修正フレームワークを導入した軽量アーキテクチャを提案する。
F Fluxambaは3.4Mパラメータと6.3G FLOPで24FPS以上のリアルタイム推論速度を達成する。
論文 参考訳(メタデータ) (2026-01-24T03:55:21Z) - HierRelTriple: Guiding Indoor Layout Generation with Hierarchical Relationship Triplet Losses [52.70183252341687]
本稿では,空間的関係学習に着目した階層型三重項に基づく屋内関係学習手法HierRelTripleを提案する。
階層型リレーショナル三重項モデリングフレームワークであるHierRelTripleを導入する。
非条件レイアウト合成、フロアプラン条件付きレイアウト生成、シーン再構成の実験により、HierRelは空間関係のメトリクスを15%以上改善することを示した。
論文 参考訳(メタデータ) (2025-03-26T07:31:52Z) - Relation Matters: Foreground-aware Graph-based Relational Reasoning for
Domain Adaptive Object Detection [81.07378219410182]
我々は、FGRR(Fearground-aware Graph-based Reasoning)というドメインDのための新しい汎用フレームワークを提案する。
FGRRはグラフ構造を検出パイプラインに組み込んで、ドメイン内およびドメイン間フォアグラウンドオブジェクト関係を明示的にモデル化する。
実験の結果、提案したFGRRは4つのDomainDベンチマークの最先端よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-06-06T05:12:48Z) - Analyzing the Latent Space of GAN through Local Dimension Estimation [4.688163910878411]
高忠実度画像合成におけるスタイルベースGAN(StyleGAN)は、それらの潜在空間の意味的特性を理解するために研究の動機となっている。
事前学習したGANモデルにおける任意の中間層に対する局所次元推定アルゴリズムを提案する。
提案した計量はDistortionと呼ばれ、学習された潜在空間上の内在空間の不整合を測定する。
論文 参考訳(メタデータ) (2022-05-26T06:36:06Z) - Few Shot Generative Model Adaption via Relaxed Spatial Structural
Alignment [130.84010267004803]
限られたデータでGAN(Generative Adversarial Network)を訓練することは難しい課題である。
実現可能な解決策は、大規模なソースドメインで十分に訓練されたGANから始め、ターゲットドメインにいくつかのサンプルで適応することである。
本研究では,適応時の対象生成モデルのキャリブレーションを行うための緩和された空間構造アライメント手法を提案する。
論文 参考訳(メタデータ) (2022-03-06T14:26:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。