論文の概要: CausalMoE: A Billion-Scale Multimodal Foundation Model for Granger Causal Discovery with Pattern-Routed Heterogeneous Experts
- arxiv url: http://arxiv.org/abs/2606.13024v1
- Date: Thu, 11 Jun 2026 07:57:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.658855
- Title: CausalMoE: A Billion-Scale Multimodal Foundation Model for Granger Causal Discovery with Pattern-Routed Heterogeneous Experts
- Title(参考訳): CausalMoE:パターン制御された異種専門家による顆粒因果発見のための10億ドル規模のマルチモーダルファンデーションモデル
- Authors: Bo Liu, Di Dai, Jingwei Liu, Jiarui Jin, Xiaocheng Fang, Guangkun Nie, Hongyan Li, Shenda Hong,
- Abstract要約: 数十億のマルチモーダル・グランガー因果基盤モデルであるCausalMoEを提案する。
CaulMoEは、潜時パターンを動的に識別する、異種エキスパートのパターン制御混合を導入する。
また、変数間で動作し、スパースグランガー因果グラフを生成する因果自覚機構を設計する。
- 参考スコア(独自算出の注目度): 25.563603697914242
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Granger Causal Discovery (GCD) is fundamental for analyzing temporal dependencies in complex systems. However, existing neural GCD methods predominantly rely on a "one-size-fits-all" paradigm, struggling to capture distribution shifts and dynamic regime changes inherent in real-world time series. This often leads to entangled representations and spurious causal graphs. In this paper, we propose CausalMoE, a billion-scale multimodal Granger causal foundation model that explicitly models patch-level heterogeneity. CausalMoE introduces a Pattern-Routed Mixture of Heterogeneous Experts, which dynamically identifies latent temporal patterns and routes patches to specialized domain experts, effectively decoupling regime-specific mechanisms from shared dynamics. To ensure interpretable graph recovery, we design a Causality-Aware Self-Attention mechanism operating across variables, yielding sparse Granger causal graphs via proximal optimization. Furthermore, CausalMoE is the first to integrate LLMs and VLMs to align numerical signals with textual and visual priors, regularizing causal estimation in complex scenarios. Extensive experiments demonstrate that CausalMoE establishes a new state-of-the-art on fully supervised benchmarks, while effectively generalizing to few-shot settings where traditional methods fail.
- Abstract(参考訳): Granger Causal Discovery (GCD) は、複雑なシステムの時間的依存関係を分析するための基礎である。
しかし、既存のニューラルGCD法は主に「ワンサイズフィットオール」パラダイムに依存しており、実際の時系列に固有の分布シフトや動的状態の変化を捉えるのに苦労している。
これはしばしば絡み合った表現や突発的な因果グラフにつながる。
本稿では,パッチレベルの不均一性を明示的にモデル化したマルチモーダル・グランガー因果基盤モデルCausalMoEを提案する。
CausalMoEが紹介するPattern-Routed Mixture of Heterogeneous Expertsは、潜在時間パターンを動的に識別し、特殊なドメインエキスパートにパッチをルーティングする。
解析可能なグラフ回復を確保するために,変数間で動作している因果関係を意識した自己認識機構を設計し,近位最適化によりスパースグランガー因果グラフを生成する。
さらに、CausalMoE は LLM と VLM を統合して、複雑なシナリオにおける因果推定を規則化する。
大規模な実験では、CausalMoEが完全に教師付きベンチマークで新しい最先端のシステムを確立し、従来のメソッドが失敗するいくつかのショット設定に効果的に一般化している。
関連論文リスト
- Time Series Causal Discovery via Context-Conditioned and Causality-Augmented Pretraining [17.01926647313838]
時系列からの因果発見は、異常の根本原因をトレースするなど、多くの現実世界の応用において重要である。
textbfTime-series textbfCausal textbfDiscovery のための新しい textbfPretraining フレームワーク textbfPTCD を提案する。
論文 参考訳(メタデータ) (2026-05-26T09:30:42Z) - Evolutionary Router Feature Generation for Zero-Shot Graph Anomaly Detection with Mixture-of-Experts [60.60414602796664]
ゼロショットGADのための進化的ルータ特徴生成(EvoFG)を備えた新しいMoEフレームワークを提案する。
EvoFGは最先端のベースラインを一貫して上回り、強力で安定したゼロショットGAD性能を実現している。
論文 参考訳(メタデータ) (2026-02-12T06:16:51Z) - Learning Time-Aware Causal Representation for Model Generalization in Evolving Domains [50.66049136093248]
動的因果要因と因果機構のドリフトを組み込んだ時間認識型構造因果モデル(SCM)を開発した。
本研究では,時間領域毎に最適な因果予測値が得られることを示す。
合成と実世界の両方のデータセットの結果から,SynCは時間的一般化性能に優れることが示された。
論文 参考訳(メタデータ) (2025-06-21T14:05:37Z) - Multi-View Causal Discovery without Non-Gaussianity: Identifiability and Algorithms [59.15672758767244]
因果発見は、通常、非ガウス性のようなデータ生成モデルに対する強い仮定に依存する難しい問題である。
ここでは、この多視点構造を利用して、弱い仮定で因果発見を行う。
本稿では,複数視点因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-27T14:06:14Z) - Jacobian Regularizer-based Neural Granger Causality [45.902407376192656]
本稿では,ヤコビアン正規化器を用いたニューラルグラガー因果性(JRNGC)アプローチを提案する。
提案手法は,入力出力ヤコビ行列正規化器を利用して重みの空間的制約を解消する。
提案手法は,現在最先端の手法を用いて,グラガー因果関係とフルタイムグラガー因果関係を学習する上での競合性能を実現する。
論文 参考訳(メタデータ) (2024-05-14T17:13:50Z) - Causal Temporal Regime Structure Learning [49.77103348208835]
本稿では,DAG(Directed Acyclic Graph)を並列に学習する新しい手法であるCASTORを提案する。
我々は我々の枠組みの中で体制とDAGの識別可能性を確立する。
実験により、CASTORは既存の因果発見モデルより一貫して優れていることが示された。
論文 参考訳(メタデータ) (2023-11-02T17:26:49Z) - Inductive Granger Causal Modeling for Multivariate Time Series [49.29373497269468]
Inductive GRanger cAusal Modeling (InGRA) framework for inductive Granger causality learning and common causal structure detection。
特に,Granger causal attentionと呼ばれる新しい注意機構を通じて,異なるGranger causal Structureを持つ個人に対して,グローバルモデル1つを訓練する。
このモデルは、異なる個体の共通因果構造を検出し、新しく到着した個体のグランガー因果構造を推定することができる。
論文 参考訳(メタデータ) (2021-02-10T07:48:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。