Fugu-MT 論文翻訳(概要): CausalVAE as a Plug-in for World Models: Towards Reliable Counterfactual Dynamics

論文の概要: CausalVAE as a Plug-in for World Models: Towards Reliable Counterfactual Dynamics

arxiv url: http://arxiv.org/abs/2604.07712v1
Date: Thu, 09 Apr 2026 01:56:06 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-10 18:34:05.630974
Title: CausalVAE as a Plug-in for World Models: Towards Reliable Counterfactual Dynamics
Title（参考訳）: 世界モデルのためのプラグインとしてのCausalVAE:信頼性のある対実ダイナミクスを目指して
Authors: Ziyi Ding, Xianxin Lai, Weiyu Chen, Xiao-Ping Zhang, Jiayu Chen,
Abstract要約: CausalVAEは、潜在世界モデルのためのプラグイン構造モジュールとして導入された。本研究は、競合する事実予測を保存し、プラグインの追加後に介入対応の事実検索を改善する。
参考スコア（独自算出の注目度）: 20.28682216580277
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this work, CausalVAE is introduced as a plug-in structural module for latent world models and is attached to diverse encoder-transition backbones. Across the reported benchmarks, competitive factual prediction is preserved and intervention-aware counterfactual retrieval is improved after the plug-in is added, suggesting stronger robustness under distribution shift and interventions. The largest gains are observed on the Physics benchmark: when averaged over 8 paired baselines, CF-H@1 is improved by +102.5%. In a representative GNN-NLL setting on Physics, CF-H@1 is increased from 11.0 to 41.0 (+272.7%). Through causal analysis, learned structural dependencies are shown to recover meaningful first-order physical interaction trends, supporting the interpretability of the learned latent causal structure.
Abstract（参考訳）: In this work, CausalVAE is introduced as a plug-in structure module for latent world model and is attached to various encoder-transition backbones。報告されたベンチマークでは、競合する事実予測が保存され、プラグインの追加後に介入対応の事実検索が改善され、分散シフトや介入による強い堅牢性が示唆された。 8組のベースラインで平均すると、CF-H@1は+102.5%向上する。物理学における代表的GNN-NLL設定では、CF-H@1は11.0から41.0(+272.7%)に増加する。因果解析により、学習された構造的依存関係は有意義な一階の物理的相互作用の傾向を回復し、学習された潜在因果構造の解釈可能性を支持する。

関連論文リスト

DSPR: Dual-Stream Physics-Residual Networks for Trustworthy Industrial Time Series Forecasting [14.844711734126681]
本研究では,定常時間パターンを状態依存的残留力学から明示的に分離する予測フレームワークを提案する。 DSPRは、システミックシフト時の予測精度とロバストさを一貫して改善する。平均保存精度は99%を超え、総変量比は97.2%に達する。
論文参考訳（メタデータ） (2026-04-08T06:21:10Z)
Out-of-distribution transfer of PDE foundation models to material dynamics under extreme loading [86.6550968435969]
ほとんどのPDEファンデーションモデルは、流体中心のベンチマークに基づいて事前訓練され、微調整されている。衝撃, 進化する界面, 破壊が非平滑な場を生み出す2つの不連続支配的体制について, 分布外移動をベンチマークする。我々は,PDE基礎モデルであるPOSEIDONとMORPHを2つのオープンソースとして評価し,事前学習した重みからの微調整と,トレーニングセットのサイズによるスクラッチからのトレーニングを比較し,分散シフト下でのサンプル効率の定量化を行った。
論文参考訳（メタデータ） (2026-03-04T18:19:35Z)
Function-Space Decoupled Diffusion for Forward and Inverse Modeling in Carbon Capture and Storage [65.51149575007149]
本稿では,Fun-DDPSについて述べる。Fun-DDPSは,関数空間拡散モデルと微分可能なニューラル演算子サロゲートを結合した生成フレームワークである。 Fun-DDPSは、ジョイントステートベースラインで観察される高周波アーティファクトから、物理的に一貫した実現をもたらす。
論文参考訳（メタデータ） (2026-02-12T18:58:12Z)
Evaluating and Enhancing the Vulnerability Reasoning Capabilities of Large Language Models [15.849480549367684]
本稿では,DAG生成タスクとして脆弱性推論をモデル化する新しいフレームワークであるDAGVulを提案する。さらにReinforcement Learning with Verifiable Rewards (RLVR)を導入することで、モデル推論トレースをプログラム固有の論理と整合させる。我々のフレームワークは、すべてのベースラインに対して平均18.9%の推論F1スコアを改善します。
論文参考訳（メタデータ） (2026-02-06T13:19:45Z)
Domain Generalization for Time Series: Enhancing Drilling Regression Models for Stick-Slip Index Prediction [0.5277024349608834]
この研究は、1Hz表面ドリルデータ60秒のラベル付きシーケンスをトレーニングし、SSI(スティック・スリップ指数)の予測によりドメイン間を一般化できるロバスト回帰モデルを開発することを目的としている。適応領域一般化(ADG)、不変リスク最小化(IRM)、ベースラインモデルの比較分析を行い、モデル性能改善における転写学習(TL)の有効性の評価を行った。
論文参考訳（メタデータ） (2026-01-06T10:09:42Z)
Efficient-Husformer: Efficient Multimodal Transformer Hyperparameter Optimization for Stress and Cognitive Loads [0.0]
トランスフォーマーに基づくモデルは生理的信号解析の分野で大きな注目を集めている。時間的信号の長距離依存性や複雑なパターンを活用することで、従来のRNNやCNNモデルよりも優れたパフォーマンスを実現することができる。マルチクラスストレス検出のためのトランスフォーマーベースアーキテクチャであるEfficient-Husformerを提案する。
論文参考訳（メタデータ） (2025-11-27T12:02:25Z)
Skywork Open Reasoner 1 Technical Report [51.403686909760914]
提案するSkywork-OR1は,長期チェーン・オブ・ソート(CoT)モデルのための,効果的かつスケーラブルな強化学習(RL)実装である。 DeepSeek-R1-Distillモデルシリーズをベースとして、我々のRLアプローチは顕著なパフォーマンス向上を実現している。我々のSkywork-OR1-32Bモデルは、AIME24とAIME25ベンチマークでDeepSeek-R1とQwen3-32Bを上回っています。
論文参考訳（メタデータ） (2025-05-28T12:56:04Z)
Toward Foundation Model for Multivariate Wearable Sensing of Physiological Signals [2.370585289844609]
本稿では,ウェアラブルセンシングデータから情報表現を抽出するための,最初のマルチモーダル・ユビキタス基盤モデルを提案する。具体的には,センサ内およびセンサ間の両方の信号パターンを検出するための特別な連絡トークンを共用したチャネル認識型アテンション機構を設計する。本モデルでは, メンタルヘルス, 身体状態推定, バイタルサイン推定, 疾患リスク評価など, 11のパブリックなウェアラブルセンシングデータセットに対して, 異常な一般化性を示す。
論文参考訳（メタデータ） (2024-12-12T23:35:18Z)
Source-Free Domain Adaptive Object Detection with Semantics Compensation [54.00183496587841]
Weak-to-strong Semantics Compensation (WSCo)を導入する。 WSCoは、クラス関連セマンティクスを補う。 WSCoは一般的なプラグインとして実装することができ、既存のSFODパイプラインと容易に統合できます。
論文参考訳（メタデータ） (2024-10-07T23:32:06Z)
Accuracy on the Line: On the Strong Correlation Between Out-of-Distribution and In-Distribution Generalization [89.73665256847858]
分布外性能は,広範囲なモデルと分布シフトに対する分布内性能と強く相関していることを示す。具体的には,CIFAR-10 と ImageNet の変種に対する分布内分布と分布外分布性能の強い相関関係を示す。また,CIFAR-10-Cと組織分類データセットCamelyon17-WILDSの合成分布の変化など,相関が弱いケースについても検討した。
論文参考訳（メタデータ） (2021-07-09T19:48:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。