論文の概要: Causally-Guided Pairwise Transformer -- Towards Foundational Digital Twins in Process Industry
- arxiv url: http://arxiv.org/abs/2508.13111v1
- Date: Mon, 18 Aug 2025 17:18:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:11.507837
- Title: Causally-Guided Pairwise Transformer -- Towards Foundational Digital Twins in Process Industry
- Title(参考訳): Causally-Guided Pairwise Transformer -- プロセス産業における基礎的デジタルツインを目指して
- Authors: Michael Mayr, Georgios C. Chasparis,
- Abstract要約: Causally-Guided Pairwise Transformer (CGPT)は、既知の因果グラフを帰納バイアスとして統合した新しいアーキテクチャである。
CGPTはチャネル依存型(CD)モデルとチャネル依存型(CI)モデルの両方で予測精度において有意に優れていた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Foundational modelling of multi-dimensional time-series data in industrial systems presents a central trade-off: channel-dependent (CD) models capture specific cross-variable dynamics but lack robustness and adaptability as model layers are commonly bound to the data dimensionality of the tackled use-case, while channel-independent (CI) models offer generality at the cost of modelling the explicit interactions crucial for system-level predictive regression tasks. To resolve this, we propose the Causally-Guided Pairwise Transformer (CGPT), a novel architecture that integrates a known causal graph as an inductive bias. The core of CGPT is built around a pairwise modeling paradigm, tackling the CD/CI conflict by decomposing the multidimensional data into pairs. The model uses channel-agnostic learnable layers where all parameter dimensions are independent of the number of variables. CGPT enforces a CD information flow at the pair-level and CI-like generalization across pairs. This approach disentangles complex system dynamics and results in a highly flexible architecture that ensures scalability and any-variate adaptability. We validate CGPT on a suite of synthetic and real-world industrial datasets on long-term and one-step forecasting tasks designed to simulate common industrial complexities. Results demonstrate that CGPT significantly outperforms both CI and CD baselines in predictive accuracy and shows competitive performance with end-to-end trained CD models while remaining agnostic to the problem dimensionality.
- Abstract(参考訳): チャネル依存(CD)モデルは、特定のクロス変数のダイナミクスをキャプチャするが、モデル層が取り組んだユースケースのデータ次元に結びついているため、ロバスト性や適応性に欠ける。
そこで我々は、因果グラフを帰納バイアスとして統合した新しいアーキテクチャであるCGPT(Causally-Guided Pairwise Transformer)を提案する。
CGPTのコアは、多次元データをペアに分解することでCD/CI競合に対処する、ペアワイズモデリングパラダイムを中心に構築されている。
このモデルは、全てのパラメータ次元が変数の数に依存しないチャネルに依存しない学習可能な層を使用する。
CGPTはペアレベルのCD情報フローとペア間のCIライクな一般化を強制する。
このアプローチは複雑なシステムのダイナミクスを解き放ち、スケーラビリティと非可変適応性を保証する高度に柔軟なアーキテクチャをもたらす。
我々は,一般産業の複雑さをシミュレートするために設計された,長期及び1段階の予測タスクに基づいて,CGPTを合成および実世界の産業データセット群で検証する。
その結果,CGPTはCIベースラインとCDベースラインの両方を予測精度で有意に上回り,CDモデルとの競合性能を示した。
関連論文リスト
- Learning Time-Aware Causal Representation for Model Generalization in Evolving Domains [50.66049136093248]
動的因果要因と因果機構のドリフトを組み込んだ時間認識型構造因果モデル(SCM)を開発した。
本研究では,時間領域毎に最適な因果予測値が得られることを示す。
合成と実世界の両方のデータセットの結果から,SynCは時間的一般化性能に優れることが示された。
論文 参考訳(メタデータ) (2025-06-21T14:05:37Z) - A Theoretical Perspective: How to Prevent Model Collapse in Self-consuming Training Loops [55.07063067759609]
高品質なデータは大規模な生成モデルのトレーニングには不可欠だが、オンラインで利用可能な実際のデータの膨大な蓄積はほとんど枯渇している。
モデルは、さらなるトレーニングのために独自のデータを生成し、自己消費訓練ループ(STL)を形成する。
一部のモデルは劣化または崩壊するが、他のモデルはこれらの失敗をうまく回避し、理論的な理解にかなりのギャップを残している。
論文 参考訳(メタデータ) (2025-02-26T06:18:13Z) - Causal Time-Series Synchronization for Multi-Dimensional Forecasting [1.1060425537315088]
プロセス産業のDigital Twinsに対する高い期待は、タスクや多様なドメインをまたいで一般化できるモデリングアプローチを必要とする。
提案手法は, (i) データ駆動方式を用いて高度にタグ付けされた因果関係を同定し, (ii) 原因-影響ペアを同期させて, チャネル依存事前学習のためのトレーニングサンプルを生成し, (iii) チャネル依存予測におけるこのアプローチの有効性を評価することに焦点を当てる。
論文 参考訳(メタデータ) (2024-11-15T12:50:57Z) - Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - Beyond DAGs: A Latent Partial Causal Model for Multimodal Learning [80.44084021062105]
本稿では,非方向エッジで連結された2つの潜在結合変数を特徴とする,多モーダルデータに対する新しい潜在部分因果モデルを提案する。
特定の統計的仮定の下では、多モーダル・コントラッシブ・ラーニングによって学習された表現が、自明な変換までの潜在結合変数に対応することを示す。
事前トレーニングされたCLIPモデルの実験は、非絡み合った表現を具現化し、数ショットの学習を可能にし、さまざまな現実世界のデータセットにわたるドメインの一般化を改善する。
論文 参考訳(メタデータ) (2024-02-09T07:18:06Z) - PGODE: Towards High-quality System Dynamics Modeling [40.76121531452706]
本稿では,エージェントが相互に相互作用して動作に影響を与えるマルチエージェント力学系をモデル化する問題について検討する。
最近の研究では、主に幾何学グラフを用いてこれらの相互相互作用を表現し、グラフニューラルネットワーク(GNN)によって捉えられている。
本稿では,プロトタイプグラフODE(Prototypeal Graph ODE)という新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-11-11T12:04:47Z) - Enhanced multi-fidelity modelling for digital twin and uncertainty
quantification [0.0]
データ駆動モデルは、リアルタイムのアップデートと予測を可能にするデジタルツインにおいて重要な役割を果たす。
利用可能なデータの忠実さと正確なセンサーデータの不足は、しばしば代理モデルの効率的な学習を妨げる。
本稿では,ロバストなマルチフィデリティ・サロゲートモデルの開発から始まる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-26T05:58:17Z) - Bayesian Complementary Kernelized Learning for Multidimensional
Spatiotemporal Data [11.763229353978321]
補足型並列学習(BCKL)のための新しい統計フレームワークを提案する。
BCKLは、正確な後部平均値と高品質の不確実性推定を提供することで優れた性能を提供する。
論文 参考訳(メタデータ) (2022-08-21T22:38:54Z) - Towards Robust Unsupervised Disentanglement of Sequential Data -- A Case
Study Using Music Audio [17.214062755082065]
Disentangled Sequence Autoencoder (DSAE) は確率的グラフィカルモデルのクラスを表す。
バニラDSAEはモデルアーキテクチャの選択や動的潜伏変数の容量に敏感であることを示す。
本稿では,まずシーケンスレベルの事前分布を学習する2段階のトレーニングフレームワークTS-DSAEを提案する。
論文 参考訳(メタデータ) (2022-05-12T04:11:25Z) - Understanding Overparameterization in Generative Adversarial Networks [56.57403335510056]
generative adversarial network (gans) は、非凹型ミニマックス最適化問題を訓練するために用いられる。
ある理論は、グローバル最適解に対する勾配降下 (gd) の重要性を示している。
ニューラルネットワークジェネレータと線形判別器を併用した多層GANにおいて、GDAは、基礎となる非凹面min-max問題の大域的なサドル点に収束することを示す。
論文 参考訳(メタデータ) (2021-04-12T16:23:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。