論文の概要: CausalRivers -- Scaling up benchmarking of causal discovery for real-world time-series
- arxiv url: http://arxiv.org/abs/2503.17452v1
- Date: Fri, 21 Mar 2025 18:02:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-25 14:39:59.961464
- Title: CausalRivers -- Scaling up benchmarking of causal discovery for real-world time-series
- Title(参考訳): CausalRivers -- 実世界の時系列における因果発見のベンチマークのスケールアップ
- Authors: Gideon Stein, Maha Shadaydeh, Jan Blunk, Niklas Penzel, Joachim Denzler,
- Abstract要約: CausalRiversは、これまでで最大の時系列データ用因果発見キットだ。
2019年から2023年までの期間は15分間である。
エルベ川周辺で発生した洪水について,分布変化が顕著なイベントとして追加データを提供する。
- 参考スコア(独自算出の注目度): 7.562215603730798
- License:
- Abstract: Causal discovery, or identifying causal relationships from observational data, is a notoriously challenging task, with numerous methods proposed to tackle it. Despite this, in-the-wild evaluation of these methods is still lacking, as works frequently rely on synthetic data evaluation and sparse real-world examples under critical theoretical assumptions. Real-world causal structures, however, are often complex, making it hard to decide on a proper causal discovery strategy. To bridge this gap, we introduce CausalRivers, the largest in-the-wild causal discovery benchmarking kit for time-series data to date. CausalRivers features an extensive dataset on river discharge that covers the eastern German territory (666 measurement stations) and the state of Bavaria (494 measurement stations). It spans the years 2019 to 2023 with a 15-minute temporal resolution. Further, we provide additional data from a flood around the Elbe River, as an event with a pronounced distributional shift. Leveraging multiple sources of information and time-series meta-data, we constructed two distinct causal ground truth graphs (Bavaria and eastern Germany). These graphs can be sampled to generate thousands of subgraphs to benchmark causal discovery across diverse and challenging settings. To demonstrate the utility of CausalRivers, we evaluate several causal discovery approaches through a set of experiments to identify areas for improvement. CausalRivers has the potential to facilitate robust evaluations and comparisons of causal discovery methods. Besides this primary purpose, we also expect that this dataset will be relevant for connected areas of research, such as time-series forecasting and anomaly detection. Based on this, we hope to push benchmark-driven method development that fosters advanced techniques for causal discovery, as is the case for many other areas of machine learning.
- Abstract(参考訳): 因果発見(英: Causal discovery)は、観測データから因果関係を特定することであり、それに取り組むための多くの方法が提案されていることで有名な課題である。
これにもかかわらず、これらの手法の内在的な評価はいまだに欠けており、理論的な仮定の下では、しばしば合成データ評価やスパース実世界の例に頼っている。
しかし、現実世界の因果構造はしばしば複雑であり、適切な因果発見戦略を決定することは困難である。
このギャップを埋めるため、現在までの時系列データのための最大の因果探索ベンチマークキットであるCausalRiversを紹介します。
CausalRiversは、東ドイツ領(666測地)とバイエルン州(494測地)をカバーしている。
2019年から2023年までの期間は15分間である。
さらに,エルベ川周辺で発生した洪水について,分布変化が顕著なイベントとして追加データを提供する。
複数の情報ソースと時系列メタデータを活用することで、我々は2つの異なる因果基底真理グラフ(バヴァリアと東ドイツ)を構築した。
これらのグラフをサンプリングして数千のサブグラフを生成し、多様で困難な設定で因果発見をベンチマークする。
本稿では,CausalRiversの実用性を実証するために,いくつかの因果発見手法を実験によって評価し,改善すべき領域を特定する。
CausalRiversは因果発見手法の堅牢な評価と比較を容易にする可能性がある。
この主な目的に加えて、時系列予測や異常検出など、このデータセットは研究の関連分野にも関係していると期待している。
これに基づいて、私たちは、他の機械学習分野と同様に、因果発見のための高度な技術を促進する、ベンチマーク駆動のメソッド開発を推進したいと考えています。
関連論文リスト
- Causal Representation Learning in Temporal Data via Single-Parent Decoding [66.34294989334728]
科学的研究はしばしば、システム内の高レベル変数の根底にある因果構造を理解しようとする。
科学者は通常、地理的に分布した温度測定などの低レベルの測定を収集する。
そこで本研究では,単一親の復号化による因果発見法を提案し,その上で下位の潜伏者と因果グラフを同時に学習する。
論文 参考訳(メタデータ) (2024-10-09T15:57:50Z) - Unsupervised Pairwise Causal Discovery on Heterogeneous Data using Mutual Information Measures [49.1574468325115]
因果発見(Causal Discovery)は、構成変数の統計的性質を分析することで、この問題に取り組む手法である。
教師付き学習によって得られたことに基づいて,現在の(おそらく誤解を招く)ベースライン結果に疑問を呈する。
その結果、堅牢な相互情報測定を用いて、教師なしの方法でこの問題にアプローチする。
論文 参考訳(メタデータ) (2024-08-01T09:11:08Z) - Adaptive Online Experimental Design for Causal Discovery [9.447864414136905]
因果発見は因果グラフに符号化された因果関係を明らかにすることを目的としている。
オンライン学習の観点から,データの介入効率に着目し,因果発見を形式化する。
グラフ分離システムから介入を適応的に選択するトラック・アンド・ストップ因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-19T13:26:33Z) - Causal discovery in a complex industrial system: A time series benchmark [0.0]
因果発見は、観測データからグラフで表される因果構造を生成する。
専門知識から構築された因果グラフとともに,欧州スパレーションソースの産業サブシステムからのデータセットを提示する。
論文 参考訳(メタデータ) (2023-10-28T09:47:02Z) - Causal Discovery from Temporal Data: An Overview and New Perspectives [6.251443497694126]
時間データの分析は、様々なアプリケーションに非常に有用である。
因果的発見 時間的データから因果関係を 学ぶことは 興味深いが 重要な課題だ
本稿では,2つのカテゴリ間の相関関係を定義し,既存のソリューションの体系的概要を提供する。
論文 参考訳(メタデータ) (2023-03-17T16:45:01Z) - Valid Inference After Causal Discovery [73.87055989355737]
我々は、因果関係発見後の推論に有効なツールを開発する。
因果発見とその後の推論アルゴリズムの組み合わせは,高度に膨らんだ誤発見率をもたらすことを示す。
論文 参考訳(メタデータ) (2022-08-11T17:40:45Z) - Large-Scale Differentiable Causal Discovery of Factor Graphs [3.8015092217142223]
本稿では,非線形低ランク因果相互作用モデルへの探索空間の方法として,因子指向非巡回グラフ(f-DAG)の概念を導入する。
本稿では,f-DAG制約因果探索のスケーラブルな実装を提案する。
論文 参考訳(メタデータ) (2022-06-15T21:28:36Z) - Deconfounded Score Method: Scoring DAGs with Dense Unobserved
Confounding [101.35070661471124]
本研究では,観測データ分布に特徴的フットプリントが残っており,突発的・因果的影響を解消できることを示す。
汎用ソルバで実装し,高次元問題へのスケールアップが可能なスコアベース因果検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-28T11:07:59Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z) - Amortized Causal Discovery: Learning to Infer Causal Graphs from
Time-Series Data [63.15776078733762]
本稿では,時系列データから因果関係を推定する新しいフレームワークであるAmortized Causal Discoveryを提案する。
本研究では,本手法が変分モデルとして実装され,因果発見性能が大幅に向上することを示した。
論文 参考訳(メタデータ) (2020-06-18T19:59:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。