論文の概要: Robust Causality and False Attribution in Data-Driven Earth Science
Discoveries
- arxiv url: http://arxiv.org/abs/2209.12580v1
- Date: Mon, 26 Sep 2022 10:45:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 17:16:43.037877
- Title: Robust Causality and False Attribution in Data-Driven Earth Science
Discoveries
- Title(参考訳): データ駆動型地球科学発見におけるロバスト因果性と誤帰属
- Authors: Elizabeth Eldhose (1), Tejasvi Chauhan (1), Vikram Chandel (1),
Subimal Ghosh (1 and 2), and Auroop R. Ganguly (3 and 4) ((1) Department of
Civil Engineering, Indian Institute of Technology Bombay, Mumbai, India, (2)
Interdisciplinary Program in Climate Studies, Indian Institute of Technology
Bombay, Mumbai, India, (3) Sustainability and Data Sciences Laboratory,
Department of Civil and Environmental Engineering, Northeastern University,
Boston, MA, USA, (4) Pacific Northwest National Laboratory, Richland, WA,
USA)
- Abstract要約: 因果研究と帰属研究は、地球科学的な発見や気候、生態学、水の政策を知らせるために不可欠である。
ここでは,移動エントロピーに基づく因果グラフが,統計的に有意に拡張された場合でも飛躍的であることを示す。
我々は,頑健な因果解析のためのサブサンプルに基づくアンサンブル手法を開発した。
- 参考スコア(独自算出の注目度): 0.3503794925747607
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Causal and attribution studies are essential for earth scientific discoveries
and critical for informing climate, ecology, and water policies. However, the
current generation of methods needs to keep pace with the complexity of
scientific and stakeholder challenges and data availability combined with the
adequacy of data-driven methods. Unless carefully informed by physics, they run
the risk of conflating correlation with causation or getting overwhelmed by
estimation inaccuracies. Given that natural experiments, controlled trials,
interventions, and counterfactual examinations are often impractical,
information-theoretic methods have been developed and are being continually
refined in the earth sciences. Here we show that transfer entropy-based causal
graphs, which have recently become popular in the earth sciences with
high-profile discoveries, can be spurious even when augmented with statistical
significance. We develop a subsample-based ensemble approach for robust
causality analysis. Simulated data, and observations in climate and
ecohydrology, suggest the robustness and consistency of this approach.
- Abstract(参考訳): 因果研究と帰属研究は地球科学的な発見に不可欠であり、気候、生態学、水政策に重要なものである。
しかし、現在の世代の手法は、科学的およびステークホルダーの課題とデータ可用性の複雑さと、データ駆動手法の適切性に追従する必要がある。
物理学に詳しく知らなければ、因果関係と相関関係を混同したり、不正確な推定によって圧倒されるリスクを負う。
自然実験、制御された試行、介入、および反事実検査は、しばしば非現実的であり、情報理論の手法が開発され、地球科学において継続的に洗練されている。
ここでは,最近地球科学で注目されている移動エントロピーに基づく因果グラフが,統計学的に有意に拡張された場合でも,急激であることを示す。
我々は,頑健な因果解析のためのサブサンプルに基づくアンサンブル手法を開発した。
シミュレーションデータと気候と生態学の観察は、このアプローチの堅牢性と一貫性を示唆している。
関連論文リスト
- Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - A data science axiology: the nature, value, and risks of data science [0.0]
データサイエンスは、知識発見のための未完成のスコープ、スケール、複雑さ、パワーを持つ研究パラダイムである。
本稿では、データサイエンスの公理、その目的、性質、重要性、リスク、問題解決の価値について述べる。
論文 参考訳(メタデータ) (2023-07-19T21:12:04Z) - A Diachronic Analysis of Paradigm Shifts in NLP Research: When, How, and
Why? [84.46288849132634]
本稿では、因果発見と推論技術を用いて、科学分野における研究トピックの進化を分析するための体系的な枠組みを提案する。
我々は3つの変数を定義し、NLPにおける研究トピックの進化の多様な側面を包含する。
我々は因果探索アルゴリズムを用いてこれらの変数間の因果関係を明らかにする。
論文 参考訳(メタデータ) (2023-05-22T11:08:00Z) - Discovering Causal Relations and Equations from Data [23.802778299505288]
本稿では、物理学の幅広い分野における因果関係と方程式発見に関する概念、方法、および関連する研究について概説する。
我々は、観察因果関係と方程式発見のための分類法を提供し、接続を指摘し、ケーススタディの完全なセットを示します。
興奮する時間は、複雑なシステムに対する理解を改善するための多くの課題と機会に先立ちます。
論文 参考訳(メタデータ) (2023-05-21T19:22:50Z) - GFlowNets for AI-Driven Scientific Discovery [74.27219800878304]
我々はGFlowNetsと呼ばれる新しい確率論的機械学習フレームワークを提案する。
GFlowNetsは、実験科学ループのモデリング、仮説生成、実験的な設計段階に適用できる。
我々は、GFlowNetsがAIによる科学的発見の貴重なツールになり得ると論じている。
論文 参考訳(メタデータ) (2023-02-01T17:29:43Z) - Spatiotemporal modeling of European paleoclimate using doubly sparse
Gaussian processes [61.31361524229248]
計算負担を軽減するため,近年の大規模分散時間GPを構築した。
我々は,古気候の確率モデルを構築するために,この2倍のスパースGPをうまく利用した。
論文 参考訳(メタデータ) (2022-11-15T14:15:04Z) - Modeling Information Change in Science Communication with Semantically
Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。
SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。
SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2022-10-24T07:44:38Z) - Scalable Sensitivity and Uncertainty Analysis for Causal-Effect
Estimates of Continuous-Valued Interventions [34.19821413853115]
観測データから継続的に評価された介入の効果を推定することは、気候科学、医療、経済学などの分野において極めて重要である。
我々は, 連続処理効果限界感度モデル(CMSM)を開発し, 観測データと研究者が定義した隠れ共役レベルの両方に適合する境界を導出する。
本研究では,これらの境界を高次元・大局的な観測データに対して効率的に推定するために,境界と不確実性を考慮した深部モデルを導出するスケーラブルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-04-21T11:15:10Z) - A Data Scientist's Guide to Streamflow Prediction [55.22219308265945]
我々は,水文降雨要素と流出モデルに着目し,洪水の予測と流れの予測に応用する。
このガイドは、データサイエンティストが問題や水文学的な概念、そしてその過程で現れる詳細を理解するのを助けることを目的としています。
論文 参考訳(メタデータ) (2020-06-05T08:04:37Z) - Attention: to Better Stand on the Shoulders of Giants [34.5017808610466]
本稿では,長期科学的影響予測のための注意機構を開発する。
実際の大規模引用データセットに基づいて,本手法の検証を行う。
論文 参考訳(メタデータ) (2020-05-27T00:25:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。