論文の概要: Investigating the effect of binning on causal discovery
- arxiv url: http://arxiv.org/abs/2202.11789v1
- Date: Wed, 23 Feb 2022 21:15:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-25 17:04:59.414217
- Title: Investigating the effect of binning on causal discovery
- Title(参考訳): 因果発見におけるビンニングの効果の検討
- Authors: Andrew Colt Deckert and Erich Kummerfeld
- Abstract要約: 数値的連続測定のバインディング(すなわち離散化)は広範に広範に議論を呼んでいるプラクティスである。
本稿では,グリーディ等価探索(GES)因果探索アルゴリズムにおけるビンニングの効果をシミュレーションにより検討した結果を報告する。
- 参考スコア(独自算出の注目度): 0.5482532589225552
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Binning (a.k.a. discretization) of numerically continuous measurements is a
wide-spread but controversial practice in data collection, analysis, and
presentation. The consequences of binning have been evaluated for many
different kinds of data analysis methods, however so far the effect of binning
on causal discovery algorithms has not been directly investigated. This paper
reports the results of a simulation study that examined the effect of binning
on the Greedy Equivalence Search (GES) causal discovery algorithm. Our findings
suggest that unbinned continuous data often result in the highest search
performance, but some exceptions are identified. We also found that binned data
are more sensitive to changes in sample size and tuning parameters, and
identified some interactive effects between sample size, binning, and tuning
parameter on performance.
- Abstract(参考訳): 数値連続測定のバインニング(英: Binning、つまり離散化)は、データ収集、分析、プレゼンテーションにおいて広く普及しているが議論を呼んでいるプラクティスである。
バイニングの結果は様々な種類のデータ解析手法で評価されてきたが,これまでのところ、バイニングが因果探索アルゴリズムに与える影響は直接研究されていない。
本稿では,グリーディ等価探索(GES)因果探索アルゴリズムにおけるビンニングの効果をシミュレーションにより検討した結果を報告する。
この結果から,無結合連続データが最も検索性能が高いことが示唆されるが,例外もある。
また,サンプルサイズやチューニングパラメータの変化に対して,バイナリデータの方が感度が高く,サンプルサイズ,バイナリ,チューニングパラメータがパフォーマンスに与える影響も確認できた。
関連論文リスト
- Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - A Survey on Causal Discovery Methods for I.I.D. and Time Series Data [4.57769506869942]
因果発見(CD)アルゴリズムは、関連する観測データからシステムの変数間の因果関係を識別することができる。
本稿では、独立および同一分散データ(I.I.D.)データと時系列データの両方から因果発見を行うために設計された手法について広範な議論を行う。
論文 参考訳(メタデータ) (2023-03-27T09:21:41Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Valid Inference After Causal Discovery [73.87055989355737]
我々は、因果関係発見後の推論に有効なツールを開発する。
因果発見とその後の推論アルゴリズムの組み合わせは,高度に膨らんだ誤発見率をもたらすことを示す。
論文 参考訳(メタデータ) (2022-08-11T17:40:45Z) - The interventional Bayesian Gaussian equivalent score for Bayesian
causal inference with unknown soft interventions [0.0]
ゲノミクスのような特定の環境では、不均一な研究条件からのデータがあり、研究変数のサブセットのみに関連するソフトな(部分的な)介入がある。
観察データと介入データとの混合に対する介入BGeスコアを定義し,介入の目的と効果が不明である可能性がある。
論文 参考訳(メタデータ) (2022-05-05T12:32:08Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Doing Great at Estimating CATE? On the Neglected Assumptions in
Benchmark Comparisons of Treatment Effect Estimators [91.3755431537592]
もっとも単純な設定であっても、無知性仮定に基づく推定は誤解を招く可能性があることを示す。
異種処理効果評価のための機械学習ベンチマークデータセットを2つ検討した。
ベンチマークデータセットの固有の特性が、他のものよりもいくつかのアルゴリズムを好んでいる点を強調します。
論文 参考訳(メタデータ) (2021-07-28T13:21:27Z) - An algorithm-based multiple detection influence measure for high
dimensional regression using expectile [0.4999814847776096]
本稿では,アルゴリズムに基づく多段階多重検出手法を提案する。
データ中の望ましくない変数を識別し、キャプチャする3ステップのアルゴリズムである$asymMIP,$は2つの相補的な統計に基づく。
自閉症脳画像データ交換データセットへの本手法の適用により,脳の成熟度をよりバランスよく正確に予測することができた。
論文 参考訳(メタデータ) (2021-05-26T01:16:24Z) - Multi-Source Causal Inference Using Control Variates [81.57072928775509]
本稿では,複数のデータソースから因果効果を推定するアルゴリズムを提案する。
理論的には、これはATE推定値の分散を減少させる。
このフレームワークを結果選択バイアスの下で観測データからの推論に適用する。
論文 参考訳(メタデータ) (2021-03-30T21:20:51Z) - On the Sample Complexity of Causal Discovery and the Value of Domain
Expertise [0.0]
因果発見法は、純粋観測データからランダム変数間の因果関係を同定する。
本稿では,CIオラクルを使わずに因果探索アルゴリズムのサンプル複雑性を解析する。
我々の方法では、データサンプルの観点からドメインの専門知識の価値を定量化できます。
論文 参考訳(メタデータ) (2021-02-05T16:26:17Z) - Causal query in observational data with hidden variables [0.0]
本研究では、局所探索を用いて、観測データから因果効果を推定するための調整変数のスーパーセットを求める定理を開発する。
開発した定理に基づいて,因果クエリのためのデータ駆動型アルゴリズムを提案する。
実験により,提案アルゴリズムは隠れ変数を持つ既存のデータ駆動因果効果推定法よりも高速で,因果効果を推定できることがわかった。
論文 参考訳(メタデータ) (2020-01-28T11:23:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。