論文の概要: Correlation visualization under missing values: a comparison between
imputation and direct parameter estimation methods
- arxiv url: http://arxiv.org/abs/2305.06044v2
- Date: Tue, 5 Sep 2023 09:33:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-07 05:26:25.365345
- Title: Correlation visualization under missing values: a comparison between
imputation and direct parameter estimation methods
- Title(参考訳): 欠落値下の相関の可視化 : インプテーション法と直接パラメータ推定法の比較
- Authors: Nhat-Hao Pham, Khanh-Linh Vo, Mai Anh Vu, Thu Nguyen, Michael A.
Riegler, P{\aa}l Halvorsen, Binh T. Nguyen
- Abstract要約: 様々なデータ手法が相関プロットに与える影響を比較し,ランダムとモノトーンという2つの共通欠落パターンに着目した。
実験では, 直接パラメータ推定手法であるDPERを用いて相関行列をプロットすることを推奨する。
- 参考スコア(独自算出の注目度): 4.963490281438653
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Correlation matrix visualization is essential for understanding the
relationships between variables in a dataset, but missing data can pose a
significant challenge in estimating correlation coefficients. In this paper, we
compare the effects of various missing data methods on the correlation plot,
focusing on two common missing patterns: random and monotone. We aim to provide
practical strategies and recommendations for researchers and practitioners in
creating and analyzing the correlation plot. Our experimental results suggest
that while imputation is commonly used for missing data, using imputed data for
plotting the correlation matrix may lead to a significantly misleading
inference of the relation between the features. We recommend using DPER, a
direct parameter estimation approach, for plotting the correlation matrix based
on its performance in the experiments.
- Abstract(参考訳): 相関行列の可視化はデータセット内の変数間の関係を理解するのに不可欠であるが、データの欠如は相関係数の推定において大きな課題となる。
本稿では,様々な欠落データ手法が相関プロットに与える影響を比較し,無作為と単調の2つの共通欠落パターンに着目した。
我々は,相関プロットの作成と分析において,研究者や実践者に実践的な戦略と勧告を提供することを目指している。
実験結果から, インプテーションは欠落データに一般的に用いられるが, 相関行列のプロットにインプテーションデータを用いると, 特徴間の関係を著しく誤解させる可能性がある。
実験では, 直接パラメータ推定手法であるDPERを用いて相関行列をプロットすることを推奨する。
関連論文リスト
- Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - FACTS: First Amplify Correlations and Then Slice to Discover Bias [17.244153084361102]
コンピュータビジョンデータセットは、しばしばタスク関連ラベルと(学習しやすい)潜在タスク関連属性の間の急激な相関を含んでいる。
このようなデータセットでトレーニングされたモデルは、"ショートカット"を学び、相関が保たないデータのバイアス分散スライスを過小評価する。
本稿では,まず相関を増幅し,次にバイアスを識別し,下流のバイアス軽減戦略について報告する。
論文 参考訳(メタデータ) (2023-09-29T17:41:26Z) - Fair Canonical Correlation Analysis [14.206538828733507]
正準相関解析(CCA)は2つの変数間の関係を調べるために広く用いられている手法である。
保護属性に関連付けられた相関不一致誤差を最小限に抑えることで不公平を軽減できる枠組みを提案する。
論文 参考訳(メタデータ) (2023-09-27T17:34:13Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Causal Effect Estimation from Observational and Interventional Data
Through Matrix Weighted Linear Estimators [11.384045395629123]
本研究では,観測データと介入データの混合から因果効果を推定する。
予測二乗誤差の統計的効率は推定器を組み合わせることで向上できることを示す。
論文 参考訳(メタデータ) (2023-06-09T16:16:53Z) - Learning Partial Correlation based Deep Visual Representation for Image
Classification [61.0532370259644]
CNNの新たな構造層としてスパース逆共分散推定(SICE)を定式化する。
本研究は,部分的相関に基づく深部視覚表現を求め,小さなサンプル問題を緩和する。
実験により,本モデルの有効性と優れた分類性能が示された。
論文 参考訳(メタデータ) (2023-04-23T10:09:01Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - Efficient Causal Inference from Combined Observational and
Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。
そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。
パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T14:29:07Z) - Beyond Marginal Uncertainty: How Accurately can Bayesian Regression
Models Estimate Posterior Predictive Correlations? [13.127549105535623]
入力位置の異なる関数値間の予測的相関を推定することは、しばしば有用である。
まず、後続の予測相関に依存する下流タスクについて考察する:トランスダクティブアクティブラーニング(TAL)
TALは高価で間接的にアルゴリズムの開発を誘導できないため、予測相関をより直接的に評価する2つの指標を導入する。
論文 参考訳(メタデータ) (2020-11-06T03:48:59Z) - On Disentangled Representations Learned From Correlated Data [59.41587388303554]
相関データに対する最も顕著な絡み合うアプローチの挙動を解析することにより、現実のシナリオにギャップを埋める。
本研究では,データセットの体系的相関が学習され,潜在表現に反映されていることを示す。
また、トレーニング中の弱い監督や、少数のラベルで事前訓練されたモデルを修正することで、これらの潜伏相関を解消する方法を実証する。
論文 参考訳(メタデータ) (2020-06-14T12:47:34Z) - Bayesian Sparse Covariance Structure Analysis for Correlated Count Data [3.867363075280544]
犯罪の潜在的なリスクを支配している潜伏変数に対するガウス図式モデルを仮定する。
提案したモデルを用いて,潜在変数のスパース逆共分散を推定し,偏相関係数を評価する。
論文 参考訳(メタデータ) (2020-06-05T05:34:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。