論文の概要: Evaluating Independence and Conditional Independence Measures
- arxiv url: http://arxiv.org/abs/2205.07253v1
- Date: Sun, 15 May 2022 10:38:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-17 17:30:01.043144
- Title: Evaluating Independence and Conditional Independence Measures
- Title(参考訳): 独立・条件独立対策の評価
- Authors: Jian Ma
- Abstract要約: 独立性と条件独立性(CI)は確率と統計の2つの基本的な概念であり、統計推論の多くの中心的な問題を解くために応用できる。
本稿では,16の独立対策と16のCI対策を検証し,シミュレーションおよび実データを用いて評価した。
- 参考スコア(独自算出の注目度): 2.3980064191633232
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Independence and Conditional Independence (CI) are two fundamental concepts
in probability and statistics, which can be applied to solve many central
problems of statistical inference. There are many existing independence and CI
measures defined from diverse principles and concepts. In this paper, the 16
independence measures and 16 CI measures were reviewed and then evaluated with
simulated and real data. For the independence measures, eight simulated data
were generating from normal distribution, normal and Archimedean copula
functions to compare the measures in bivariate or multivariate, linear or
nonlinear settings. Two UCI dataset, including the heart disease data and the
wine quality data, were used to test the power of the independence measures in
real conditions. For the CI measures, two simulated data with normal
distribution and Gumbel copula, and one real data (the Beijing air data) were
utilized to test the CI measures in prespecified linear or nonlinear setting
and real scenario. From the experimental results, we found that most of the
measures work well on the simulated data by presenting the right monotonicity
of the simulations. However, the independence and CI measures were
differentiated on much complex real data respectively and only a few can be
considered as working well with reference to domain knowledge. We also found
that the measures tend to be separated into groups based on the similarity of
the behaviors of them in each setting and in general. According to the
experiments, we recommend CE as a good choice for both independence and CI
measure. This is also due to its rigorous distribution-free definition and
consistent nonparametric estimator.
- Abstract(参考訳): 独立と条件独立(CI)は確率と統計の2つの基本的な概念であり、統計推論の多くの中心的な問題を解くために応用できる。
さまざまな原則や概念から定義された、多くの既存の独立とCI対策があります。
本稿では,16の独立対策と16のCI対策を検証し,シミュレーションおよび実データを用いて評価した。
独立度測定では、正規分布、正規分布、アルキメデスコプラ関数から8つのシミュレーションデータを生成し、二変量、多変量、線形あるいは非線形設定の測度を比較した。
心疾患データとワイン品質データを含む2つのUCIデータセットを用いて、実際の状態における独立対策のパワーを検証した。
CI測定では, 正規分布の2つのシミュレーションデータとGumbel copula, 1つの実データ(北京空気データ)を用いて, 所定の線形または非線形設定および実シナリオでCI測定を行った。
実験結果から,シミュレーションの正しい単調性を示すことにより,ほとんどの測定値がシミュレーションデータ上で良好に動作することがわかった。
しかしながら、独立性とCI対策は、非常に複雑な実データに対してそれぞれ差別化され、ドメイン知識を参照してうまく機能するものとして考慮できるのはごくわずかである。
また,各設定と一般の行動の類似性に基づいて,これらの尺度をグループに分ける傾向が認められた。
実験によると、CEは独立性とCIの指標の両方にとって良い選択であると推奨しています。
これはまた、厳密な分布自由の定義と一貫した非パラメトリック推定器による。
関連論文リスト
- Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - Conditional Feature Importance for Mixed Data [1.6114012813668934]
ノックオフサンプリングを用いた条件付き予測インパクト(CPI)フレームワークを開発した。
提案するワークフローは,I型エラーを制御し,高い出力を達成し,他の条件FI測定結果と一致していることを示す。
本研究は,混合データに対して,統計的に適切な,専門的な手法を開発することの必要性を強調した。
論文 参考訳(メタデータ) (2022-10-06T16:52:38Z) - Targeted Separation and Convergence with Kernel Discrepancies [61.973643031360254]
カーネルベースの不一致測度は、(i)ターゲットPを他の確率測度から分離するか、(ii)Pへの弱収束を制御する必要がある。
本稿では, (i) と (ii) を保証するのに十分な,必要な新しい条件を導出する。
可分距離空間上のMDDに対して、ボヒナー埋め込み可測度を分離するカーネルを特徴づけ、すべての測度を非有界カーネルと分離するための単純な条件を導入する。
論文 参考訳(メタデータ) (2022-09-26T16:41:16Z) - Conditional Independence Testing via Latent Representation Learning [2.566492438263125]
LCIT(Latent representation based Conditional Independence Test)は、表現学習に基づく条件付き独立テストのための新しい非パラメトリック手法である。
我々の主な貢献は、Z が与えられた X と Y の独立性をテストするための生成的枠組みの提案である。
論文 参考訳(メタデータ) (2022-09-04T07:16:03Z) - Non-Parametric Inference of Relational Dependence [17.76905154531867]
本研究では,関係系から引き出されたデータの独立性を推定する問題について検討する。
我々は,非観測データに対する関係独立性試験を運用するために,一貫した,非パラメトリックでスケーラブルなカーネルテストを提案する。
論文 参考訳(メタデータ) (2022-06-30T03:42:20Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Data-SUITE: Data-centric identification of in-distribution incongruous
examples [81.21462458089142]
Data-SUITEは、ID(In-distriion)データの不連続領域を特定するためのデータ中心のフレームワークである。
我々は,Data-SUITEの性能保証とカバレッジ保証を実証的に検証する。
論文 参考訳(メタデータ) (2022-02-17T18:58:31Z) - Ranking the information content of distance measures [61.754016309475745]
2つの異なる距離測度を用いて保持する相対的情報を評価する統計的テストを導入する。
これにより、候補者のプールから最も情報に富んだ距離を測定することができる。
論文 参考訳(メタデータ) (2021-04-30T15:57:57Z) - On Disentangled Representations Learned From Correlated Data [59.41587388303554]
相関データに対する最も顕著な絡み合うアプローチの挙動を解析することにより、現実のシナリオにギャップを埋める。
本研究では,データセットの体系的相関が学習され,潜在表現に反映されていることを示す。
また、トレーニング中の弱い監督や、少数のラベルで事前訓練されたモデルを修正することで、これらの潜伏相関を解消する方法を実証する。
論文 参考訳(メタデータ) (2020-06-14T12:47:34Z) - Independence Testing for Temporal Data [14.25244839642841]
根本的な問題は、2つの時系列が関連しているかどうかである。
既存のアプローチには、パラメトリックな仮定に依存するような制限があることが多い。
本稿では,時間的データ間の独立性をテストするブロック置換を用いた時間的依存統計法を提案する。
論文 参考訳(メタデータ) (2019-08-18T17:19:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。