論文の概要: Choosing DAG Models Using Markov and Minimal Edge Count in the Absence of Ground Truth
- arxiv url: http://arxiv.org/abs/2409.20187v1
- Date: Mon, 30 Sep 2024 11:03:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-02 13:07:12.712637
- Title: Choosing DAG Models Using Markov and Minimal Edge Count in the Absence of Ground Truth
- Title(参考訳): マルコフと最小エッジ数を用いたDAGモデルの選択
- Authors: Joseph D. Ramsey, Bryan Andrews, Peter Spirtes,
- Abstract要約: マルコフ条件の新しい非パラメトリック点整合統計テスト(マルコフチェッカー)を与える。
また,マルコフチェッカーテストに合格しないか,エッジ最小限でないDAGモデルに対して,Cross-Algorithm Frugality Search (CAFS)を導入する。
- 参考スコア(独自算出の注目度): 5.284425534494987
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We give a novel nonparametric pointwise consistent statistical test (the Markov Checker) of the Markov condition for directed acyclic graph (DAG) or completed partially directed acyclic graph (CPDAG) models given a dataset. We also introduce the Cross-Algorithm Frugality Search (CAFS) for rejecting DAG models that either do not pass the Markov Checker test or that are not edge minimal. Edge minimality has been used previously by Raskutti and Uhler as a nonparametric simplicity criterion, though CAFS readily generalizes to other simplicity conditions. Reference to the ground truth is not necessary for CAFS, so it is useful for finding causal structure learning algorithms and tuning parameter settings that output causal models that are approximately true from a given data set. We provide a software tool for this analysis that is suitable for even quite large or dense models, provided a suitably fast pointwise consistent test of conditional independence is available. In addition, we show in simulation that the CAFS procedure can pick approximately correct models without knowing the ground truth.
- Abstract(参考訳): 我々は、有向非巡回グラフ(DAG)モデルや、データセットを与えられた部分有向非巡回グラフ(CPDAG)モデルに対するマルコフ条件の新しい非パラメトリックな点整合統計テスト(マルコフチェッカー)を行う。
また,マルコフチェッカーテストに合格しないか,エッジ最小限でないDAGモデルに対して,Cross-Algorithm Frugality Search (CAFS)を導入する。
エッジ最小度は以前、Raskutti と Uhler によって非パラメトリックな単純度基準として用いられてきたが、CAFS は他の単純度条件に容易に一般化できる。
基底的真理への参照はCAFSには必要ないため、因果的構造学習アルゴリズムや、与えられたデータセットからほぼ真である因果的モデルを出力するチューニングパラメータ設定を見つけるのに有用である。
我々は、条件付き独立性の高速な一貫したテストが利用可能であれば、非常に大きなモデルや密度の高いモデルにも適する、この分析のためのソフトウェアツールを提供する。
さらに,CAFS法は基礎的事実を知らずにほぼ正しいモデルを選択することができることを示す。
関連論文リスト
- Semi-parametric Expert Bayesian Network Learning with Gaussian Processes
and Horseshoe Priors [26.530289799110562]
本稿では,エキスパートベイズネットワーク(SEBN)におけるセミパラメトリック・レラ・オンシップの学習モデルを提案する。
我々は、最小限の非リン耳成分を導入する前に、ガウスのプロシースとホースシューを使用する。
実世界の未知のデータセットでは、ユーザ入力に対応するために多様なグラフを作成し、識別可能性の問題に対処し、解釈可能性を高める。
論文 参考訳(メタデータ) (2024-01-29T18:57:45Z) - Correcting Model Misspecification via Generative Adversarial Networks [0.0]
ABC-GANは、GAN(Generative Adversarial Networks)とABC(Adroximate Bayesian Computation)を組み合わせた新しい生成モデリングパラダイムである。
ABC-GANモデルでは,前者の誤特定を補正するだけでなく,騒音条件下での先行モデルと同等以上の性能を示した。
論文 参考訳(メタデータ) (2023-04-07T18:20:38Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - A Simple Unified Approach to Testing High-Dimensional Conditional
Independences for Categorical and Ordinal Data [0.26651200086513094]
条件独立テスト(CI)は、因果推論におけるモデルテストと構造学習に多くのアプローチをとる。
分類データと順序データのための既存のCIテストは、条件変数によってサンプルを階層化し、各層で単純な独立テストを実行し、結果を組み合わせる。
本稿では,高次元における適切なキャリブレーションとパワーを維持するための,順序データと分類データに対する簡易な統合CIテストを提案する。
論文 参考訳(メタデータ) (2022-06-09T08:56:12Z) - SimT: Handling Open-set Noise for Domain Adaptive Semantic Segmentation [58.61946589036262]
本稿では,ブラックボックスモデルを用いて,擬似ラベル付きターゲットデータのみにアクセス可能な実用的なドメイン適応(DA)セマンティックセマンティックセマンティクス問題について検討する。
ドメインギャップと2つのドメイン間のラベルシフトのため、擬似ラベル付きターゲットデータには、クローズドセットとオープンセットのラベルノイズが混在している。
DAセマンティックセグメンテーションにおける混合雑音分布をモデル化し、SimTの推定として問題を定式化するための単純なノイズ遷移行列(SimT)を提案する。
論文 参考訳(メタデータ) (2022-03-29T02:48:08Z) - Stable and Compact Face Recognition via Unlabeled Data Driven Sparse
Representation-Based Classification [39.398339531136344]
ラベル付きデータ駆動逆プロジェクション擬フルスペース表現に基づく分類モデルを提案する。
提案モデルは,すべての利用可能なデータの隠された意味情報と本質的な構造情報をマイニングすることを目的としている。
3つの公開データセットの実験により、提案したLR-S-PFSRCモデルが安定した結果が得られることが示された。
論文 参考訳(メタデータ) (2021-11-04T13:19:38Z) - Evaluating State-of-the-Art Classification Models Against Bayes
Optimality [106.50867011164584]
正規化フローを用いて学習した生成モデルのベイズ誤差を正確に計算できることを示す。
われわれの手法を用いて、最先端の分類モデルについて徹底的な調査を行う。
論文 参考訳(メタデータ) (2021-06-07T06:21:20Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Least Squares Regression with Markovian Data: Fundamental Limits and
Algorithms [69.45237691598774]
マルコフ連鎖からデータポイントが依存しサンプリングされる最小二乗線形回帰問題について検討する。
この問題を$tau_mathsfmix$という観点から、鋭い情報理論のミニマックス下限を確立する。
本稿では,経験的リプレイに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-16T04:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。