論文の概要: Inconsistency of cross-validation for structure learning in Gaussian
graphical models
- arxiv url: http://arxiv.org/abs/2312.17047v1
- Date: Thu, 28 Dec 2023 14:47:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 15:48:14.516671
- Title: Inconsistency of cross-validation for structure learning in Gaussian
graphical models
- Title(参考訳): ガウス図形モデルにおける構造学習のためのクロスバリデーションの不整合
- Authors: Zhao Lyu, Wai Ming Tai, Mladen Kolar, Bryon Aragam
- Abstract要約: ガウス図形モデルの構造を識別するクロスバリデーションは、挑戦的な試みである。
ノードの近傍に対するラッソ推定器が近傍を誤同定する確率に関する有限サンプル境界を提供する。
我々は、この不整合に関する実証的な調査を行い、その結果を他の一般的な情報基準と対比する。
- 参考スコア(独自算出の注目度): 20.332261273013913
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite numerous years of research into the merits and trade-offs of various
model selection criteria, obtaining robust results that elucidate the behavior
of cross-validation remains a challenging endeavor. In this paper, we highlight
the inherent limitations of cross-validation when employed to discern the
structure of a Gaussian graphical model. We provide finite-sample bounds on the
probability that the Lasso estimator for the neighborhood of a node within a
Gaussian graphical model, optimized using a prediction oracle, misidentifies
the neighborhood. Our results pertain to both undirected and directed acyclic
graphs, encompassing general, sparse covariance structures. To support our
theoretical findings, we conduct an empirical investigation of this
inconsistency by contrasting our outcomes with other commonly used information
criteria through an extensive simulation study. Given that many algorithms
designed to learn the structure of graphical models require hyperparameter
selection, the precise calibration of this hyperparameter is paramount for
accurately estimating the inherent structure. Consequently, our observations
shed light on this widely recognized practical challenge.
- Abstract(参考訳): 様々なモデル選択基準のメリットとトレードオフに関する長年の研究にもかかわらず、クロスバリデーションの振る舞いを解明する堅牢な結果を得ることは、依然として挑戦的な取り組みである。
本稿では,ガウス図形モデルの構造を識別する上で,クロスバリデーションの本質的限界を強調する。
予測オラクルを用いて最適化されたガウスのグラフィカルモデル内のノード近傍のlasso推定器が近傍を誤認する確率の有限個のサンプル境界を提供する。
結果は非有向非巡回グラフと有向非巡回グラフの両方に関係し,一般の疎共分散構造を包含する。
理論的な知見を裏付けるために,我々はこの不整合を実証的に調査し,その結果を他の一般的な情報基準と比較し,広範なシミュレーション研究を行った。
グラフィカルモデルの構造を学ぶために設計された多くのアルゴリズムはハイパーパラメータの選択を必要とするため、このハイパーパラメータの正確なキャリブレーションは固有構造を正確に推定するために最重要である。
その結果,この広く認識されている課題に光を当てた。
関連論文リスト
- Statistical ranking with dynamic covariates [6.729750785106628]
確率推定器 (MLE) を計算するための効率的な交互アルゴリズムを提案する。
馬の競馬やテニス競技を含む実世界のデータセットに提案したモデルの適用を実証するために,我々の理論的知見を裏付ける包括的数値的研究を行った。
論文 参考訳(メタデータ) (2024-06-24T10:26:05Z) - Generalized Criterion for Identifiability of Additive Noise Models Using Majorization [7.448620208767376]
本稿では,有向非巡回グラフ(DAG)モデルに対する新しい識別可能性基準を提案する。
この基準が既存の識別可能性基準を拡張し、一般化することを実証する。
本稿では,変数のトポロジ的順序付けを学習するための新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-08T02:18:57Z) - A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。
オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文 参考訳(メタデータ) (2023-11-13T01:48:08Z) - Semi-Supervised Clustering of Sparse Graphs: Crossing the
Information-Theoretic Threshold [3.6052935394000234]
ブロックモデルは、ネットワーク構造データのクラスタリングとコミュニティ検出のための標準ランダムグラフモデルである。
ネットワークトポロジに基づく推定器は、モデルパラメータが一定の閾値以下である場合、スパースグラフの確率よりも大幅に向上する。
パラメータ領域全体でラベルの任意の部分で実現可能であることを示す。
論文 参考訳(メタデータ) (2022-05-24T00:03:25Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - Crime Prediction with Graph Neural Networks and Multivariate Normal
Distributions [18.640610803366876]
グラフ畳み込みネットワーク(GCN)のフレキシブルな構造を利用して,高分解能領域における疎結合問題に取り組む。
グラフ畳み込みGated Recurrent Units (Graph-ConvGRU) を用いてモデルを構築し,空間的・時間的・カテゴリー的関係を学習する。
モデルが生成性だけでなく,正確性も示しています。
論文 参考訳(メタデータ) (2021-11-29T17:37:01Z) - Partial Counterfactual Identification from Observational and
Experimental Data [83.798237968683]
観測データと実験データの任意の組み合わせから最適境界を近似する有効なモンテカルロアルゴリズムを開発した。
我々のアルゴリズムは、合成および実世界のデータセットに基づいて広範囲に検証されている。
論文 参考訳(メタデータ) (2021-10-12T02:21:30Z) - Identification of Latent Variables From Graphical Model Residuals [0.0]
本稿では,推定モデルの残差から遅延空間のプロキシを反復的に導出することにより,DAGを推定する際に潜伏空間を制御する新しい手法を提案する。
結果の予測の改善は本質的にカプセル化されており,既成モデルと比較して一定の限界を超えないことを示す。
論文 参考訳(メタデータ) (2021-01-07T02:28:49Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。