論文の概要: Fast leave-one-cluster-out cross-validation using clustered Network Information Criterion (NICc)
- arxiv url: http://arxiv.org/abs/2405.20400v2
- Date: Wed, 09 Oct 2024 18:24:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-11 14:28:59.997945
- Title: Fast leave-one-cluster-out cross-validation using clustered Network Information Criterion (NICc)
- Title(参考訳): クラスタ化されたネットワーク情報量規準(NICc)を用いた高速1クラスタアウトクロスバリデーション
- Authors: Jiaxing Qiu, Douglas E. Lake, Pavel Chernyavskiy, Teague R. Henry,
- Abstract要約: クラスタベースのバリデーションを使用して、目に見えないクラスタ上でのモデルの一般化性を評価することが重要です。
本稿では,ネットワーク情報量基準(NICc)のクラスタ化推定手法を提案する。
- 参考スコア(独自算出の注目度): 0.32141666878560626
- License:
- Abstract: For prediction models developed on clustered data that do not account for cluster heterogeneity in model parameterization, it is crucial to use cluster-based validation to assess model generalizability on unseen clusters. This paper introduces a clustered estimator of the Network Information Criterion (NICc) to approximate leave-one-cluster-out deviance for standard prediction models with twice differentiable log-likelihood functions. The NICc serves as a fast alternative to cluster-based cross-validation. Stone (1977) proved that the Akaike Information Criterion (AIC) is asymptotically equivalent to leave-one-observation-out cross-validation for true parametric models with independent and identically distributed observations. Ripley (1996) noted that the Network Information Criterion (NIC), derived from Stone's proof, is a better approximation when the model is misspecified. For clustered data, we derived NICc by substituting the Fisher information matrix in the NIC with a clustering-adjusted estimator. The NICc imposes a greater penalty when the data exhibits stronger clustering, thereby allowing the NICc to better prevent over-parameterization. In a simulation study and an empirical example, we used standard regression to develop prediction models for clustered data with Gaussian or binomial responses. Compared to the commonly used AIC and BIC for standard regression, NICc provides a much more accurate approximation to leave-one-cluster-out deviance and results in more accurate model size and variable selection, as determined by cluster-based cross-validation, especially when the data exhibit strong clustering.
- Abstract(参考訳): モデルパラメータ化におけるクラスタの不均一性を考慮しないクラスタデータに基づいて開発された予測モデルでは,クラスタベースの検証を用いて,未知のクラスタ上でのモデル一般化可能性を評価することが重要である。
本稿では,ネットワーク情報量規準(NICc)のクラスタ化推定手法を提案する。
NICcはクラスタベースのクロスバリデーションの高速な代替手段として機能する。
Stone (1977) は、Akaike Information Criterion (AIC) は独立かつ同一に分布した観測値を持つ真のパラメトリックモデルに対して、漸近的に観測不能なクロスバリデーションと等価であることを示した。
Ripley (1996) は、Stone の証明から導かれた Network Information Criterion (NIC) が、モデルが誤って特定されたときにより良い近似となることを指摘した。
クラスタ化データに対しては、クラスタリング調整推定器を用いてNIC内のフィッシャー情報行列を置換することによりNICcを導出する。
NICcは、データがより強力なクラスタリングを示すときにより大きなペナルティを課し、NICcが過度なパラメータ化を防止できる。
シミュレーション研究および実証的な例では、標準回帰を用いてガウスあるいは二項応答を持つクラスタデータに対する予測モデルを開発した。
標準回帰においてよく使われるAICやBICと比較して、NICcは、クラスタベースのクロスバリデーションによって決定され、特にデータが強いクラスタリングを示す場合、より正確なモデルサイズと変数選択をもたらす。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - ClusterQ: Semantic Feature Distribution Alignment for Data-Free
Quantization [111.12063632743013]
本稿では,ClusterQと呼ばれるデータフリーな量子化手法を提案する。
意味的特徴のクラス間分離性を高めるために,特徴分布統計をクラスタ化し,整列する。
また、クラス内分散を組み込んで、クラスワイドモードの崩壊を解決する。
論文 参考訳(メタデータ) (2022-04-30T06:58:56Z) - Adversarially-regularized mixed effects deep learning (ARMED) models for
improved interpretability, performance, and generalization on clustered data [0.974672460306765]
混合効果モデルは、クラスタ固有のランダム効果からクラスター不変、集団レベルの固定効果を分離する。
本稿では,既存ネットワークへの3つの非侵襲的な付加を通じて,Adversarially-Regularized Mixed Effects Deep Learning (ARMED)モデルを構築するための汎用フレームワークを提案する。
この枠組みを, シミュレーション, 認知症予後診断, 細胞顕微鏡などの4つの応用に適用し, DFNN, 畳み込みニューラルネットワーク, オートエンコーダに適用した。
論文 参考訳(メタデータ) (2022-02-23T20:58:22Z) - Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。
提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文 参考訳(メタデータ) (2022-02-01T19:25:31Z) - Mind Your Clever Neighbours: Unsupervised Person Re-identification via
Adaptive Clustering Relationship Modeling [19.532602887109668]
教師なし人物再識別(Re-ID)は、教師付きRe-IDモデルのスケーラビリティ問題を解決する可能性から注目されている。
既存の教師なし手法の多くは反復的なクラスタリング機構を採用しており、教師なしクラスタリングによって生成された擬似ラベルに基づいてネットワークを訓練している。
高品質な擬似ラベルを生成し,クラスタリングエラーの影響を軽減するために,教師なしのRe-IDのための新しいクラスタリング関係モデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-03T10:55:07Z) - Neural Mixture Models with Expectation-Maximization for End-to-end Deep
Clustering [0.8543753708890495]
本稿では,ニューラルネットワークを用いた混合モデルに基づくクラスタリングを実現する。
我々は,Eステップとして前方パス,Mステップとして後方パスを動作させるバッチワイズEMイテレーションにより,ネットワークのエンドツーエンドをトレーニングする。
トレーニングされたネットワークは、k-meansに依存した単一ステージのディープクラスタリング手法よりも優れています。
論文 参考訳(メタデータ) (2021-07-06T08:00:58Z) - Topology-based Clusterwise Regression for User Segmentation and Demand
Forecasting [63.78344280962136]
本研究は,パブリックおよび新規な商用データ集合を用いて,アナリストがユーザベースをクラスタリングし,詳細なレベルで需要を計画できることを示す。
本研究は,TDAに基づく時系列クラスタリングと行列因数分解法によるクラスタ回帰を実践者にとって実行可能なツールとして導入することを目的とする。
論文 参考訳(メタデータ) (2020-09-08T12:10:10Z) - Decorrelated Clustering with Data Selection Bias [55.91842043124102]
本稿では,データ選択バイアスを伴うクラスタリングのためのデコリレーション正規化K-Meansアルゴリズム(DCKM)を提案する。
DCKMアルゴリズムは,選択バイアスによって生じる予期せぬ特徴相関を除去する必要があることを示す。
論文 参考訳(メタデータ) (2020-06-29T08:55:50Z) - Robust M-Estimation Based Bayesian Cluster Enumeration for Real
Elliptically Symmetric Distributions [5.137336092866906]
データセットにおける最適なクラスタ数のロバストな決定は、広範囲のアプリケーションにおいて必須の要素である。
本稿では任意のReally Symmetric(RES)分散混合モデルで使用できるように一般化する。
サンプルサイズが有限であるデータセットに対して,ロバストな基準を導出するとともに,大規模なサンプルサイズでの計算コスト削減のための近似を提供する。
論文 参考訳(メタデータ) (2020-05-04T11:44:49Z) - Blocked Clusterwise Regression [0.0]
我々は、各ユニットが複数の潜伏変数を持つことを可能にすることで、離散的非観測的不均一性に対する以前のアプローチを一般化する。
我々は,クラスタの過剰な数のクラスタリングの理論に寄与し,この設定に対する新たな収束率を導出する。
論文 参考訳(メタデータ) (2020-01-29T23:29:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。