論文の概要: Fast leave-one-cluster-out cross-validation by clustered Network Information Criteria (NICc)
- arxiv url: http://arxiv.org/abs/2405.20400v1
- Date: Thu, 30 May 2024 18:10:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-03 18:34:31.581943
- Title: Fast leave-one-cluster-out cross-validation by clustered Network Information Criteria (NICc)
- Title(参考訳): クラスタ化されたネットワーク情報量規準(NICc)による高速1クラスタアウトクロスバリデーション
- Authors: Jiaxing Qiu, Douglas E. Lake, Teague R. Henry,
- Abstract要約: 本稿では,ネットワーク情報量規準(NICc)のクラスタ化推定手法を提案する。
NICcは, クラスタアウトのずれを解消し, オーバーフィッティングを他の推定値よりも効果的に防止できることを示す。
- 参考スコア(独自算出の注目度): 0.351124620232225
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduced a clustered estimator of the Network Information Criterion (NICc) to approximate leave-one-cluster-out cross-validated deviance, which can be used as an alternative to cluster-based cross-validation when modeling clustered data. Stone proved that Akaike Information Criterion (AIC) is an asymptotic equivalence to leave-one-observation-out cross-validation if the parametric model is true. Ripley pointed out that the Network Information Criterion (NIC) derived in Stone's proof, is a better approximation to leave-one-observation-out cross-validation when the model is not true. For clustered data, we derived a clustered estimator of NIC, referred to as NICc, by substituting the Fisher information matrix in NIC with its estimator that adjusts for clustering. This adjustment imposes a larger penalty in NICc than the unclustered estimator of NIC when modeling clustered data, thereby preventing overfitting more effectively. In a simulation study and an empirical example, we used linear and logistic regression to model clustered data with Gaussian or binomial response, respectively. We showed that NICc is a better approximation to leave-one-cluster-out deviance and prevents overfitting more effectively than AIC and Bayesian Information Criterion (BIC). NICc leads to more accurate model selection, as determined by cluster-based cross-validation, compared to AIC and BIC.
- Abstract(参考訳): 本稿では,ネットワーク情報基準(NICc)のクラスタ化推定器を導入し,クラスタ化データのモデリングにおいて,クラスタベースのクロスバリデーションの代替として利用することができる。
ストーンは、Akaike Information Criterion (AIC) がパラメトリックモデルが真であれば、観測値から外すための漸近的等価性であることを証明した。
Ripley氏は、Stoneの証明から導かれたネットワーク情報基準(NIC)は、モデルが真実でない場合には、一対一で観測するクロスバリデーションを保留するよりよい近似であると指摘した。
クラスタ化データに対しては、NIC内のFisher情報行列をクラスタ化の調整を行う推定器に置換することにより、NICのクラスタ化推定器(NICc)を導出した。
この調整は、クラスタ化されたデータのモデリングにおいて、NICの非クラスタ化推定器よりもNICcのペナルティが大きいため、オーバーフィッティングを効果的に防止する。
シミュレーション実験と実験例では, それぞれガウス応答と二項応答のクラスタ化データをモデル化するために, 線形回帰とロジスティック回帰を用いた。
AICやベイズ情報基準 (BIC) よりも, NICc は, クラスタアウトのずれを解消し, オーバーフィッティングを効果的に防ぐことができることを示した。
NICcは、AICやBICと比較してクラスタベースのクロスバリデーションによって決定されるように、より正確なモデル選択をもたらす。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - ClusterQ: Semantic Feature Distribution Alignment for Data-Free
Quantization [111.12063632743013]
本稿では,ClusterQと呼ばれるデータフリーな量子化手法を提案する。
意味的特徴のクラス間分離性を高めるために,特徴分布統計をクラスタ化し,整列する。
また、クラス内分散を組み込んで、クラスワイドモードの崩壊を解決する。
論文 参考訳(メタデータ) (2022-04-30T06:58:56Z) - Adversarially-regularized mixed effects deep learning (ARMED) models for
improved interpretability, performance, and generalization on clustered data [0.974672460306765]
混合効果モデルは、クラスタ固有のランダム効果からクラスター不変、集団レベルの固定効果を分離する。
本稿では,既存ネットワークへの3つの非侵襲的な付加を通じて,Adversarially-Regularized Mixed Effects Deep Learning (ARMED)モデルを構築するための汎用フレームワークを提案する。
この枠組みを, シミュレーション, 認知症予後診断, 細胞顕微鏡などの4つの応用に適用し, DFNN, 畳み込みニューラルネットワーク, オートエンコーダに適用した。
論文 参考訳(メタデータ) (2022-02-23T20:58:22Z) - Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。
提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文 参考訳(メタデータ) (2022-02-01T19:25:31Z) - Mind Your Clever Neighbours: Unsupervised Person Re-identification via
Adaptive Clustering Relationship Modeling [19.532602887109668]
教師なし人物再識別(Re-ID)は、教師付きRe-IDモデルのスケーラビリティ問題を解決する可能性から注目されている。
既存の教師なし手法の多くは反復的なクラスタリング機構を採用しており、教師なしクラスタリングによって生成された擬似ラベルに基づいてネットワークを訓練している。
高品質な擬似ラベルを生成し,クラスタリングエラーの影響を軽減するために,教師なしのRe-IDのための新しいクラスタリング関係モデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-03T10:55:07Z) - Neural Mixture Models with Expectation-Maximization for End-to-end Deep
Clustering [0.8543753708890495]
本稿では,ニューラルネットワークを用いた混合モデルに基づくクラスタリングを実現する。
我々は,Eステップとして前方パス,Mステップとして後方パスを動作させるバッチワイズEMイテレーションにより,ネットワークのエンドツーエンドをトレーニングする。
トレーニングされたネットワークは、k-meansに依存した単一ステージのディープクラスタリング手法よりも優れています。
論文 参考訳(メタデータ) (2021-07-06T08:00:58Z) - Topology-based Clusterwise Regression for User Segmentation and Demand
Forecasting [63.78344280962136]
本研究は,パブリックおよび新規な商用データ集合を用いて,アナリストがユーザベースをクラスタリングし,詳細なレベルで需要を計画できることを示す。
本研究は,TDAに基づく時系列クラスタリングと行列因数分解法によるクラスタ回帰を実践者にとって実行可能なツールとして導入することを目的とする。
論文 参考訳(メタデータ) (2020-09-08T12:10:10Z) - Decorrelated Clustering with Data Selection Bias [55.91842043124102]
本稿では,データ選択バイアスを伴うクラスタリングのためのデコリレーション正規化K-Meansアルゴリズム(DCKM)を提案する。
DCKMアルゴリズムは,選択バイアスによって生じる予期せぬ特徴相関を除去する必要があることを示す。
論文 参考訳(メタデータ) (2020-06-29T08:55:50Z) - Robust M-Estimation Based Bayesian Cluster Enumeration for Real
Elliptically Symmetric Distributions [5.137336092866906]
データセットにおける最適なクラスタ数のロバストな決定は、広範囲のアプリケーションにおいて必須の要素である。
本稿では任意のReally Symmetric(RES)分散混合モデルで使用できるように一般化する。
サンプルサイズが有限であるデータセットに対して,ロバストな基準を導出するとともに,大規模なサンプルサイズでの計算コスト削減のための近似を提供する。
論文 参考訳(メタデータ) (2020-05-04T11:44:49Z) - Blocked Clusterwise Regression [0.0]
我々は、各ユニットが複数の潜伏変数を持つことを可能にすることで、離散的非観測的不均一性に対する以前のアプローチを一般化する。
我々は,クラスタの過剰な数のクラスタリングの理論に寄与し,この設定に対する新たな収束率を導出する。
論文 参考訳(メタデータ) (2020-01-29T23:29:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。