論文の概要: Blocked Clusterwise Regression
- arxiv url: http://arxiv.org/abs/2001.11130v1
- Date: Wed, 29 Jan 2020 23:29:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 21:40:07.525946
- Title: Blocked Clusterwise Regression
- Title(参考訳): クラスタリグレッションのブロック
- Authors: Max Cytrynbaum
- Abstract要約: 我々は、各ユニットが複数の潜伏変数を持つことを可能にすることで、離散的非観測的不均一性に対する以前のアプローチを一般化する。
我々は,クラスタの過剰な数のクラスタリングの理論に寄与し,この設定に対する新たな収束率を導出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A recent literature in econometrics models unobserved cross-sectional
heterogeneity in panel data by assigning each cross-sectional unit a
one-dimensional, discrete latent type. Such models have been shown to allow
estimation and inference by regression clustering methods. This paper is
motivated by the finding that the clustered heterogeneity models studied in
this literature can be badly misspecified, even when the panel has significant
discrete cross-sectional structure. To address this issue, we generalize
previous approaches to discrete unobserved heterogeneity by allowing each unit
to have multiple, imperfectly-correlated latent variables that describe its
response-type to different covariates. We give inference results for a k-means
style estimator of our model and develop information criteria to jointly select
the number clusters for each latent variable. Monte Carlo simulations confirm
our theoretical results and give intuition about the finite-sample performance
of estimation and model selection. We also contribute to the theory of
clustering with an over-specified number of clusters and derive new convergence
rates for this setting. Our results suggest that over-fitting can be severe in
k-means style estimators when the number of clusters is over-specified.
- Abstract(参考訳): econometricsの最近の文献では、各断面単位を1次元の離散的潜在型に割り当てることで、パネルデータの観察できない横断的不均一性をモデル化している。
このようなモデルは回帰クラスタリング法による推定と推測を可能にすることが示されている。
本論文は,パネルが有意な離散断面構造を有する場合であっても,本論文で研究したクラスター状不均一性モデルが著しく不明確であることを示す。
この問題に対処するために、各ユニットが異なる共変量に対する応答型を記述する複数の不完全関連潜伏変数を持つことで、離散的不均一性に対する従来のアプローチを一般化する。
モデルのk-meansスタイル推定器の推論結果を提示し,各潜在変数の数値クラスタを共同で選択するための情報基準を策定する。
モンテカルロシミュレーションは理論結果を確認し,推定とモデル選択の有限サンプル性能について直観的に述べる。
また,クラスタ数を過大に指定したクラスタリング理論に寄与し,この設定に対して新たな収束率を導出する。
以上の結果から,クラスタ数が過剰に特定された場合,k平均型推定器では過度に適合する可能性が示唆された。
関連論文リスト
- Counterfactual Explanations for k-means and Gaussian Clustering [1.8561812622368767]
本稿では、妥当性と実現可能性の制約を含むモデルベースのクラスタリングに対する反事実の一般的な定義について述べる。
提案手法は, 現実性, 対象クラスタ, 動作可能な, 不変な特徴を示す2値マスク, クラスタ境界からどの程度の距離を指定すべきかを示す可視性係数を入力として行う。
論文 参考訳(メタデータ) (2025-01-17T14:56:20Z) - Finite Mixtures of Multivariate Poisson-Log Normal Factor Analyzers for
Clustering Count Data [0.8499685241219366]
因子分析モデルの混合に基づく8種類の擬似混合モデルについて紹介する。
提案モデルはRNAシークエンシング研究から得られた離散的なデータをクラスタリングする文脈において探索される。
論文 参考訳(メタデータ) (2023-11-13T21:23:15Z) - Revisiting Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [69.15976031704687]
IAC (Instance-Adaptive Clustering, インスタンス適応クラスタリング) を提案する。
IACは$ MathcalO(n, textpolylog(n) $の計算複雑性を維持しており、大規模問題に対してスケーラブルで実用的なものである。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - High-dimensional variable clustering based on maxima of a weakly dependent random process [1.1999555634662633]
本稿では,Asymptotic Independent Block (AI-block)モデルと呼ばれる,変数クラスタリングのための新しいモデルのクラスを提案する。
このモデルのクラスは特定可能であり、つまり、分割の間に部分的な順序を持つ極大要素が存在し、統計的推測が可能であることを意味する。
また,変数のクラスタを列挙するチューニングパラメータに依存するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-02T08:24:26Z) - clusterBMA: Bayesian model averaging for clustering [1.2021605201770345]
本稿では、教師なしクラスタリングアルゴリズムの結果の重み付きモデル平均化を可能にするクラスタBMAを提案する。
クラスタリング内部検証基準を用いて、各モデルの結果の重み付けに使用される後続モデル確率の近似を開発する。
シミュレーションデータ上での他のアンサンブルクラスタリングメソッドのパフォーマンスに加えて、クラスタBMAは平均クラスタへの確率的アロケーションを含むユニークな機能を提供する。
論文 参考訳(メタデータ) (2022-09-09T04:55:20Z) - Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。
提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文 参考訳(メタデータ) (2022-02-01T19:25:31Z) - Multi-objective Semi-supervised Clustering for Finding Predictive
Clusters [0.5371337604556311]
本研究は,クラスタリング問題に焦点をあて,結果変数に有意なコンパクトクラスタを見つけることを目的とする。
主な目標は、各クラスタでの観測が類似し、結果変数をこれらのクラスタを使用して同時に予測できるように、データポイントをパーティショニングすることである。
論文 参考訳(メタデータ) (2022-01-26T06:24:38Z) - Local versions of sum-of-norms clustering [77.34726150561087]
本手法はボールモデルにおいて任意に閉じた球を分離できることを示す。
我々は、不連結連結集合のクラスタリングで発生する誤差に定量的な有界性を証明した。
論文 参考訳(メタデータ) (2021-09-20T14:45:29Z) - Correlation Clustering Reconstruction in Semi-Adversarial Models [70.11015369368272]
相関クラスタリングは多くのアプリケーションにおいて重要なクラスタリング問題である。
本研究では,ランダムノイズや対向的な修正によって崩壊した潜伏クラスタリングを再構築しようとする,この問題の再構築版について検討する。
論文 参考訳(メタデータ) (2021-08-10T14:46:17Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Learning from Aggregate Observations [82.44304647051243]
本研究では,一組のインスタンスに監視信号が与えられる集合観察から学習する問題について検討する。
本稿では,多種多様な集合観測に適合する一般的な確率的枠組みを提案する。
単純な極大解は様々な微分可能なモデルに適用できる。
論文 参考訳(メタデータ) (2020-04-14T06:18:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。