論文の概要: Bias-Reduced Estimation of Finite Mixtures: An Application to Latent Group Structures in Panel Data
- arxiv url: http://arxiv.org/abs/2601.20197v2
- Date: Tue, 03 Feb 2026 15:10:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 16:18:58.79831
- Title: Bias-Reduced Estimation of Finite Mixtures: An Application to Latent Group Structures in Panel Data
- Title(参考訳): Bias-Reduced Estimation of Finite Mixtures: An Application to Latent Group Structures in Panel Data (特集:バイオサイバネティックスとバイオサイバネティックス)
- Authors: Raphaël Langevin,
- Abstract要約: 本稿では, パラメトリック密度の有限混合の最大推定は, かなりの有限サンプルバイアスを負う可能性があることを示す。
偏見は、非有界または大きな支持を持つ成分密度における外れ値の影響から生じる。
分類混合確率関数の最大化は、標準最大推定値よりもバイアスが少ないパラメータ推定値が得られることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Finite mixture models are widely used in econometric analyses to capture unobserved heterogeneity. This paper shows that maximum likelihood estimation of finite mixtures of parametric densities can suffer from substantial finite-sample bias in all parameters under mild regularity conditions. The bias arises from the influence of outliers in component densities with unbounded or large support and increases with the degree of overlap among mixture components. I show that maximizing the classification-mixture likelihood function, equipped with a consistent classifier, yields parameter estimates that are less biased than those obtained by standard maximum likelihood estimation (MLE). I then derive the asymptotic distribution of the resulting estimator and provide conditions under which oracle efficiency is achieved. Monte Carlo simulations show that conventional mixture MLE exhibits pronounced finite-sample bias, which diminishes as the sample size or the statistical distance between component densities tends to infinity. The simulations further show that the proposed estimation strategy generally outperforms standard MLE in finite samples in terms of both bias and mean squared errors under relatively weak assumptions. An empirical application to latent group panel structures using health administrative data shows that the proposed approach reduces out-of-sample prediction error by approximately 17.6% relative to the best results obtained from standard MLE procedures.
- Abstract(参考訳): 有限混合モデルは、観測されていない不均一性を捉えるための計量分析に広く用いられている。
本稿では, パラメトリック密度の有限混合の最大推定は, 穏やかな規則性条件下での全てのパラメータにおいて有意な有限サンプルバイアスを負う可能性があることを示す。
このバイアスは、非有界または大きな支持を有する成分密度における外れ値の影響から生じ、混合成分間の重なり合いの程度で増大する。
一貫した分類器を備えた分類混合確率関数の最大化は、標準最大推定値(MLE)よりもバイアスが少ないパラメータ推定値が得られることを示す。
次に、得られた推定器の漸近分布を導出し、オラクル効率が達成される条件を提供する。
モンテカルロシミュレーションでは、従来の混合MLEは有限サンプルバイアスを示し、サンプルサイズや成分密度間の統計的距離が無限大になる傾向にある。
さらにシミュレーションにより,提案手法は,比較的弱い仮定下での偏差と平均二乗誤差の両面において,有限サンプルの標準MLEよりも高い性能を示すことが示された。
健康管理データを用いた潜在グループパネル構造への実証的適用により,提案手法は標準MLE法から得られた最良の結果と比較して,サンプル外予測誤差を約17.6%削減することを示した。
関連論文リスト
- Inference on covariance structure in high-dimensional multi-view data [8.549941732144035]
後続計算は、高価で脆いマルコフ連鎖モンテカルロサンプリングまたは変分近似によって行われる。
提案手法は,少なくとも1つの視点で有効である潜在因子を推定・調整するためにスペクトル分解を用いる。
正確な不確実性を含むシミュレーションにおいて優れた性能を示し、がん細胞サンプルのマルチオミクスデータセットから4つの高次元ビューを統合する手法を適用した。
論文 参考訳(メタデータ) (2025-09-02T19:20:42Z) - Method-of-Moments Inference for GLMs and Doubly Robust Functionals under Proportional Asymptotics [30.324051162373973]
高次元一般化線形モデル(GLM)における回帰係数と信号対雑音比の推定について考察する。
我々は、推論対象の一貫性と漸近的正規性(CAN)推定を導出する。
理論的結果を数値実験と既存文献との比較で補完する。
論文 参考訳(メタデータ) (2024-08-12T12:43:30Z) - Quantifying predictive uncertainty of aphasia severity in stroke patients with sparse heteroscedastic Bayesian high-dimensional regression [47.1405366895538]
高次元データに対する疎線型回帰法は、通常、残留物が一定の分散を持つと仮定するが、これは実際には破ることができる。
本稿では,ヘテロセダスティック分割経験的ベイズ期待条件最大化アルゴリズムを用いて,高次元ヘテロセダスティック線形回帰モデルを推定する。
論文 参考訳(メタデータ) (2023-09-15T22:06:29Z) - Rethinking Collaborative Metric Learning: Toward an Efficient
Alternative without Negative Sampling [156.7248383178991]
コラボレーティブ・メトリック・ラーニング(CML)パラダイムはレコメンデーション・システム(RS)分野に広く関心を集めている。
負のサンプリングが一般化誤差のバイアス付き推定に繋がることがわかった。
そこで我々は,SFCML (textitSampling-Free Collaborative Metric Learning) という名前のCMLに対して,負のサンプリングを伴わない効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-06-23T08:50:22Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Entropy Minimizing Matrix Factorization [102.26446204624885]
NMF(Nonnegative Matrix Factorization)は、広く使用されているデータ分析技術であり、多くの実際のタスクで印象的な結果をもたらしました。
本研究では,上述の問題に対処するために,EMMF (Entropy Minimizing Matrix Factorization framework) を開発した。
通常、外れ値が通常のサンプルよりもはるかに小さいことを考えると、行列分解のために新しいエントロピー損失関数が確立される。
論文 参考訳(メタデータ) (2021-03-24T21:08:43Z) - Consistent Estimation of Identifiable Nonparametric Mixture Models from
Grouped Observations [84.81435917024983]
この研究は、グループ化された観測から任意の同定可能な混合モデルを一貫して推定するアルゴリズムを提案する。
ペア化された観測のために実践的な実装が提供され、アプローチは既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-06-12T20:44:22Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。