論文の概要: Mixed Matrix Completion in Complex Survey Sampling under Heterogeneous
Missingness
- arxiv url: http://arxiv.org/abs/2402.03954v1
- Date: Tue, 6 Feb 2024 12:26:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 14:52:36.542404
- Title: Mixed Matrix Completion in Complex Survey Sampling under Heterogeneous
Missingness
- Title(参考訳): 不均一な欠損下での複合サーベイサンプリングにおける混合マトリックス補完
- Authors: Xiaojun Mao, Hengfang Wang, Zhonglei Wang and Shu Yang
- Abstract要約: サブ線形収束を実現する高速でスケーラブルな推定アルゴリズムを提案する。
本手法は,全国保健栄養検査調査データの分析に応用される。
- 参考スコア(独自算出の注目度): 6.278498348219109
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern surveys with large sample sizes and growing mixed-type questionnaires
require robust and scalable analysis methods. In this work, we consider
recovering a mixed dataframe matrix, obtained by complex survey sampling, with
entries following different canonical exponential distributions and subject to
heterogeneous missingness. To tackle this challenging task, we propose a
two-stage procedure: in the first stage, we model the entry-wise missing
mechanism by logistic regression, and in the second stage, we complete the
target parameter matrix by maximizing a weighted log-likelihood with a low-rank
constraint. We propose a fast and scalable estimation algorithm that achieves
sublinear convergence, and the upper bound for the estimation error of the
proposed method is rigorously derived. Experimental results support our
theoretical claims, and the proposed estimator shows its merits compared to
other existing methods. The proposed method is applied to analyze the National
Health and Nutrition Examination Survey data.
- Abstract(参考訳): 大規模なサンプルサイズと混合型アンケートが増加する現代の調査は、堅牢でスケーラブルな分析方法を必要とする。
本研究では,複素サーベイサンプリングにより得られた混合データフレーム行列の復元について検討する。
この課題に対処するため,第1段階ではロジスティック回帰によるエントリーワイド欠落機構をモデル化し,第2段階では低ランク制約による重み付き対数類似度を最大化して目標パラメータ行列を完成させる2段階の手順を提案する。
本稿では,サブリニア収束を実現する高速でスケーラブルな推定アルゴリズムを提案し,提案手法の推定誤差の上限を厳格に導出する。
実験により理論的主張が裏付けられ,提案手法は既存手法と比較して有効性を示す。
本手法は,全国保健栄養検査調査データの分析に応用される。
関連論文リスト
- Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Estimation of multiple mean vectors in high dimension [4.2466572124753]
我々は,独立標本に基づいて,共通空間上の様々な確率分布の多次元的手段を推定する。
我々のアプローチは、これらのサンプルから得られた経験的手段の凸結合による推定器の形成である。
論文 参考訳(メタデータ) (2024-03-22T08:42:41Z) - Doubly Robust Inference in Causal Latent Factor Models [12.116813197164047]
本稿では、多数の単位と結果を含む現代データ豊富な環境において、観測不能なコンファウンディングの下での平均処理効果を推定する新しい手法を提案する。
有限サンプル重み付けと保証を導出し、新しい推定器の誤差がパラメトリック速度で平均ゼロガウス分布に収束することを示す。
論文 参考訳(メタデータ) (2024-02-18T17:13:46Z) - Distributed Markov Chain Monte Carlo Sampling based on the Alternating
Direction Method of Multipliers [143.6249073384419]
本論文では,乗算器の交互方向法に基づく分散サンプリング手法を提案する。
我々は,アルゴリズムの収束に関する理論的保証と,その最先端性に関する実験的証拠の両方を提供する。
シミュレーションでは,線形回帰タスクとロジスティック回帰タスクにアルゴリズムを配置し,その高速収束を既存の勾配法と比較した。
論文 参考訳(メタデータ) (2024-01-29T02:08:40Z) - Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - A Generalized Latent Factor Model Approach to Mixed-data Matrix
Completion with Entrywise Consistency [3.299672391663527]
マトリックスコンプリート(Matrix completion)は、部分的に観察された行列における欠落したエントリの予測に関する機械学習手法のクラスである。
非線型因子モデルの一般族の下での低ランク行列推定問題として定式化する。
低ランク行列を推定するためのエントリーワイドな一貫した推定器を提案する。
論文 参考訳(メタデータ) (2022-11-17T00:24:47Z) - Vector-Valued Least-Squares Regression under Output Regularity
Assumptions [73.99064151691597]
最小二乗回帰問題を無限次元出力で解くために,還元ランク法を提案し,解析する。
提案手法の学習バウンダリを導出し、フルランク手法と比較して統計的性能の設定を改善する研究を行う。
論文 参考訳(メタデータ) (2022-11-16T15:07:00Z) - RIGID: Robust Linear Regression with Missing Data [7.638042073679073]
機能に欠落したエントリで線形回帰を行うための堅牢なフレームワークを提案する。
本稿では,変数間の依存性を自然に考慮した定式化が,凸プログラムに還元されることを示す。
詳細な分析に加えて,提案するフレームワークの挙動を分析し,技術的議論を行う。
論文 参考訳(メタデータ) (2022-05-26T21:10:17Z) - Learning Mixtures of Low-Rank Models [89.39877968115833]
低ランクモデルの計算混合を学習する問題について検討する。
ほぼ最適サンプルを用いて未知の行列を復元することが保証されるアルゴリズムを開発する。
さらに,提案アルゴリズムはランダムノイズに対して確実に安定である。
論文 参考訳(メタデータ) (2020-09-23T17:53:48Z) - Robust Matrix Completion with Mixed Data Types [0.0]
我々は,データ型が混在する部分的なエントリを持つ構造的低ランク行列を復元する問題を考察する。
ほとんどのアプローチは、基礎となる分布は1つしかないと仮定し、低階の制約は、行列 Satten Norm によって正則化される。
本稿では, 並列化に適したアルゴリズムフレームワークとともに, 高い回復保証を有する計算可能な統計手法を提案し, 混合データ型に対する部分的に観測されたエントリを持つ低階行列を1ステップで復元する。
論文 参考訳(メタデータ) (2020-05-25T21:35:10Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。