論文の概要: Mixed Matrix Completion in Complex Survey Sampling under Heterogeneous
Missingness
- arxiv url: http://arxiv.org/abs/2402.03954v1
- Date: Tue, 6 Feb 2024 12:26:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 14:52:36.542404
- Title: Mixed Matrix Completion in Complex Survey Sampling under Heterogeneous
Missingness
- Title(参考訳): 不均一な欠損下での複合サーベイサンプリングにおける混合マトリックス補完
- Authors: Xiaojun Mao, Hengfang Wang, Zhonglei Wang and Shu Yang
- Abstract要約: サブ線形収束を実現する高速でスケーラブルな推定アルゴリズムを提案する。
本手法は,全国保健栄養検査調査データの分析に応用される。
- 参考スコア(独自算出の注目度): 6.278498348219109
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern surveys with large sample sizes and growing mixed-type questionnaires
require robust and scalable analysis methods. In this work, we consider
recovering a mixed dataframe matrix, obtained by complex survey sampling, with
entries following different canonical exponential distributions and subject to
heterogeneous missingness. To tackle this challenging task, we propose a
two-stage procedure: in the first stage, we model the entry-wise missing
mechanism by logistic regression, and in the second stage, we complete the
target parameter matrix by maximizing a weighted log-likelihood with a low-rank
constraint. We propose a fast and scalable estimation algorithm that achieves
sublinear convergence, and the upper bound for the estimation error of the
proposed method is rigorously derived. Experimental results support our
theoretical claims, and the proposed estimator shows its merits compared to
other existing methods. The proposed method is applied to analyze the National
Health and Nutrition Examination Survey data.
- Abstract(参考訳): 大規模なサンプルサイズと混合型アンケートが増加する現代の調査は、堅牢でスケーラブルな分析方法を必要とする。
本研究では,複素サーベイサンプリングにより得られた混合データフレーム行列の復元について検討する。
この課題に対処するため,第1段階ではロジスティック回帰によるエントリーワイド欠落機構をモデル化し,第2段階では低ランク制約による重み付き対数類似度を最大化して目標パラメータ行列を完成させる2段階の手順を提案する。
本稿では,サブリニア収束を実現する高速でスケーラブルな推定アルゴリズムを提案し,提案手法の推定誤差の上限を厳格に導出する。
実験により理論的主張が裏付けられ,提案手法は既存手法と比較して有効性を示す。
本手法は,全国保健栄養検査調査データの分析に応用される。
関連論文リスト
- Doubly Robust Inference in Causal Latent Factor Models [13.236747951976675]
本稿では,観測不能な条件下での平均処理効果を推定するための新しいフレームワークを紹介する。
有限サンプルおよび頑健な重み付け保証を導出し、新しい推定器の誤差がパラメトリック速度で平均ゼロガウス分布に収束することを示す。
論文 参考訳(メタデータ) (2024-02-18T17:13:46Z) - Distributed Markov Chain Monte Carlo Sampling based on the Alternating
Direction Method of Multipliers [143.6249073384419]
本論文では,乗算器の交互方向法に基づく分散サンプリング手法を提案する。
我々は,アルゴリズムの収束に関する理論的保証と,その最先端性に関する実験的証拠の両方を提供する。
シミュレーションでは,線形回帰タスクとロジスティック回帰タスクにアルゴリズムを配置し,その高速収束を既存の勾配法と比較した。
論文 参考訳(メタデータ) (2024-01-29T02:08:40Z) - A Generalized Latent Factor Model Approach to Mixed-data Matrix
Completion with Entrywise Consistency [3.299672391663527]
マトリックスコンプリート(Matrix completion)は、部分的に観察された行列における欠落したエントリの予測に関する機械学習手法のクラスである。
非線型因子モデルの一般族の下での低ランク行列推定問題として定式化する。
低ランク行列を推定するためのエントリーワイドな一貫した推定器を提案する。
論文 参考訳(メタデータ) (2022-11-17T00:24:47Z) - Vector-Valued Least-Squares Regression under Output Regularity
Assumptions [73.99064151691597]
最小二乗回帰問題を無限次元出力で解くために,還元ランク法を提案し,解析する。
提案手法の学習バウンダリを導出し、フルランク手法と比較して統計的性能の設定を改善する研究を行う。
論文 参考訳(メタデータ) (2022-11-16T15:07:00Z) - RIGID: Robust Linear Regression with Missing Data [7.638042073679073]
機能に欠落したエントリで線形回帰を行うための堅牢なフレームワークを提案する。
本稿では,変数間の依存性を自然に考慮した定式化が,凸プログラムに還元されることを示す。
詳細な分析に加えて,提案するフレームワークの挙動を分析し,技術的議論を行う。
論文 参考訳(メタデータ) (2022-05-26T21:10:17Z) - Random Forest Weighted Local Fr\'echet Regression with Random Objects [52.25304029942005]
本稿では,新しいランダム森林重み付き局所Fr'echet回帰パラダイムを提案する。
最初の方法は,これらの重みを局所平均として利用し,条件付きFr'echet平均を解く。
第二の手法は局所線形Fr'echet回帰を行い、どちらも既存のFr'echet回帰法を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-10T09:10:59Z) - Heterogeneous Tensor Mixture Models in High Dimensions [5.656785831541303]
我々は,不均質な共分散を持つ柔軟高次元テンソル混合モデルを導入する問題を考える。
本手法は,実パラメータの統計的近傍に幾何学的に収束することを示す。
自閉症スペクトラム障害の診断に重要な脳領域を明らかにする。
論文 参考訳(メタデータ) (2021-04-15T21:06:16Z) - Learning Mixtures of Low-Rank Models [89.39877968115833]
低ランクモデルの計算混合を学習する問題について検討する。
ほぼ最適サンプルを用いて未知の行列を復元することが保証されるアルゴリズムを開発する。
さらに,提案アルゴリズムはランダムノイズに対して確実に安定である。
論文 参考訳(メタデータ) (2020-09-23T17:53:48Z) - Robust Matrix Completion with Mixed Data Types [0.0]
我々は,データ型が混在する部分的なエントリを持つ構造的低ランク行列を復元する問題を考察する。
ほとんどのアプローチは、基礎となる分布は1つしかないと仮定し、低階の制約は、行列 Satten Norm によって正則化される。
本稿では, 並列化に適したアルゴリズムフレームワークとともに, 高い回復保証を有する計算可能な統計手法を提案し, 混合データ型に対する部分的に観測されたエントリを持つ低階行列を1ステップで復元する。
論文 参考訳(メタデータ) (2020-05-25T21:35:10Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z) - The Simulator: Understanding Adaptive Sampling in the
Moderate-Confidence Regime [52.38455827779212]
エミュレータと呼ばれる適応サンプリングを解析するための新しい手法を提案する。
適切なログファクタを組み込んだトップk問題の最初のインスタンスベースの下位境界を証明します。
我々の新しい分析は、後者の問題に対するこの種の最初のエミュレータであるベストアームとトップkの識別に、シンプルでほぼ最適であることを示した。
論文 参考訳(メタデータ) (2017-02-16T23:42:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。