論文の概要: On semi-supervised estimation using exponential tilt mixture models
- arxiv url: http://arxiv.org/abs/2311.08504v1
- Date: Tue, 14 Nov 2023 19:53:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-16 18:30:11.785004
- Title: On semi-supervised estimation using exponential tilt mixture models
- Title(参考訳): 指数傾斜混合モデルを用いた半教師付き推定について
- Authors: Ye Tian, Xinwei Zhang and Zhiqiang Tan
- Abstract要約: バイナリ応答と予測器のラベル付きデータセットと、予測器のみのラベル付きデータセットによる半教師付き設定を考えてみましょう。
半教師付き推定のために,指数傾斜混合(ETM)モデルを用いた統計的アプローチのさらなる解析と理解を開発する。
- 参考スコア(独自算出の注目度): 12.347498345854715
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Consider a semi-supervised setting with a labeled dataset of binary responses
and predictors and an unlabeled dataset with only the predictors. Logistic
regression is equivalent to an exponential tilt model in the labeled
population. For semi-supervised estimation, we develop further analysis and
understanding of a statistical approach using exponential tilt mixture (ETM)
models and maximum nonparametric likelihood estimation, while allowing that the
class proportions may differ between the unlabeled and labeled data. We derive
asymptotic properties of ETM-based estimation and demonstrate improved
efficiency over supervised logistic regression in a random sampling setup and
an outcome-stratified sampling setup previously used. Moreover, we reconcile
such efficiency improvement with the existing semiparametric efficiency theory
when the class proportions in the unlabeled and labeled data are restricted to
be the same. We also provide a simulation study to numerically illustrate our
theoretical findings.
- Abstract(参考訳): バイナリ応答と予測器のラベル付きデータセットと、予測器のみのラベルなしデータセットによる半教師付き設定を考える。
ロジスティック回帰はラベル付き人口の指数的傾きモデルと等価である。
半教師付き推定において,指数傾斜混合モデル(ETM)と最大非パラメトリック推定を用いた統計的アプローチのさらなる分析と理解を行ない,ラベル付きデータとラベル付きデータの間にクラス比が異なることを可能にした。
我々は,etmに基づく推定の漸近的性質を導出し,ランダムサンプリング設定と結果階層サンプリング設定において教師付きロジスティック回帰よりも効率が向上することを示す。
さらに、ラベル付きおよびラベル付きデータのクラス比が同じに制限された場合、そのような効率改善を既存の半パラメトリック効率理論と照合する。
また,理論的な知見を数値的に示すためのシミュレーション研究も行う。
関連論文リスト
- Calibrating doubly-robust estimators with unbalanced treatment assignment [0.0]
本稿では、確率スコアモデリングのためのデータをアンサンプするDML推定器の簡単な拡張を提案する。
本論文は, 推定器が推定器の特性を保ち, 校正値が元の分布に一致することを示す理論的結果を提供する。
論文 参考訳(メタデータ) (2024-03-03T18:40:11Z) - A Provably Accurate Randomized Sampling Algorithm for Logistic Regression [2.7930955543692817]
本稿では,ロジスティック回帰問題に対する単純なランダム化サンプリングに基づくアルゴリズムを提案する。
正確な近似は、観測総数よりもはるかに小さい試料で達成できることを示す。
概して、ロジスティック回帰における推定確率を効率的に近似するためにランダム化サンプリング手法を用いる可能性に光を当てている。
論文 参考訳(メタデータ) (2024-02-26T06:20:28Z) - Efficient semi-supervised inference for logistic regression under
case-control studies [3.5485531932219243]
ラベル付きデータの結果がバイナリとなる半教師付き設定における推論問題を考える。
ケースコントロールサンプリングは、バイナリデータの不均衡構造を緩和するための効果的なサンプリング手法である。
ラベルのないデータが利用可能であれば、インターセプトパラメータを半教師付き学習設定で識別できることが分かる。
論文 参考訳(メタデータ) (2024-02-23T14:55:58Z) - Causal Effect Estimation from Observational and Interventional Data
Through Matrix Weighted Linear Estimators [11.384045395629123]
本研究では,観測データと介入データの混合から因果効果を推定する。
予測二乗誤差の統計的効率は推定器を組み合わせることで向上できることを示す。
論文 参考訳(メタデータ) (2023-06-09T16:16:53Z) - Statistical Efficiency of Score Matching: The View from Isoperimetry [96.65637602827942]
本研究では, スコアマッチングの統計的効率と推定される分布の等尺性との間に, 密接な関係を示す。
これらの結果はサンプル状態と有限状態の両方で定式化する。
論文 参考訳(メタデータ) (2022-10-03T06:09:01Z) - Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。
そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文 参考訳(メタデータ) (2021-08-25T21:30:27Z) - Statistical Inference for High-Dimensional Linear Regression with
Blockwise Missing Data [13.48481978963297]
ブロックワイドなデータは、異なるソースまたはモダリティが相補的な情報を含むマルチソースまたはマルチモダリティデータを統合するときに発生する。
本稿では,未偏差推定方程式に基づいて回帰係数ベクトルを計算効率良く推定する手法を提案する。
アルツハイマー病神経画像イニシアチブの数値的研究と応用分析により、提案手法は既存の方法よりも教師なしのサンプルからより優れた性能と利益を得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T05:12:42Z) - MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood
Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。
あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。
モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文 参考訳(メタデータ) (2021-06-03T12:59:16Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z) - Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。
正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。
カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文 参考訳(メタデータ) (2020-05-20T15:01:03Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。