論文の概要: Sufficient Identification Conditions and Semiparametric Estimation under
Missing Not at Random Mechanisms
- arxiv url: http://arxiv.org/abs/2306.06443v1
- Date: Sat, 10 Jun 2023 13:46:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-13 18:54:08.747242
- Title: Sufficient Identification Conditions and Semiparametric Estimation under
Missing Not at Random Mechanisms
- Title(参考訳): ランダムなメカニズムの欠如による十分同定条件と半パラメトリック推定
- Authors: Anna Guo, Jiwei Zhao, Razieh Nabi
- Abstract要約: 統計的に有効な分析を行うことは、MNARデータの存在において困難である。
従来のMNARモデルを2つの方法で一般化したMNARモデルを考える。
そこで本稿では,確率比をパラメータとして,そのようなモデルで符号化された独立性制約をテストする手法を提案する。
- 参考スコア(独自算出の注目度): 4.211128681972148
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conducting valid statistical analyses is challenging in the presence of
missing-not-at-random (MNAR) data, where the missingness mechanism is dependent
on the missing values themselves even conditioned on the observed data. Here,
we consider a MNAR model that generalizes several prior popular MNAR models in
two ways: first, it is less restrictive in terms of statistical independence
assumptions imposed on the underlying joint data distribution, and second, it
allows for all variables in the observed sample to have missing values. This
MNAR model corresponds to a so-called criss-cross structure considered in the
literature on graphical models of missing data that prevents nonparametric
identification of the entire missing data model. Nonetheless, part of the
complete-data distribution remains nonparametrically identifiable. By
exploiting this fact and considering a rich class of exponential family
distributions, we establish sufficient conditions for identification of the
complete-data distribution as well as the entire missingness mechanism. We then
propose methods for testing the independence restrictions encoded in such
models using odds ratio as our parameter of interest. We adopt two
semiparametric approaches for estimating the odds ratio parameter and establish
the corresponding asymptotic theories: one involves maximizing a conditional
likelihood with order statistics and the other uses estimating equations. The
utility of our methods is illustrated via simulation studies.
- Abstract(参考訳): 有効な統計解析を行うことは、行方不明データ(mnar)の存在下では困難であり、欠落メカニズムは観測データに依存しても欠落値自体に依存する。
ここでは、MNARモデルについて、2つの方法で一般化する。第1に、基礎となる結合データ分布に課される統計的独立性の仮定に関して、制限が小さく、第2に、観測されたサンプルのすべての変数が欠落する値を持つことができる。
このMNARモデルは、欠落したデータ全体の非パラメトリック識別を阻止する、欠落データのグラフィカルモデルに関する文献で考えられているいわゆるcriss-cross構造に対応する。
それでも、完全なデータ分布の一部は、非パラメータ的に識別可能である。
この事実を生かして、指数関数的家族分布の豊富なクラスを考えることで、全データ分布の同定と欠落機構全体の同定に十分な条件を確立する。
そこで我々は,確率比をパラメータとして,そのようなモデルで符号化された独立性制約をテストする手法を提案する。
我々は、オッズ比パラメータを推定し、対応する漸近理論を確立するための2つの半パラメトリックアプローチを採用する: 1つは、順序統計量で条件付き確率を最大化し、もう1つは方程式を推定する。
本手法の有用性はシミュレーション研究によって示される。
関連論文リスト
- Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Bayesian Networks for the robust and unbiased prediction of depression
and its symptoms utilizing speech and multimodal data [65.28160163774274]
我々は,抑うつ,抑うつ症状,および,胸腺で収集された音声,表情,認知ゲームデータから得られる特徴の関連性を把握するためにベイズ的枠組みを適用した。
論文 参考訳(メタデータ) (2022-11-09T14:48:13Z) - Mathematical Theory of Bayesian Statistics for Unknown Information
Source [0.0]
統計的推測では、不確実性は未知であり、全てのモデルが間違っている。
クロスバリデーション, 情報基準, 限界確率の一般的な特性を示す。
導出理論は、未知の不確実性が統計的モレルによって実現不可能であったり、後部分布が正規分布によって近似できないとしても成り立つ。
論文 参考訳(メタデータ) (2022-06-11T23:35:06Z) - Evaluating Aleatoric Uncertainty via Conditional Generative Models [15.494774321257939]
本研究では,アレータティック不確実性推定のための条件生成モデルについて検討する。
本稿では,2つの条件分布間の差を測定するための2つの指標を提案する。
我々は,我々の測定値が条件分布の相違を正確に測定する方法を数値的に示す。
論文 参考訳(メタデータ) (2022-06-09T05:39:04Z) - MissDAG: Causal Discovery in the Presence of Missing Data with
Continuous Additive Noise Models [78.72682320019737]
不完全な観測データから因果発見を行うため,MissDAGと呼ばれる一般的な手法を開発した。
MissDAGは、期待-最大化の枠組みの下で観測の可視部分の期待される可能性を最大化する。
各種因果探索アルゴリズムを組み込んだMissDAGの柔軟性について,広範囲なシミュレーションと実データ実験により検証した。
論文 参考訳(メタデータ) (2022-05-27T09:59:46Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Model-based Clustering with Missing Not At Random Data [0.8777702580252754]
我々は,MNARデータを含む,非常に一般的なタイプの欠落データを扱うために設計されたモデルベースのクラスタリングアルゴリズムを提案する。
いくつかのMNARモデルについて議論し、不足の原因は、欠落変数自体の値とクラスメンバーシップの両方に依存する。
MNARzと呼ばれる特定のMNARモデルに注目する。
論文 参考訳(メタデータ) (2021-12-20T09:52:12Z) - Variational Gibbs Inference for Statistical Model Estimation from
Incomplete Data [7.4250022679087495]
不完全データから統計モデルのパラメータを推定する新しい汎用手法である変分ギブス推論(VGI)を導入する。
不完全データからの変分オートエンコーダや正規化フローなどの重要な機械学習モデルを推定し、VGIを一連の合成および実世界の推定タスクで検証する。
論文 参考訳(メタデータ) (2021-11-25T17:22:22Z) - Identification of Probability weighted ARX models with arbitrary domains [75.91002178647165]
PieceWise Affineモデルは、ハイブリッドシステムの他のクラスに対する普遍近似、局所線型性、同値性を保証する。
本研究では,任意の領域を持つ固有入力モデル(NPWARX)を用いたPieceWise Auto Regressiveの同定に着目する。
このアーキテクチャは、機械学習の分野で開発されたMixture of Expertの概念に従って考案された。
論文 参考訳(メタデータ) (2020-09-29T12:50:33Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Uncertainty-Gated Stochastic Sequential Model for EHR Mortality
Prediction [6.170898159041278]
本稿では,欠落変数の分布を推定し,隠れ状態の更新を行い,院内死亡の可能性を予測できる新しい変動再帰ネットワークを提案する。
我々のモデルは、これらの手順を1つのストリームで実行し、エンドツーエンドで全てのネットワークパラメータを共同で学習できることは注目に値する。
論文 参考訳(メタデータ) (2020-03-02T04:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。