論文の概要: A Complete Characterisation of Structured Missingness
- arxiv url: http://arxiv.org/abs/2307.02650v1
- Date: Wed, 5 Jul 2023 20:53:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-07 15:52:36.200599
- Title: A Complete Characterisation of Structured Missingness
- Title(参考訳): 構造的欠損の完全な特徴化
- Authors: James Jackson, Robin Mitra, Niels Hagenbuch, Sarah McGough, Chris
Harbron
- Abstract要約: 構造的欠失(Structured Missingness、SM)は、欠失が基盤となる構造を持つ場所である。
SMの分類を導入し、各$M_j$は$mathbfM_-j$に依存することができる。
シミュレーションを通して、SMが推測と予測に与える影響を実証し、SMの文脈的事例を考察する。
- 参考スコア(独自算出の注目度): 1.2669530824264632
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Our capacity to process large complex data sources is ever-increasing,
providing us with new, important applied research questions to address, such as
how to handle missing values in large-scale databases. Mitra et al. (2023)
noted the phenomenon of Structured Missingness (SM), which is where missingness
has an underlying structure. Existing taxonomies for defining missingness
mechanisms typically assume that variables' missingness indicator vectors
$M_1$, $M_2$, ..., $M_p$ are independent after conditioning on the relevant
portion of the data matrix $\mathbf{X}$. As this is often unsuitable for
characterising SM in multivariate settings, we introduce a taxonomy for SM,
where each ${M}_j$ can depend on $\mathbf{M}_{-j}$ (i.e., all missingness
indicator vectors except ${M}_j$), in addition to $\mathbf{X}$. We embed this
new framework within the well-established decomposition of mechanisms into
MCAR, MAR, and MNAR (Rubin, 1976), allowing us to recast mechanisms into a
broader setting, where we can consider the combined effect of $\mathbf{X}$ and
$\mathbf{M}_{-j}$ on ${M}_j$. We also demonstrate, via simulations, the impact
of SM on inference and prediction, and consider contextual instances of SM
arising in a de-identified nationwide (US-based) clinico-genomic database
(CGDB). We hope to stimulate interest in SM, and encourage timely research into
this phenomenon.
- Abstract(参考訳): 巨大な複雑なデータソースを処理する能力はますます増加しており、大規模データベースで欠落した値を扱う方法など、対処すべき、新たな重要な研究課題を提供します。
Mitra et al. (2023) は、欠損が基盤となる構造を持つ構造的欠損(SM)現象を指摘した。
既存の欠落機構を定義する分類法は、変数の欠落指示ベクトル $M_1$, $M_2$, ..., $M_p$ がデータ行列 $\mathbf{X}$ の関連部分を条件付けした後独立であると仮定する。
これは多変量設定でSMを特徴づけるのには不適当であるので、各${M}_j$は$\mathbf{M}_{-j}$(つまり、${M}_j$以外のすべての欠落指標ベクトル)に加えて$\mathbf{X}$に依存することができるSMの分類を導入します。
この新たなフレームワークは、mcar、mar、mnar(rubin、1976)によく確立された分解に組み込まれており、メカニズムをより広い設定に再キャストすることができ、$\mathbf{x}$ と $\mathbf{m}_{-j}$ on ${m}_j$ の組み合わせ効果を考えることができる。
また、シミュレーションを通じて、SMが推測と予測に与える影響を実証し、非特定全国(米国)臨床ゲノムデータベース(CGDB)におけるSMの文脈的事例を考察した。
我々はSMへの関心を刺激し、この現象をタイムリーに研究することを望んでいる。
関連論文リスト
- Optimal level set estimation for non-parametric tournament and crowdsourcing problems [49.75262185577198]
クラウドソーシングによって動機づけられた我々は、$d$の質問に対する$n$の専門家の回答の正しさを部分的に観察する問題を考える。
本稿では、専門家$i$が疑問に答える確率を含む行列$M$が、行と列の置換までの双等方性であることを仮定する。
我々は,この分類問題に対して最小限のアルゴリズムを最適に構築する。
論文 参考訳(メタデータ) (2024-08-27T18:28:31Z) - Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - Improved Algorithm for Adversarial Linear Mixture MDPs with Bandit
Feedback and Unknown Transition [71.33787410075577]
線形関数近似,未知遷移,および逆損失を用いた強化学習について検討した。
我々は高い確率で$widetildeO(dsqrtHS3K + sqrtHSAK)$ regretを実現する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-07T15:03:50Z) - Effective Minkowski Dimension of Deep Nonparametric Regression: Function
Approximation and Statistical Theories [70.90012822736988]
ディープ非パラメトリック回帰に関する既存の理論は、入力データが低次元多様体上にある場合、ディープニューラルネットワークは本質的なデータ構造に適応できることを示した。
本稿では,$mathcalS$で表される$mathbbRd$のサブセットに入力データが集中するという緩和された仮定を導入する。
論文 参考訳(メタデータ) (2023-06-26T17:13:31Z) - Statistical Learning under Heterogeneous Distribution Shift [71.8393170225794]
ground-truth predictor is additive $mathbbE[mathbfz mid mathbfx,mathbfy] = f_star(mathbfx) +g_star(mathbfy)$.
論文 参考訳(メタデータ) (2023-02-27T16:34:21Z) - Augmenting astrophysical scaling relations with machine learning :
application to reducing the SZ flux-mass scatter [2.0223261087090303]
We study the Sunyaev-Zeldovich flux$-$cluster mass relation(Y_mathrmSZ-M$)
我々は、Y_mathrmSZ$とイオン化ガスの濃度を組み合わせたクラスター質量の新しいプロキシを求める。
以上の結果から,$c_mathrmgas$への依存は,外部よりも大きな散乱を示すクラスタのコアに関係していることが分かる。
論文 参考訳(メタデータ) (2022-01-04T19:00:01Z) - Inverting brain grey matter models with likelihood-free inference: a
tool for trustable cytoarchitecture measurements [62.997667081978825]
脳の灰白質細胞構造の特徴は、体密度と体積に定量的に敏感であり、dMRIでは未解決の課題である。
我々は新しいフォワードモデル、特に新しい方程式系を提案し、比較的スパースなb殻を必要とする。
次に,提案手法を逆転させるため,確率自由推論 (LFI) として知られるベイズ解析から最新のツールを適用した。
論文 参考訳(メタデータ) (2021-11-15T09:08:27Z) - Total Stability of SVMs and Localized SVMs [0.0]
サポートベクトルマシン(SVM)のような正規化されたカーネルベースのメソッドは、基礎となる確率測度$mathrmP$に依存する。
本稿では,3つの$(mathrmP,lambda,k)$の同時変動が,結果の予測に及ぼす影響について検討する。
論文 参考訳(メタデータ) (2021-01-29T16:44:14Z) - Analytic Characterization of the Hessian in Shallow ReLU Models: A Tale
of Symmetry [9.695960412426672]
我々は,スプリアスミニマの様々な家系でヘッセンを解析的に特徴付ける。
特に、$dge k$ 標準ガウス入力について、 (a) ヘッセンの $dk$ 固有値の内、$dk - O(d)$ が 0 に近づき、 (b) $Omega(d)$ 固有値は $k$ で線型的に増加することを証明している。
論文 参考訳(メタデータ) (2020-08-04T20:08:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。