論文の概要: Hypothesis testing for matched pairs with missing data by maximum mean
discrepancy: An application to continuous glucose monitoring
- arxiv url: http://arxiv.org/abs/2206.01590v1
- Date: Fri, 3 Jun 2022 14:20:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-06 18:39:09.957259
- Title: Hypothesis testing for matched pairs with missing data by maximum mean
discrepancy: An application to continuous glucose monitoring
- Title(参考訳): 最大平均差分法による一致した平均値のないペアの仮説検証:連続グルコースモニタリングへの応用
- Authors: Marcos Matabuena, Paulo F\'elix, Marc Ditzhaus, Juan Vidal and
Francisco Gude
- Abstract要約: 本稿では,データ不足を伴う複雑なマッチングペアを扱うために,MMD(maxum mean discrepancy)の新たな推定法を提案する。
これらの推定器は、異なる欠損機構の下でデータ分布の差を検出することができる。
縦断型糖尿病研究における連続グルコースモニタリングのデータを用いて,本手法の適用例を示した。
- 参考スコア(独自算出の注目度): 0.8399688944263843
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: A frequent problem in statistical science is how to properly handle missing
data in matched paired observations. There is a large body of literature coping
with the univariate case. Yet, the ongoing technological progress in measuring
biological systems raises the need for addressing more complex data, e.g.,
graphs, strings and probability distributions, among others. In order to fill
this gap, this paper proposes new estimators of the maximum mean discrepancy
(MMD) to handle complex matched pairs with missing data. These estimators can
detect differences in data distributions under different missingness
mechanisms. The validity of this approach is proven and further studied in an
extensive simulation study, and results of statistical consistency are
provided. Data from continuous glucose monitoring in a longitudinal
population-based diabetes study are used to illustrate the application of this
approach. By employing the new distributional representations together with
cluster analysis, new clinical criteria on how glucose changes vary at the
distributional level over five years can be explored.
- Abstract(参考訳): 統計科学における頻繁な問題は、一致したペアの観測で欠落したデータを適切に扱う方法である。
ユニバリケート事件に対処する大量の文献がある。
しかし、生物学的システムを測定する技術進歩により、グラフ、文字列、確率分布など、より複雑なデータを扱う必要性が高まっている。
このギャップを埋めるため,データ不足を伴う複雑なマッチングペアを扱うために,MMD (maxum mean discrepancy) の新たな推定法を提案する。
これらの推定器は、異なる欠損機構の下でデータ分布の差を検出することができる。
本手法の有効性を実証し,広範囲なシミュレーション研究でさらなる研究を行い,統計的一貫性の成果を得た。
縦断型糖尿病研究における連続グルコースモニタリングのデータを用いて、このアプローチの適用例を示した。
新たな分布表現とクラスター分析を併用することにより,5年間にわたる分布レベルでのグルコース変化の変動に関する新たな臨床基準を検討することができる。
関連論文リスト
- Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Estimating Unknown Population Sizes Using the Hypergeometric Distribution [1.03590082373586]
総人口と構成カテゴリーの規模が不明な場合, 個別分布の推定に挑戦する。
本研究では,連続潜伏変数上での分布条件の混合となるデータ生成過程について考察する。
実験データシミュレーションにより,本手法は数値データをモデル化する他の可能性関数よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-02-22T01:53:56Z) - Bayesian Federated Inference for regression models based on non-shared multicenter data sets from heterogeneous populations [0.0]
回帰モデルでは、サンプルサイズは予測器の数に対して十分な大きさでなければならない。
異なる(医療)センターで収集された異なるデータセットからデータをポーリングすることはこの問題を軽減するが、プライバシー規制やロジスティックな問題のためにしばしば実現不可能である。
別の方法は、センター内のローカルデータを別々に分析し、統計的推測結果とベイズ連邦推論(BFI)手法を組み合わせることである。
このアプローチの目的は、組み合わせたデータに対して統計的解析を行った場合、何を発見したのかを、別々の中心における推論結果から計算することである。
論文 参考訳(メタデータ) (2024-02-05T11:10:27Z) - Interpretable Causal Inference for Analyzing Wearable, Sensor, and Distributional Data [62.56890808004615]
本研究では,信頼性とロバストな意思決定を確実にする,分散データ解析の解釈可能な手法を開発した。
ADD MALTSの有用性について,糖尿病リスク軽減のための連続グルコースモニターの有効性について検討した。
論文 参考訳(メタデータ) (2023-12-17T00:42:42Z) - Class-Balancing Diffusion Models [57.38599989220613]
クラスバランシング拡散モデル(CBDM)は、分散調整正規化器をソリューションとして訓練する。
提案手法は,CIFAR100/CIFAR100LTデータセットで生成結果をベンチマークし,下流認識タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-30T20:00:14Z) - Gaussian Latent Dirichlet Allocation for Discrete Human State Discovery [1.057079240576682]
離散状態発見問題に対する教師なし確率モデルであるGaussian Latent Dirichlet Allocation (GLDA)を提案する。
GLDAは、自然言語処理において人気のあるトピックモデルであるLatent Dirichlet Allocation (LDA)から個々の混合構造を借りている。
両データセットにおいて,GLDAを学習したクラスウェイトは,臨床評価したうつ病,不安,ストレススコアと,ベースラインのGMMよりも有意に高い相関性を示した。
論文 参考訳(メタデータ) (2022-06-28T18:33:46Z) - Improving Uncertainty Calibration via Prior Augmented Data [56.88185136509654]
ニューラルネットワークは、普遍関数近似器として機能することで、複雑なデータ分布から学習することに成功した。
彼らはしばしば予測に自信過剰であり、不正確で誤った確率的予測に繋がる。
本稿では,モデルが不当に過信である特徴空間の領域を探索し,それらの予測のエントロピーをラベルの以前の分布に対して条件的に高める手法を提案する。
論文 参考訳(メタデータ) (2021-02-22T07:02:37Z) - Glucose values prediction five years ahead with a new framework of
missing responses in reproducing kernel Hilbert spaces, and the use of
continuous glucose monitoring technology [0.0]
aegis研究は連続グルコースモニタリング技術(cgm)による循環性グルコースの経時的変化に関するユニークな情報を持っている
通常、縦断的な医学研究では、結果変数に欠落するデータがかなりの量存在する。
本稿では、カーネルヒルベルト空間(RKHS)を欠落した応答で再生する学習に基づく新しいデータ分析フレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-11T18:51:44Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。