論文の概要: BAMITA: Bayesian Multiple Imputation for Tensor Arrays
- arxiv url: http://arxiv.org/abs/2410.23412v1
- Date: Wed, 30 Oct 2024 19:30:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-01 17:00:48.084911
- Title: BAMITA: Bayesian Multiple Imputation for Tensor Arrays
- Title(参考訳): バミタ:テンソルアレイのベイズ多重計算
- Authors: Ziren Jiang, Gen Li, Eric F. Lock,
- Abstract要約: フレキシブルベイズフレームワークにおけるテンソルに対する多重計算手法を提案する。
我々のモデルは、CANDECOMP/PARAFAC(CP)因子化のために効率的で広く適用可能な共役前駆体を用いる。
また, 個体群の多様性の傾向を推定するために, 完全な微生物組織プロファイルの不確かさを正確に把握できることが示唆された。
- 参考スコア(独自算出の注目度): 4.111762232988317
- License:
- Abstract: Data increasingly take the form of a multi-way array, or tensor, in several biomedical domains. Such tensors are often incompletely observed. For example, we are motivated by longitudinal microbiome studies in which several timepoints are missing for several subjects. There is a growing literature on missing data imputation for tensors. However, existing methods give a point estimate for missing values without capturing uncertainty. We propose a multiple imputation approach for tensors in a flexible Bayesian framework, that yields realistic simulated values for missing entries and can propagate uncertainty through subsequent analyses. Our model uses efficient and widely applicable conjugate priors for a CANDECOMP/PARAFAC (CP) factorization, with a separable residual covariance structure. This approach is shown to perform well with respect to both imputation accuracy and uncertainty calibration, for scenarios in which either single entries or entire fibers of the tensor are missing. For two microbiome applications, it is shown to accurately capture uncertainty in the full microbiome profile at missing timepoints and used to infer trends in species diversity for the population. Documented R code to perform our multiple imputation approach is available at https://github.com/lockEF/MultiwayImputation .
- Abstract(参考訳): データは、いくつかの生物医学領域において、ますます多方向配列、あるいはテンソルの形をとる。
このようなテンソルはしばしば不完全である。
例えば、いくつかの被験者にいくつかのタイムポイントが欠落している縦断微生物研究が動機となっている。
テンソルの欠落データ計算に関する文献が増えている。
しかし、既存の手法では不確実性を捉えることなく、欠落した値の点推定を行う。
フレキシブルベイズフレームワークにおけるテンソルに対する多重計算手法を提案する。これは、不足するエントリに対して現実的なシミュレートされた値をもたらし、その後の解析を通じて不確実性を伝播することができる。
モデルでは, CANDECOMP/PARAFAC (CP) 因子分解において, 分離可能な残差共分散構造を持つ効率的で広く適用可能な共役前駆体を用いる。
このアプローチは、単一エントリまたはテンソルの全ファイバーが欠落しているシナリオに対して、計算精度と不確実性の校正の両方に関して、うまく機能することが示されている。
2つのマイクロバイオームの応用例において、全微生物ームプロファイルの欠落時点における不確かさを正確に把握し、個体群における種多様性の傾向を推測するために用いられる。
複数命令のアプローチを実行するためのドキュメント化されたRコードは、https://github.com/lockEF/MultiwayImputation で公開されている。
関連論文リスト
- Bayes-CATSI: A variational Bayesian deep learning framework for medical time series data imputation [0.196629787330046]
ベイジアン文脈対応時系列計算(Bayes-CATSI)フレームワークを提案する。
脳電図(EEG)、脳電図(EOG)、筋電図(EMG)、心電図(EKG)の時系列を考察する。
その結果,ベイズCATSIは不確実な定量化を提供するだけでなく,CATSIモデルよりも優れた計算性能が得られることがわかった。
論文 参考訳(メタデータ) (2024-10-01T07:37:52Z) - MTSCI: A Conditional Diffusion Model for Multivariate Time Series Consistent Imputation [41.681869408967586]
主要な研究課題は、どのようにインパルスの整合性を確保するか、すなわち観測値とインパルス値の整合性を確保するかである。
従来の手法は、学習プロセスを導くために、計算対象の帰納的バイアスにのみ依存する。
論文 参考訳(メタデータ) (2024-08-11T10:24:53Z) - Probabilistic Imputation for Time-series Classification with Missing
Data [17.956329906475084]
時系列データを欠落した値で分類する新しいフレームワークを提案する。
我々の深層生成モデル部分は、欠落した値を複数の可算的な方法で解釈するように訓練されている。
分類部は、インプットされた不足値とともに時系列データを取り込み、信号を分類する。
論文 参考訳(メタデータ) (2023-08-13T10:04:13Z) - Bayesian predictive modeling of multi-source multi-way data [0.0]
初期鉄欠乏症 (ID) の予測因子として, 複数のオミクス源から得られた分子データについて検討した。
係数に低ランク構造を持つ線形モデルを用いて多方向依存を捕捉する。
本モデルでは, 誤分類率と推定係数と真の係数との相関から, 期待通りの性能を示すことを示す。
論文 参考訳(メタデータ) (2022-08-05T21:58:23Z) - Uncertainty Modeling for Out-of-Distribution Generalization [56.957731893992495]
特徴統計を適切に操作することで、ディープラーニングモデルの一般化能力を向上させることができると論じる。
一般的な手法では、特徴統計を学習した特徴から測定された決定論的値とみなすことが多い。
我々は、学習中に合成された特徴統計を用いて、領域シフトの不確かさをモデル化することにより、ネットワークの一般化能力を向上させる。
論文 参考訳(メタデータ) (2022-02-08T16:09:12Z) - TACTiS: Transformer-Attentional Copulas for Time Series [76.71406465526454]
時間変化量の推定は、医療や金融などの分野における意思決定の基本的な構成要素である。
本稿では,アテンションベースデコーダを用いて関節分布を推定する多元的手法を提案する。
本研究では,本モデルが実世界の複数のデータセットに対して最先端の予測を生成することを示す。
論文 参考訳(メタデータ) (2022-02-07T21:37:29Z) - MURAL: An Unsupervised Random Forest-Based Embedding for Electronic
Health Record Data [59.26381272149325]
異なる変数型でデータを表現するための教師なしランダムフォレストを提案する。
muraL forestsは、ノード分割変数がランダムに選択される一連の決定ツリーで構成されている。
提案手法を用いることで,競合するアプローチよりも正確なデータの視覚化と分類が可能であることを示す。
論文 参考訳(メタデータ) (2021-11-19T22:02:21Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Contrastive learning of strong-mixing continuous-time stochastic
processes [53.82893653745542]
コントラスト学習(Contrastive Learning)は、ラベルのないデータから構築された分類タスクを解決するためにモデルを訓練する自己指導型の手法のファミリーである。
拡散の場合,小~中距離間隔の遷移カーネルを適切に構築したコントラスト学習タスクを用いて推定できることが示される。
論文 参考訳(メタデータ) (2021-03-03T23:06:47Z) - Matrix Completion with Quantified Uncertainty through Low Rank Gaussian
Copula [30.84155327760468]
本稿では,不確かさを定量化した値計算の欠如に対する枠組みを提案する。
モデルに適合するために必要な時間は、データセット内の行数や列数と線形にスケールする。
実験結果から,本手法は様々な種類のデータに対して最先端の計算精度が得られることがわかった。
論文 参考訳(メタデータ) (2020-06-18T19:51:42Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。