論文の概要: VICatMix: variational Bayesian clustering and variable selection for discrete biomedical data
- arxiv url: http://arxiv.org/abs/2406.16227v1
- Date: Sun, 23 Jun 2024 21:45:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-25 18:25:12.046689
- Title: VICatMix: variational Bayesian clustering and variable selection for discrete biomedical data
- Title(参考訳): VICatMix:個別生体データに対する変分ベイズクラスタリングと変分選択
- Authors: Paul D. W. Kirk, Jackie Rao,
- Abstract要約: 分類データのクラスタリング用に設計された変分ベイズ有限混合モデルであるVICatMixを提案する。
提案モデルでは, 近似とモデル平均化を用いて, VIにおける局所最適性の低下を緩和し, クラスタ数の真の推定を改良する。
我々は、異なるオミクスデータセットを用いた統合クラスタ分析におけるVICatMixの有用性を実証し、新しいサブタイプの発見を可能にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effective clustering of biomedical data is crucial in precision medicine, enabling accurate stratifiction of patients or samples. However, the growth in availability of high-dimensional categorical data, including `omics data, necessitates computationally efficient clustering algorithms. We present VICatMix, a variational Bayesian finite mixture model designed for the clustering of categorical data. The use of variational inference (VI) in its training allows the model to outperform competitors in term of efficiency, while maintaining high accuracy. VICatMix furthermore performs variable selection, enhancing its performance on high-dimensional, noisy data. The proposed model incorporates summarisation and model averaging to mitigate poor local optima in VI, allowing for improved estimation of the true number of clusters simultaneously with feature saliency. We demonstrate the performance of VICatMix with both simulated and real-world data, including applications to datasets from The Cancer Genome Atlas (TCGA), showing its use in cancer subtyping and driver gene discovery. We demonstrate VICatMix's utility in integrative cluster analysis with different `omics datasets, enabling the discovery of novel subtypes. \textbf{Availability:} VICatMix is freely available as an R package, incorporating C++ for faster computation, at \url{https://github.com/j-ackierao/VICatMix}.
- Abstract(参考訳): バイオメディカルデータの効果的なクラスタリングは、正確な医療において不可欠であり、患者やサンプルの正確な成層を可能にする。
しかし,「物理データ」を含む高次元分類データの可用性の向上は,計算効率のよいクラスタリングアルゴリズムを必要としている。
分類データのクラスタリング用に設計された変分ベイズ有限混合モデルであるVICatMixを提案する。
トレーニングにおける変分推論(VI)の使用により、モデルは高い精度を維持しながら、効率の面でライバルより優れている。
VICatMixはさらに可変選択を行い、高次元ノイズデータの性能を向上させる。
提案モデルでは, 近似とモデル平均化を組み込んで, VIにおける局所最適性の低下を緩和し, 特徴量とともにクラスタの真の数を推定し, 精度を向上する。
The Cancer Genome Atlas (TCGA) のデータセットへの応用を含め、シミュレーションデータと実世界のデータの両方を用いて、VICatMixの性能を実証し、癌サブタイプとドライバ遺伝子発見にその使用例を示した。
VICatMixの効用を、異なる‘omics’データセットによる統合クラスタ分析で実証し、新しいサブタイプの発見を可能にした。
https://github.com/j-ackierao/VICatMix} では、より高速な計算のために C++ が組み込まれている。
関連論文リスト
- Synthetic ECG Generation for Data Augmentation and Transfer Learning in Arrhythmia Classification [1.7614607439356635]
本稿では,Deep Learningと異なる生成モデルを用いて生成した合成データの有用性について検討する。
本研究では, 合成事前学習モデルを微調整し, 実データの比率を増大させることにより, 伝達学習の効果について検討する。
論文 参考訳(メタデータ) (2024-11-27T15:46:34Z) - TabDiff: a Mixed-type Diffusion Model for Tabular Data Generation [91.50296404732902]
グラフデータの混合型分布を1つのモデルでモデル化する共同拡散フレームワークであるTabDiffを紹介する。
我々の重要な革新は、数値データと分類データのための連立連続時間拡散プロセスの開発である。
TabDiffは、既存の競合ベースラインよりも優れた平均性能を実現し、ペアワイドカラム相関推定における最先端モデルよりも最大で22.5%改善されている。
論文 参考訳(メタデータ) (2024-10-27T22:58:47Z) - Predicting Drug Effects from High-Dimensional, Asymmetric Drug Datasets by Using Graph Neural Networks: A Comprehensive Analysis of Multitarget Drug Effect Prediction [1.1970409518725493]
グラフニューラルネットワーク(GNN)は、薬物分子グラフから薬物効果を予測する最も効果的なML手法の1つである。
膨大な可能性を秘めているにもかかわらず、GNNモデルは高次元、非対称的に共起する薬物効果を含むデータセットを使用する際の性能を欠いている。
そこで本稿では, 与えられた不均衡な分子グラフデータセットの多重ラベル分類性能を改善するために, 新たなデータオーバーサンプリング手法を提案する。
論文 参考訳(メタデータ) (2024-10-11T22:09:29Z) - Artificial Data Point Generation in Clustered Latent Space for Small
Medical Datasets [4.542616945567623]
本稿では,クラスタ化潜在空間(AGCL)における人工データポイント生成手法を提案する。
AGCLは、合成データ生成により、小さな医療データセットの分類性能を向上させるように設計されている。
顔の表情データを利用してパーキンソン病検診に応用した。
論文 参考訳(メタデータ) (2024-09-26T09:51:08Z) - An improved tabular data generator with VAE-GMM integration [9.4491536689161]
本稿では,現在のアプローチの限界に対処する新しい変分オートエンコーダ(VAE)モデルを提案する。
本手法は,TVAEモデルにインスパイアされたベイジアン・ガウス混合モデル(BGM)をVAEアーキテクチャに組み込む。
我々は,2つの医療関連データセットを含む混合データ型を持つ実世界の3つのデータセットに対して,我々のモデルを徹底的に検証する。
論文 参考訳(メタデータ) (2024-04-12T12:31:06Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Self-Evolution Learning for Mixup: Enhance Data Augmentation on Few-Shot
Text Classification Tasks [75.42002070547267]
テキスト分類におけるデータ拡張のための自己進化学習(SE)に基づくミックスアップ手法を提案する。
モデル出力と原サンプルの1つのホットラベルを線形に補間して,新しい軟質なラベル混在を生成する,新しいインスタンス固有ラベル平滑化手法を提案する。
論文 参考訳(メタデータ) (2023-05-22T23:43:23Z) - Learning with MISELBO: The Mixture Cookbook [62.75516608080322]
本稿では,VampPriorとPixelCNNデコーダネットワークを用いて,フローベース階層型変分オートエンコーダ(VAE)の正規化のための変分近似を初めて提案する。
我々は、この協調行動について、VIと適応的重要度サンプリングの新たな関係を描いて説明する。
我々は、MNISTおよびFashionMNISTデータセット上の負のログ類似度の観点から、VAEアーキテクチャの最先端結果を得る。
論文 参考訳(メタデータ) (2022-09-30T15:01:35Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - iCVI-ARTMAP: Accelerating and improving clustering using adaptive
resonance theory predictive mapping and incremental cluster validity indices [1.160208922584163]
iCVI-ARTMAPは、インクリメンタルクラスタ妥当性指標(iCVI)を使用して教師なし学習を行う。
バッチCVI計算を使用する場合よりも、最大2桁の実行時間を実現することができる。
論文 参考訳(メタデータ) (2020-08-22T19:37:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。