論文の概要: AI-driven Generation of MALDI-TOF MS for Microbial Characterization
- arxiv url: http://arxiv.org/abs/2511.17611v1
- Date: Tue, 18 Nov 2025 10:01:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.291658
- Title: AI-driven Generation of MALDI-TOF MS for Microbial Characterization
- Title(参考訳): 微生物評価のためのAI駆動型MALDI-TOF MSの生成
- Authors: Lucía Schmidt-Santiago, David Rodríguez-Temporal, Carlos Sevilla-Salcedo, Vanessa Gómez-Verdejo,
- Abstract要約: 本研究では,MALDI-TOF MSスペクトルを合成するための深層生成モデルについて検討した。
我々は3つの生成モデル、変分オートエンコーダ(MALDIVAEs)、生成共振器ネットワーク(MALDIGANs)、確率モデル(MALDIffusion)を適応・評価する。
実験により、MALDIVAE、MALDIGAN、MALDIffusionによって生成された合成データは、統計的に、診断的に実測値に匹敵することがわかった。
- 参考スコア(独自算出の注目度): 1.3155923068686746
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Matrix-Assisted Laser Desorption/Ionization Time-of-Flight Mass Spectrometry (MALDI-TOF MS) has become a cornerstone technology in clinical microbiology, enabling rapid and accurate microbial identification. However, the development of data-driven diagnostic models remains limited by the lack of sufficiently large, balanced, and standardized spectral datasets. This study investigates the use of deep generative models to synthesize realistic MALDI-TOF MS spectra, aiming to overcome data scarcity and support the development of robust machine learning tools in microbiology. We adapt and evaluate three generative models, Variational Autoencoders (MALDIVAEs), Generative Adversarial Networks (MALDIGANs), and Denoising Diffusion Probabilistic Model (MALDIffusion), for the conditional generation of microbial spectra guided by species labels. Generation is conditioned on species labels, and spectral fidelity and diversity are assessed using diverse metrics. Our experiments show that synthetic data generated by MALDIVAE, MALDIGAN, and MALDIffusion are statistically and diagnostically comparable to real measurements, enabling classifiers trained exclusively on synthetic samples to reach performance levels similar to those trained on real data. While all models faithfully reproduce the peak structure and variability of MALDI-TOF spectra, MALDIffusion obtains this fidelity at a substantially higher computational cost, and MALDIGAN shows competitive but slightly less stable behaviour. In contrast, MALDIVAE offers the most favorable balance between realism, stability, and efficiency. Furthermore, augmenting minority species with synthetic spectra markedly improves classification accuracy, effectively mitigating class imbalance and domain mismatch without compromising the authenticity of the generated data.
- Abstract(参考訳): マトリックス型レーザー脱離イオン化時間質量分析法 (MALDI-TOF MS) は臨床微生物学における基礎技術となり, 迅速かつ正確な微生物同定が可能となった。
しかし、十分に大きく、バランスよく、標準化されたスペクトルデータセットが欠如しているため、データ駆動型診断モデルの開発は依然として限られている。
本研究では,MALDI-TOF MSスペクトルを合成するための深層生成モデルを用いて,データの不足を克服し,微生物学における堅牢な機械学習ツールの開発を支援することを目的とした。
本研究は,3つの生成モデル,MALDIVAEs,MALDIGANs,Denoising Diffusion Probabilistic Model(MALDIffusion)の適応と評価を行った。
種ラベルで生成が条件付けられ、スペクトルの忠実度と多様性は多様な指標を用いて評価される。
実験の結果,MALDIVAE,MALDIGAN,MALDIffusionが生成する合成データは,実測値と統計的・診断的に比較できることがわかった。
すべてのモデルは、MALDI-TOFスペクトルのピーク構造と変動性を忠実に再現するが、MALDIffusionは、この忠実度をかなり高い計算コストで取得し、MALDIGANは、競合するが、わずかに安定した振る舞いを示す。
対照的に、MALDIVAEはリアリズム、安定性、効率の最も好ましいバランスを提供する。
さらに, 合成スペクトルを用いた少数種の増強は, 分類精度を著しく向上させ, 生成データの信頼性を損なうことなく, クラス不均衡やドメインミスマッチを効果的に緩和する。
関連論文リスト
- Improving the Generation and Evaluation of Synthetic Data for Downstream Medical Causal Inference [89.5628648718851]
因果推論は医療介入の開発と評価に不可欠である。
現実の医療データセットは、規制障壁のためアクセスが難しいことが多い。
本稿では,医学における治療効果分析のための新しい合成データ生成法STEAMを提案する。
論文 参考訳(メタデータ) (2025-10-21T16:16:00Z) - Learning Robust Diffusion Models from Imprecise Supervision [75.53546939251146]
DMISは、Imrecise Supervisionから堅牢な条件拡散モデルをトレーニングするための統一されたフレームワークである。
我々のフレームワークは、可能性から派生し、その目的を生成的および分類的構成要素に分解する。
画像生成、弱教師付き学習、データセットの凝縮をカバーし、様々な形の不正確な監視実験を行い、DMISが常に高品質でクラス差別的なサンプルを生成することを示した。
論文 参考訳(メタデータ) (2025-10-03T14:00:32Z) - An Interpretable Ensemble Framework for Multi-Omics Dementia Biomarker Discovery Under HDLSS Conditions [0.0]
本稿では、グラフ注意ネットワーク(GAT)、マルチOmics Variational AutoEncoder(MOVE)、Elastic-net sparse regression、Storey's False Discovery Rate(FDR)を組み合わせた新しいアンサンブル手法を提案する。
シミュレーションされたマルチオミクスデータとアルツハイマー病神経画像イニシアチブ(ADNI)データセットを用いて評価を行った。
本手法は, 優れた予測精度, 特徴選択精度, 生物学的妥当性を示す。
論文 参考訳(メタデータ) (2025-09-04T15:20:13Z) - Generate Aligned Anomaly: Region-Guided Few-Shot Anomaly Image-Mask Pair Synthesis for Industrial Inspection [53.137651284042434]
異常検査は製造業において重要な役割を担っているが、異常サンプルの不足は既存の方法の有効性を制限している。
本稿では,GAA (Generate grained Anomaly) を提案する。
GAAは少数のサンプルのみを用いて現実的で多様で意味的に整合した異常を発生させる。
論文 参考訳(メタデータ) (2025-07-13T12:56:59Z) - Leveraging Diffusion Models for Synthetic Data Augmentation in Protein Subcellular Localization Classification [0.0]
ラベル一貫性を持つサンプルを生成するために,クラス条件記述拡散確率モデル(DDPM)を実装した。
私たちは、Mix LossとMix Representationという2つのハイブリッドトレーニング戦略を通じて、実際のデータとの統合を検討します。
本研究は, バイオメディカル画像分類に生成増強を取り入れた場合の, 現実的なデータ生成と堅牢な管理の重要性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-05-28T22:58:50Z) - DiffRaman: A Conditional Latent Denoising Diffusion Probabilistic Model for Bacterial Raman Spectroscopy Identification Under Limited Data Conditions [11.586869210490628]
本稿では, 深層生成モデルを用いたデータ生成手法を提案し, 細菌ラマンスペクトルの認識精度を向上させる。
DiffRamanによって生成された合成細菌ラマンスペクトルは、実実験スペクトルを効果的にエミュレートできることを示した。
論文 参考訳(メタデータ) (2024-12-11T06:36:55Z) - MCRAGE: Synthetic Healthcare Data for Fairness [3.0089659534785853]
そこで本稿では,MCRAGE (Generative Modeling) の強化による不均衡データセットの増大によるマイノリティクラス再バランスを提案する。
MCRAGEは、デノイング拡散確率モデル (Denoising Diffusion Probabilistic Model, CDDPM) を訓練し、未表現のクラスから高品質な合成EHRサンプルを生成する。
この合成データを使用して、既存の不均衡なデータセットを増大させ、その結果、すべてのクラスにまたがるよりバランスの取れた分散を実現します。
論文 参考訳(メタデータ) (2023-10-27T19:02:22Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。