論文の概要: DIA-CLIP: a universal representation learning framework for zero-shot DIA proteomics
- arxiv url: http://arxiv.org/abs/2602.01772v1
- Date: Mon, 02 Feb 2026 07:55:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.995006
- Title: DIA-CLIP: a universal representation learning framework for zero-shot DIA proteomics
- Title(参考訳): ゼロショットDIAプロテオミクスのための汎用表現学習フレームワークDIA-CLIP
- Authors: Yucheng Liao, Han Wen, Weinan E, Weijie Zhang,
- Abstract要約: 本稿では,DIA分析パラダイムを半教師付きトレーニングから普遍的クロスモーダル表現学習へシフトさせる事前学習モデルであるDIA-CLIPを提案する。
二重エンコーダ・コントラスト学習フレームワークとエンコーダ・デコーダアーキテクチャを統合することにより、DIA-CLIPはペプチドとそれに対応するスペクトルの特徴を統一したクロスモーダル表現を確立する。
- 参考スコア(独自算出の注目度): 9.005785118040423
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data-independent acquisition mass spectrometry (DIA-MS) has established itself as a cornerstone of proteomic profiling and large-scale systems biology, offering unparalleled depth and reproducibility. Current DIA analysis frameworks, however, require semi-supervised training within each run for peptide-spectrum match (PSM) re-scoring. This approach is prone to overfitting and lacks generalizability across diverse species and experimental conditions. Here, we present DIA-CLIP, a pre-trained model shifting the DIA analysis paradigm from semi-supervised training to universal cross-modal representation learning. By integrating dual-encoder contrastive learning framework with encoder-decoder architecture, DIA-CLIP establishes a unified cross-modal representation for peptides and corresponding spectral features, achieving high-precision, zero-shot PSM inference. Extensive evaluations across diverse benchmarks demonstrate that DIA-CLIP consistently outperforms state-of-the-art tools, yielding up to a 45% increase in protein identification while achieving a 12% reduction in entrapment identifications. Moreover, DIA-CLIP holds immense potential for diverse practical applications, such as single-cell and spatial proteomics, where its enhanced identification depth facilitates the discovery of novel biomarkers and the elucidates of intricate cellular mechanisms.
- Abstract(参考訳): データ独立な取得質量分析法 (DIA-MS) はプロテオミクスプロファイリングと大規模システム生物学の基礎として確立され、非並列な深さと再現性を提供している。
しかし、現在のDIA分析フレームワークは、ペプチド-スペクトルマッチング(PSM)の再検査のために、各ラン内で半教師付きトレーニングを必要とする。
このアプローチは過度に適合する傾向があり、多様な種や実験条件にまたがる一般化性に欠ける。
本稿では、DIA分析パラダイムを半教師付きトレーニングから普遍的クロスモーダル表現学習へシフトさせる事前学習モデルであるDIA-CLIPを提案する。
二重エンコーダのコントラスト学習フレームワークをエンコーダ・デコーダアーキテクチャに統合することにより、DIA-CLIPはペプチドとそれに対応するスペクトル特徴のクロスモーダル表現を統一し、高精度なゼロショットPSM推論を実現する。
多様なベンチマークによる広範囲な評価は、DIA-CLIPが最先端のツールを一貫して上回り、タンパク質の識別が最大45%増加し、包括的識別が12%減少することを示している。
さらに、DIA-CLIPは単一細胞や空間プロテオミクスなどの多様な実用用途において大きな可能性を秘めており、識別深度の向上は新規なバイオマーカーの発見と複雑な細胞機構の解明を促進する。
関連論文リスト
- Breaking the Modality Barrier: Generative Modeling for Accurate Molecule Retrieval from Mass Spectra [60.08608779794957]
本稿では,ジェネレーティブ言語モデルに基づく検索フレームワークであるGLMRを提案する。
検索前の段階では、比較学習に基づくモデルでは、上位候補分子を入力質量スペクトルの文脈的先行として識別する。
生成検索段階において、これらの候補分子は入力質量スペクトルと統合され、精製された分子構造を生成するための生成モデルが導かれる。
論文 参考訳(メタデータ) (2025-11-09T07:25:53Z) - scMRDR: A scalable and flexible framework for unpaired single-cell multi-omics data integration [53.683726781791385]
単一セルマルチオミクス(ScMRDR)と呼ばれるスケーラブルでフレキシブルな生成フレームワークを導入する。
本手法は, バッチ補正, モダリティアライメント, 生体信号保存の観点から, ベンチマークデータセット上での優れた性能を実現する。
論文 参考訳(メタデータ) (2025-10-28T21:28:39Z) - A Novel Data Augmentation Strategy for Robust Deep Learning Classification of Biomedical Time-Series Data: Application to ECG and EEG Analysis [2.355460994057843]
本研究では,様々な信号タイプにまたがる最先端性能を実現する,新しい統合型深層学習フレームワークを提案する。
従来の研究とは異なり、将来予測能力を達成するために信号の複雑さを科学的に増加させ、最高の予測を導いた。
アーキテクチャには130MBのメモリとプロセスが10ミリ秒で必要であり、ローエンドデバイスやウェアラブルデバイスへのデプロイに適していることを示唆している。
論文 参考訳(メタデータ) (2025-07-16T21:38:10Z) - CRIA: A Cross-View Interaction and Instance-Adapted Pre-training Framework for Generalizable EEG Representations [52.251569042852815]
CRIAは、可変長および可変チャネルコーディングを使用して、異なるデータセット間でEEGデータの統一表現を実現する適応フレームワークである。
このモデルでは、時間的、スペクトル的、空間的特徴を効果的に融合させるクロスアテンション機構を採用している。
テンプル大学脳波コーパスとCHB-MITデータセットによる実験結果から、CRIAは既存の方法よりも、同じ事前学習条件で優れていることが示された。
論文 参考訳(メタデータ) (2025-06-19T06:31:08Z) - Self-Calibrated Dual Contrasting for Annotation-Efficient Bacteria Raman Spectroscopy Clustering and Classification [11.586869210490628]
本稿では,Ramanスペクトル認識のためのアノテーション効率の良い自己校正デュアルコントラスト(SCDC)法を提案する。
我々のコアモチベーションは、2つの異なる部分空間における2つの異なる視点からのスペクトルを表現することである。
差別的表現を得るために,2つの視点から2つのコントラスト学習手法を実装した。
論文 参考訳(メタデータ) (2024-12-28T07:27:51Z) - Multimodal Outer Arithmetic Block Dual Fusion of Whole Slide Images and Omics Data for Precision Oncology [6.418265127069878]
本稿では, 局所(パッチレベル)から大域(スライダーレベル)の相互作用の相補的な情報を取得するために, 早期・後期融合におけるオミック埋め込みの利用を提案する。
この二重融合戦略は、解釈可能性と分類性能を高め、臨床診断の可能性を強調している。
論文 参考訳(メタデータ) (2024-11-26T13:25:53Z) - Learning Multiscale Consistency for Self-supervised Electron Microscopy
Instance Segmentation [48.267001230607306]
本稿では,EMボリュームのマルチスケール一貫性を高める事前学習フレームワークを提案する。
当社のアプローチでは,強力なデータ拡張と弱いデータ拡張を統合することで,Siameseネットワークアーキテクチャを活用している。
効果的にボクセルと機能の一貫性をキャプチャし、EM分析のための転送可能な表現を学習する。
論文 参考訳(メタデータ) (2023-08-19T05:49:13Z) - Rethinking Semi-Supervised Medical Image Segmentation: A
Variance-Reduction Perspective [51.70661197256033]
医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。
まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。
5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2023-02-03T13:50:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。