論文の概要: SCENT: Aligning Mass Spectra with Molecular Structure for Olfactory Perception
- arxiv url: http://arxiv.org/abs/2605.27009v1
- Date: Tue, 26 May 2026 13:28:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.186687
- Title: SCENT: Aligning Mass Spectra with Molecular Structure for Olfactory Perception
- Title(参考訳): SCENT:嗅覚のための分子構造を持つ質量スペクトルの調整
- Authors: Ziqi Zhang, Eunyeong Jin, Miguel Vasco, Farzaneh Taleb, Nona Rajabi, Alexandra Gutmann, Jonathan Williams, Antônio H. Ribeiro, Danica Kragic,
- Abstract要約: 直接電子イオン化質量分析法(EI-MS)を嗅覚予測のための代替入力モードとして検討する。
我々は、EI-MS表現と予め訓練された化学構造埋め込みを整合させるマルチモーダルコントラスト学習フレームワークであるSpectrum-to-Chemical EmbeddingalignedmeNT(SCENT)を寄贈する。
マルチラベルの匂い記述子予測タスクでは、SCENTはMSのみのベースラインを著しく上回り、構造ベースモデルに匹敵する嗅覚性能を達成する。
- 参考スコア(独自算出の注目度): 48.96518000981492
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting human olfactory perception from molecular structure has seen remarkable progress, yet these approaches require explicit chemical structure at inference, which is not available in practical sensing settings. We address this gap by exploring direct electron ionization mass spectrometry (EI-MS), a sensing technique that acquires chemically informative fragmentation fingerprints in seconds, as an alternative input modality for olfactory prediction. We contribute Spectrum-to-Chemical Embedding alignmeNT (SCENT), a multi-modal contrastive learning framework that aligns EI-MS representations with pretrained chemical structure embeddings, while requiring only mass spectra at inference. On the multi-label odor descriptor prediction task, SCENT significantly outperforms MS-only baselines and achieves performance comparable to structure-based models, despite requiring no explicit molecular structure at test time. The learned representations also better approximate continuous human perceptual ratings and generalize to real-world lab-measured spectra, suggesting that cross-modal alignment is an effective strategy for grounding analytical spectra in chemical semantics.
- Abstract(参考訳): 分子構造から人間の嗅覚を予測することは顕著な進歩を遂げているが、これらのアプローチでは推論時に明示的な化学構造を必要とする。
直接電子イオン化質量分析法 (EI-MS) は, 化学情報による断片化指紋を数秒で取得するセンサ技術であり, 嗅覚予測のための代替的な入力モダリティである。
本研究では,マルチモーダル・コントラスト学習フレームワークであるSpectrum-to-Chemical EmbeddingalignedmeNT (SCENT) について述べる。
マルチラベルの匂い記述子予測タスクでは、SCENTはMSのみのベースラインを著しく上回り、テスト時に明示的な分子構造を必要としないにもかかわらず、構造ベースモデルに匹敵する性能を達成する。
学習された表現はまた、人間の知覚評価をよりよく近似し、実世界の実験室測定スペクトルに一般化し、クロスモーダルアライメントが化学意味論における分析スペクトルの基盤となる効果的な戦略であることを示唆している。
関連論文リスト
- FlowMS: Flow Matching for De Novo Structure Elucidation from Mass Spectra [6.255932418151384]
FlowMSは、スペクトル条件付きデノボ分子生成のための最初の離散フローマッチングフレームワークである。
NPLIB1ベンチマークの6つのメトリクスのうち5つで最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-03-19T01:41:52Z) - From Static Spectra to Operando Infrared Dynamics: Physics Informed Flow Modeling and a Benchmark [67.29937933325849]
Operando IR Predictionは、1つの静的スペクトルからスペクトル指紋の時間分解進化を予測することを目的としている。
OpIRSpec-7Kは、10の異なるバッテリーシステムにわたる7,118の高品質なサンプルで構成されている。
ABCCは最先端の静的、シーケンシャル、および生成的ベースラインを著しく上回る。
論文 参考訳(メタデータ) (2026-02-20T18:58:43Z) - How well can off-the-shelf LLMs elucidate molecular structures from mass spectra using chain-of-thought reasoning? [51.286853421822705]
大規模言語モデル (LLM) は推論集約的な科学的タスクを約束するが、化学的解釈の能力はまだ不明である。
我々は、分子構造を予測するために、LLMが質量スペクトルデータに対してどのように理由を持つかを評価する、Chain-of-Thought(CoT)プロンプトフレームワークとベンチマークを導入する。
SMILESの妥当性, 式整合性, 構造的類似性の指標による評価の結果, LLMは合成学的に有効で, 部分的に可視な構造を生成できるが, 分子予測の正確性やリンク推論を達成できないことがわかった。
論文 参考訳(メタデータ) (2026-01-09T20:08:42Z) - Breaking the Modality Barrier: Generative Modeling for Accurate Molecule Retrieval from Mass Spectra [60.08608779794957]
本稿では,ジェネレーティブ言語モデルに基づく検索フレームワークであるGLMRを提案する。
検索前の段階では、比較学習に基づくモデルでは、上位候補分子を入力質量スペクトルの文脈的先行として識別する。
生成検索段階において、これらの候補分子は入力質量スペクトルと統合され、精製された分子構造を生成するための生成モデルが導かれる。
論文 参考訳(メタデータ) (2025-11-09T07:25:53Z) - Test-Time Tuned Language Models Enable End-to-end De Novo Molecular Structure Generation from MS/MS Spectra [31.563216077422084]
タンデム質量分析法は、代謝学、天然物発見、環境分析などの重要な分野における未知化合物の同定を可能にする。
テスト時間チューニングを活用することで,事前学習されたトランスフォーマーモデルの学習を向上し,このギャップに対処するフレームワークを導入する。
我々は、NPLIB1とMassSpecGymの2つの人気のあるベンチマークで、DiffMSのデファクトステート・オブ・ザ・アーティカルアプローチを100%と20%上回った。
論文 参考訳(メタデータ) (2025-10-27T18:25:36Z) - MS-BART: Unified Modeling of Mass Spectra and Molecules for Structure Elucidation [20.973121120131875]
大規模事前学習は、他の領域におけるデータの不足に対処するのに有効であることが証明されている。
質量スペクトルと分子構造を共有トークン語彙にマッピングする統合モデリングフレームワークMS-BARTを提案する。
大規模な評価では、MS-BARTはMassSpecGymとNPLIB1の5/12キーメトリクスでSOTA性能を達成している。
論文 参考訳(メタデータ) (2025-10-23T14:45:28Z) - Language Models Can Understand Spectra: A Multimodal Model for Molecular Structure Elucidation [9.987376780022345]
マルチモーダル分光関節推論をサポートするために設計された,最初の大規模言語モデルであるSpectraLLMを提案する。
連続的および離散的な分光モジュラリティを共有意味空間に統合することにより、SpectraLLMはスペクトル間で一貫性があり相補的な構造パターンを明らかにすることを学ぶ。
我々は、小分子領域におけるSpectraLLMの事前学習と微調整を行い、6つの標準化された公開化学データセットで評価する。
論文 参考訳(メタデータ) (2025-08-04T13:33:38Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。