論文の概要: SpecX: A Large-Scale Benchmark for Multi-Modal Spectroscopy and Cross-Paradigm Evaluation
- arxiv url: http://arxiv.org/abs/2605.18791v1
- Date: Mon, 11 May 2026 04:12:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 21:37:32.328258
- Title: SpecX: A Large-Scale Benchmark for Multi-Modal Spectroscopy and Cross-Paradigm Evaluation
- Title(参考訳): SpecX: マルチモード分光とクロスパラダイム評価のための大規模ベンチマーク
- Authors: Chengrui Xiang, Tengfei Ma, Yujie Chen, Tong Wang, Haowen Chen, Xiangxiang Zeng,
- Abstract要約: SpecXはマルチモード分光のための大規模ベンチマークであり、クロスパラダイム評価を行う。
NMR (1H, 13C, HSQC)、IR、MS、UV、ラマン、FLを含む1.7M分子を含む。
- 参考スコア(独自算出の注目度): 22.190667664285154
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing spectral benchmarks are limited in scale, modality alignment, and evaluation scope, and typically focus on either specialized models or multimodal language models (MLLMs). We introduce SpecX, a large-scale benchmark for multi-modal spectroscopy with cross-paradigm evaluation. SpecX contains 1.7M molecules with diverse spectral modalities, including NMR (1H, 13C, HSQC), IR, MS,UV,Raman and FL, and is organized into three tiers: a large-scale dataset for pretraining, an aligned multi-spectral subset for benchmarking, and a high-quality experimental subset for evaluation. SpecX supports a range of tasks such as molecular elucidation, spectrum simulation, and spectral understanding, and enables unified evaluation across both specialized spectral models and MLLMs. Experiments show that specialized models excel at signal-level modeling, while MLLMs exhibit strengths in high-level reasoning but lack precise spectral grounding. SpecX establishes a unified benchmark for spectral intelligence and highlights the need for spectrum-native foundation models.
- Abstract(参考訳): 既存のベンチマークは、スケール、モダリティアライメント、評価範囲に限られており、通常は特殊モデルまたはマルチモーダル言語モデル(MLLM)に焦点を当てている。
クロスパラダイム評価を伴うマルチモーダル分光のための大規模ベンチマークであるSpecXを紹介する。
SpecXは、NMR (1H, 13C, HSQC)、IR、MS、UV、Raman、FLを含む1.7M分子を含み、事前トレーニングのための大規模なデータセット、ベンチマークのための配位多重スペクトルサブセット、評価のための高品質な実験的サブセットの3つの階層に分けられる。
SpecXは、分子解明、スペクトルシミュレーション、スペクトル理解といった様々なタスクをサポートし、特殊なスペクトルモデルとMLLMの両方で統一的な評価を可能にする。
実験により、信号レベルのモデリングでは特殊モデルが優れており、MLLMは高レベルの推論では強度を示すが、正確なスペクトルグラウンドは欠如していることが示された。
SpecXはスペクトルインテリジェンスのための統一ベンチマークを確立し、スペクトルネイティブ基盤モデルの必要性を強調している。
関連論文リスト
- Spectral Model eXplainer: a chemically-grounded explainability framework for spectral-based machine learning models [0.6487259764989486]
本研究では、スペクトル分類器をエキスパートインフォームドスペクトルゾーンで説明する、ポストホックでグローバルなモデルに依存しないXAIフレームワークであるスペクトルモデルeXplainer(SMX)を紹介する。
SMXはPCAを介して各ゾーンを要約し、量子ベースの論理述語を定義し、摂動による関係を推定し、有向重み付きグラフでバッグワイズランキングを集計する。
論文 参考訳(メタデータ) (2026-05-04T15:01:04Z) - SpecVQA: A Benchmark for Spectral Understanding and Visual Question Answering in Scientific Images [3.524427709120397]
SpecVQAは、科学的スペクトル理解のマルチモーダルモデルを評価するための専門的な科学的イメージベンチマークである。
本稿では,基本曲線特性を保ちつつ,トークン長を削減するためのスペクトルデータサンプリングと再構成手法を提案する。
この研究は、マルチモーダル大モデルにおけるスペクトル理解を強化するための重要なステップであり、より広い科学的研究とデータ分析に視覚言語モデルを拡張するための有望な方向性を提案する。
論文 参考訳(メタデータ) (2026-04-30T15:51:10Z) - SpectrumFM: Redefining Spectrum Cognition via Foundation Modeling [65.65474629224558]
本稿ではスペクトル認識のための新しいパラダイムを提供するスペクトルFMと呼ばれるスペクトル基盤モデルを提案する。
畳み込みニューラルネットワークを利用した革新的なスペクトルエンコーダを提案し、スペクトルデータにおける微細な局所信号構造と高レベルのグローバルな依存関係の両方を効果的に捕捉する。
2つの新しい自己教師型学習タスク、すなわちマスク付き再構成と次のスロット信号予測が、SpectrumFMの事前学習のために開発され、モデルがリッチで伝達可能な表現を学習できるようにする。
論文 参考訳(メタデータ) (2025-08-02T14:40:50Z) - DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models [68.19129717255053]
本稿では、分子構造解明を条件生成プロセスとして定式化する生成フレームワークであるDiffSpectraについて述べる。
我々の実験では、DiffSpectraが分子構造を正確に解明し、40.76%のトップ-1と99.49%のトップ10を達成している。
論文 参考訳(メタデータ) (2025-07-09T13:57:20Z) - SpecCLIP: Aligning and Translating Spectroscopic Measurements for Stars [6.314253302704276]
我々は、LLMにインスパイアされた方法論を恒星スペクトル分析に拡張する基盤モデルフレームワークであるSpecCLIPを提案する。
大規模データセットの基盤モデルをトレーニングすることで、さまざまな下流アプリケーションをサポートする堅牢で情報に富んだ埋め込みを学ぶことが私たちのゴールです。
これらのモデルを中規模ラベル付きデータセットに微調整することで、恒星パラメータ推定や化学特性決定といったタスクへの適応性が向上することを示した。
論文 参考訳(メタデータ) (2025-07-02T17:49:52Z) - CARL: Camera-Agnostic Representation Learning for Spectral Image Analysis [69.02751635551724]
スペクトルイメージングは、医療や都市景観の理解など、様々な領域で有望な応用を提供する。
スペクトルカメラのチャネル次元と捕獲波長のばらつきは、AI駆動方式の開発を妨げる。
本稿では,RGB,マルチスペクトル,ハイパースペクトル画像を用いたカメラ非依存表現学習モデルCARLを紹介する。
論文 参考訳(メタデータ) (2025-04-27T13:06:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。