論文の概要: SciCore-Mol: Augmenting Large Language Models with Pluggable Molecular Cognition Modules
- arxiv url: http://arxiv.org/abs/2605.22287v1
- Date: Thu, 21 May 2026 10:37:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.2126
- Title: SciCore-Mol: Augmenting Large Language Models with Pluggable Molecular Cognition Modules
- Title(参考訳): SciCore-Mol: プラガブル分子認識モジュールによる大規模言語モデルの拡張
- Authors: Yuxuan Chen, Changwei Lv, Yunduo Xiao, Zhongjing Du, Daquan Zhou, Yukun Yan, Zheni Zeng, Zhiyuan Liu,
- Abstract要約: SciCore-Molは、離散言語記号とトポロジカル分子または連続反応データの間のギャップを埋めるモジュラーフレームワークである。
SciCore-Molは, 分子理解, 生成, 反応予測, 一般化学知識にまたがる包括的性能を実現する。
この研究は、切り離された、プラグ可能な、柔軟に編成されたモジュールを通じて、大規模言語モデルに科学的専門知識を持たせるための体系的な青写真を提供する。
- 参考スコア(独自算出の注目度): 37.73750078629302
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) are central to the one-for-all intelligent paradigm, but they face a fundamental challenge when dealing with heterogeneous scientific data such as molecules: the inherent gap between discrete linguistic symbols and topological molecular or continuous reaction data leads to significant information loss and semantic noise in text-based reasoning. We propose SciCore-Mol, a modular framework that bridges this gap through three deeply integrated pluggable cognitive modules: a topology-aware perception module, a latent diffusion-based molecular generation module, and a reaction-aware reasoning module. Each module is coupled to the LLM backbone through learned representation interfaces, enabling richer information exchange than is possible with text-only tool feedback. Our experiments on diverse chemical tasks demonstrate that SciCore-Mol achieves strong comprehensive performance across molecular understanding, generation, reaction prediction, and general chemistry knowledge, with an 8B-parameter open-source system that is competitive with and in several dimensions surpasses proprietary large models. This work provides a systematic blueprint for equipping LLMs with scientific expertise through decoupled, pluggable, and flexibly orchestrated modules, with direct implications for drug design, chemical synthesis, and broader scientific discovery.
- Abstract(参考訳): 大規模言語モデル(LLM)は、一対一の知的パラダイムの中心であるが、分子のような異種科学データを扱う際には、根本的な課題に直面している。
SciCore-Molは、このギャップを、トポロジー認識モジュール、潜伏拡散に基づく分子生成モジュール、反応認識推論モジュールの3つの深く統合された認識モジュールを通して橋渡しするモジュラーフレームワークである。
各モジュールは学習した表現インターフェースを通じてLLMバックボーンに結合され、テキストのみのツールフィードバックよりもリッチな情報交換が可能になる。
SciCore-Molは, 分子理解, 生成, 反応予測, 一般化学の知識にまたがって, 8Bパラメートルのオープンソースシステムを用いて, 複数次元のプロプライエタリな大規模モデルに対抗し, 高い包括的性能を達成できることを実証した。
この研究は、薬物設計、化学合成、より広範な科学的発見に直接的な意味を持つ、切り離された、プラグ可能な、柔軟に編成されたモジュールを通じて、科学的な専門知識を持つLLMを装備するための体系的な青写真を提供する。
関連論文リスト
- Agentic reinforcement learning empowers next-generation chemical language models for molecular design and synthesis [51.83339196548892]
ChemCraftは、知識ストレージから化学推論を分離する新しいフレームワークである。
ChemCraftは最小の推論コストで優れたパフォーマンスを実現する。
この研究は、AI支援化学のコスト効率とプライバシ保護のパラダイムを確立する。
論文 参考訳(メタデータ) (2026-01-25T04:23:34Z) - KnowMol: Advancing Molecular Large Language Models with Multi-Level Chemical Knowledge [73.51130155601824]
KnowMol-100Kは100Kの微細な分子アノテーションを持つ大規模データセットである。
また,既存の分子表現戦略の限界に効果的に対処する,化学的に不変な分子表現も提案する。
KnowMolは、分子理解および生成タスク間で優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-10-22T11:23:58Z) - $\text{M}^{2}$LLM: Multi-view Molecular Representation Learning with Large Language Models [59.125833618091846]
分子構造ビュー,分子タスクビュー,分子規則ビューの3つの視点を統合した多視点フレームワークを提案する。
実験によると、$textM2$LLMは、分類タスクと回帰タスクをまたいだ複数のベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-08-12T05:46:47Z) - A quantitative analysis of knowledge-learning preferences in large language models in molecular science [24.80165173525286]
大規模言語モデル(LLM)は、自然言語処理(NLP)の観点から科学的問題に取り組むための新しい研究パラダイムを導入している。
LLMは分子の理解と生成を著しく強化し、しばしば複雑な分子パターンをデコードし合成する能力で既存の手法を超越している。
我々は、ChEBI-20-MMというマルチモーダルベンチマークを提案し、モデルとデータモダリティとの互換性と知識獲得を評価する1263の実験を行った。
論文 参考訳(メタデータ) (2024-02-06T16:12:36Z) - MolTC: Towards Molecular Relational Modeling In Language Models [28.960416816491392]
分子間相互作用予測のための新しい枠組みとして,分子間相互作用予測法(分子間相互作用予測法)を提案する。
我々の実験は4000,000以上の分子対を含む様々なデータセットで実施され、現在のGNNおよびLLMベースラインよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-02-06T07:51:56Z) - GIT-Mol: A Multi-modal Large Language Model for Molecular Science with
Graph, Image, and Text [25.979382232281786]
グラフ,画像,テキスト情報を統合したマルチモーダルな大規模言語モデルであるGIT-Molを紹介する。
特性予測の精度は5%-10%向上し、分子生成の妥当性は20.2%向上した。
論文 参考訳(メタデータ) (2023-08-14T03:12:29Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。