論文の概要: A Multi-task Large Reasoning Model for Molecular Science
- arxiv url: http://arxiv.org/abs/2603.12808v1
- Date: Fri, 13 Mar 2026 09:10:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-16 17:38:12.010257
- Title: A Multi-task Large Reasoning Model for Molecular Science
- Title(参考訳): 分子科学のためのマルチタスク大共振モデル
- Authors: Pengfei Liu, Shuang Ge, Jun Tao, Zhixiang Ren,
- Abstract要約: 既存の分子モデルは主にプロプライエタリであり、一般的な分子知性と一般化性に欠ける。
本稿では,分子科学者の認知過程をエミュレートする多タスク大推論モデルを提案する。
提案手法は,多種多様な分子知識とチェーン・オブ・シント・フレームワークを提供するために,多種特異モジュールを組み込んだものである。
- 参考スコア(独自算出の注目度): 18.982671762545348
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Advancements in artificial intelligence for molecular science are necessitating a paradigm shift from purely data-driven predictions to knowledge-guided computational reasoning. Existing molecular models are predominantly proprietary, lacking general molecular intelligence and generalizability. This underscores the necessity for computational methods that can effectively integrate scientific logic with deep learning architectures. Here we introduce a multi-task large reasoning model designed to emulate the cognitive processes of molecular scientists through structured reasoning and reflection. Our approach incorporates multi-specialist modules to provide versatile molecular expertise and a chain-of-thought (CoT) framework enhanced by reinforcement learning infused with molecular knowledge, enabling structured and reflective reasoning. Systematic evaluations across 10 molecular tasks and 47 metrics demonstrate that our model achieves an average 50.3% improvement over the base architecture, outperforming over 20 state-of-the-art baselines, including ultra-large-parameter foundation models, despite using significantly fewer training data and computational resources. This validates that embedding explicit reasoning mechanisms enables high-efficiency learning, allowing smaller-scale models to surpass massive counterparts in both efficacy and interpretability. The practical utility of this computational framework was validated through a case study on the design of central nervous system (CNS) drug candidates, illustrating its capacity to bridge data-driven and knowledge-integrated approaches for intelligent molecular design.
- Abstract(参考訳): 分子科学のための人工知能の進歩は、純粋にデータ駆動型予測から知識誘導型計算推論へのパラダイムシフトを必要としている。
既存の分子モデルは主にプロプライエタリであり、一般的な分子知性と一般化性に欠ける。
このことは、科学的論理とディープラーニングアーキテクチャを効果的に統合できる計算方法の必要性を浮き彫りにする。
ここでは、分子科学者の認知過程を構造的推論と反射によってエミュレートする多タスク大推論モデルを紹介する。
提案手法は多種多種多種多様な分子知識を提供するモジュールと,分子知識を取り入れた強化学習により強化されたチェーン・オブ・シント(CoT)フレームワークを取り入れ,構造的・反射的推論を可能にした。
10の分子タスクと47のメトリクスの体系的評価により、我々のモデルはベースアーキテクチャよりも平均50.3%向上し、非常に少ないトレーニングデータと計算資源を使用しながら、超大規模パラメータ基礎モデルを含む20以上の最先端のベースラインを上回ります。
このことは、明示的な推論機構を組み込むことで、高効率な学習を可能にし、より小規模のモデルが、有効性と解釈可能性の両方において巨大なモデルを上回ることを証明している。
この計算フレームワークの実用性は、中央神経系(CNS)薬物候補の設計に関するケーススタディを通じて検証され、インテリジェント分子設計のためのデータ駆動および知識統合アプローチを橋渡しする能力を示した。
関連論文リスト
- Agentic reinforcement learning empowers next-generation chemical language models for molecular design and synthesis [51.83339196548892]
ChemCraftは、知識ストレージから化学推論を分離する新しいフレームワークである。
ChemCraftは最小の推論コストで優れたパフォーマンスを実現する。
この研究は、AI支援化学のコスト効率とプライバシ保護のパラダイムを確立する。
論文 参考訳(メタデータ) (2026-01-25T04:23:34Z) - Foundation Models for Discovery and Exploration in Chemical Space [57.97784111110166]
MISTは、大規模なラベルなしデータセットに基づいて訓練された分子基盤モデルのファミリーである。
我々は、これらのモデルが化学空間をまたいだ現実世界の問題を解決する能力を実証する。
論文 参考訳(メタデータ) (2025-10-20T17:56:01Z) - Reasoning-Enhanced Large Language Models for Molecular Property Prediction [19.593493317167646]
分子特性予測は、薬物発見と物質科学にとって不可欠である。
既存のアプローチは、限定的な解釈可能性、クロスタスクの一般化の貧弱、化学的推論能力の欠如に悩まされている。
分子特性予測に化学推論を組み込んだ多モーダル大言語モデルMPPReasonerを提案する。
論文 参考訳(メタデータ) (2025-10-11T15:05:45Z) - $\text{M}^{2}$LLM: Multi-view Molecular Representation Learning with Large Language Models [59.125833618091846]
分子構造ビュー,分子タスクビュー,分子規則ビューの3つの視点を統合した多視点フレームワークを提案する。
実験によると、$textM2$LLMは、分類タスクと回帰タスクをまたいだ複数のベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-08-12T05:46:47Z) - Molecular Dynamics and Machine Learning Unlock Possibilities in Beauty Design -- A Perspective [16.91569591356659]
計算分子設計は、機械学習と分子動力学のアプローチによって支援された様々なミッションで分子を設計する試みである。
これらの技術は、寿命を延ばすだけでなく、その美しさを発揮できるほど成熟していると我々は主張する。
この観点から、スキンケア製品の研究・開発における現在のフロンティアと、この業界の課題に対処する統計的・物理的ツールボックスを概観する。
論文 参考訳(メタデータ) (2024-10-08T13:30:27Z) - A quantitative analysis of knowledge-learning preferences in large language models in molecular science [24.80165173525286]
大規模言語モデル(LLM)は、自然言語処理(NLP)の観点から科学的問題に取り組むための新しい研究パラダイムを導入している。
LLMは分子の理解と生成を著しく強化し、しばしば複雑な分子パターンをデコードし合成する能力で既存の手法を超越している。
我々は、ChEBI-20-MMというマルチモーダルベンチマークを提案し、モデルとデータモダリティとの互換性と知識獲得を評価する1263の実験を行った。
論文 参考訳(メタデータ) (2024-02-06T16:12:36Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。