論文の概要: KnowMol: Advancing Molecular Large Language Models with Multi-Level Chemical Knowledge
- arxiv url: http://arxiv.org/abs/2510.19484v1
- Date: Wed, 22 Oct 2025 11:23:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.736512
- Title: KnowMol: Advancing Molecular Large Language Models with Multi-Level Chemical Knowledge
- Title(参考訳): KnowMol: マルチレベル化学知識による分子大言語モデルの改善
- Authors: Zaifei Yang, Hong Chang, Ruibing Hou, Shiguang Shan, Xilin Chen,
- Abstract要約: KnowMol-100Kは100Kの微細な分子アノテーションを持つ大規模データセットである。
また,既存の分子表現戦略の限界に効果的に対処する,化学的に不変な分子表現も提案する。
KnowMolは、分子理解および生成タスク間で優れたパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 73.51130155601824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The molecular large language models have garnered widespread attention due to their promising potential on molecular applications. However, current molecular large language models face significant limitations in understanding molecules due to inadequate textual descriptions and suboptimal molecular representation strategies during pretraining. To address these challenges, we introduce KnowMol-100K, a large-scale dataset with 100K fine-grained molecular annotations across multiple levels, bridging the gap between molecules and textual descriptions. Additionally, we propose chemically-informative molecular representation, effectively addressing limitations in existing molecular representation strategies. Building upon these innovations, we develop KnowMol, a state-of-the-art multi-modal molecular large language model. Extensive experiments demonstrate that KnowMol achieves superior performance across molecular understanding and generation tasks. GitHub: https://github.com/yzf-code/KnowMol Huggingface: https://hf.co/datasets/yzf1102/KnowMol-100K
- Abstract(参考訳): 分子言語モデルは、分子応用に期待できる可能性から、広く注目を集めている。
しかし、現在の分子大規模言語モデルでは、事前学習中にテキスト記述が不十分なことや、最適分子表現戦略が不十分であることから、理解分子の重大な制限に直面している。
これらの課題に対処するために,100Kの微細な分子アノテーションを持つ大規模データセットであるKnowMol-100Kを導入し,分子とテキスト記述のギャップを埋める。
さらに, 既存の分子表現戦略の限界を効果的に解決する, 化学的不変な分子表現を提案する。
これらの革新に基づいて、我々は最先端のマルチモーダル分子大言語モデルである KnowMol を開発した。
大規模な実験により、KnowMolは分子理解および生成タスクにおいて優れた性能を発揮することが示された。
GitHub: https://github.com/yzf-code/KnowMol Huggingface: https://hf.co/datasets/yzf1102/KnowMol-100K
関連論文リスト
- Mol-LLaMA: Towards General Understanding of Molecules in Large Molecular Language Model [52.84455878597969]
Mol-LLaMAは、分子を中心とした一般的な知識を把握した大きな分子言語モデルである。
分子理解を改善するために,分子エンコーダの相補的な情報を統合するモジュールを提案する。
論文 参考訳(メタデータ) (2025-02-19T05:49:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。