論文の概要: Rethinking Molecular Text Representations for LLMs: An Empirical Study
- arxiv url: http://arxiv.org/abs/2606.03057v1
- Date: Tue, 02 Jun 2026 02:45:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.705376
- Title: Rethinking Molecular Text Representations for LLMs: An Empirical Study
- Title(参考訳): LLMのための分子テキスト表現の再考--実証的研究
- Authors: Arun Raja, Garrett M. Morris, Kian Ming A. Chai,
- Abstract要約: 大規模言語モデル (LLMs) は分子的タスクにますます使われているが、どの分子的表現を使うべきかは定かではない。
推論や非推論型を含む5つのモデルファミリーにわたる16のLSMをベンチマークする。
CMLが最高であり、次にMollJSON、InChI、そして標準SMILESが続く。
- 参考スコア(独自算出の注目度): 1.7197939141715162
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) are increasingly used for molecular tasks, but it remains unclear which molecular representation to use. We present a systematic benchmark evaluating LLM molecular competence across nine representations and eight chemical tasks. We benchmark 16 LLMs across five model families, including reasoning and non-reasoning variants, chemistry-specialized LLMs, and closed frontier models. Performance is strongly representation-dependent and no single representation wins across tasks, though CML is the best, followed by MolJSON, InChI, and then canonical SMILES. Explicit structured text representations (CML and MolJSON) dominate structural tasks; IUPAC dominates semantic tasks, winning molecule retrieval for all 16 LLMs; and SMILES variants are rarely optimal despite their prevalence in pretraining. Chemistry-specialized models perform well with SMILES at the cost of large degradations with structured text representations, suggesting SMILES-only evaluation rewards specialization that does not generalize. Using LLM-as-a-judge, we find that IUPAC produces the highest fraction of correct molecule generations. A mechanistic study via tokenization audits, linear probes and attention shows that representations are encoded differently inside the model; for example, structured representations require higher attention across the molecular span. Our results argue against representation-invariant evaluation and motivate task-aware representation routing for LLM-based chemistry.
- Abstract(参考訳): 大規模言語モデル (LLMs) は分子的タスクにますます使われているが、どの分子的表現を使うべきかは定かではない。
9つの表現と8つの化学タスクにまたがるLCM分子能力を評価する。
我々は5つのモデルファミリーにまたがる16のLSMをベンチマークし、推論と非推論の変種、化学特化LSM、クローズドフロンティアモデルを含む。
パフォーマンスは強い表現依存であり、タスク間で単一の表現が勝利することはないが、CMLが最高であり、次にMollJSON、InChI、そして標準SMILESが続く。
明示的な構造化されたテキスト表現 (CML と MolJSON) は構造的タスクを支配し、IUPAC は意味的タスクを支配し、全16 LLM の分子検索に勝利し、SMILES の変異は事前訓練の頻度にもかかわらず最適ではない。
化学特殊化モデルは、構造化されたテキスト表現による大きな劣化を犠牲にしてSMILESとよく機能し、SMILESのみによる評価は、一般化しない特殊化に報いることを示唆している。
LLM-as-a-judgeを用いて、IUPACは正しい分子生成の最も少ない部分を生成する。
トークン化監査(英語版)、線形プローブ(英語版)およびアテンション(英語版)による力学的な研究は、表現がモデル内で異なるエンコードされていることを示している。
本研究は, LLMに基づく化学の表現不変性評価とタスク認識表現ルーティングのモチベーションについて論じる。
関連論文リスト
- MolLingo: Molecule-Native Representations for LLM-Powered Scientific Agents [57.28652712579434]
分子設計を自動化するために化学者の推論過程をエミュレートするマルチエージェントシステムであるMolLingoを提案する。
MolLingoは、共有メモリモジュールを通じて、文学エージェント、化学エージェント、オーケストレーションをコーディネートすることで、この問題に対処する。
初期治療設計におけるケーススタディとして、MolLingoは、結合部位の幾何学と残基レベルのタンパク質コンテキストにおけるChemist Agentの推論を根拠にしている。
論文 参考訳(メタデータ) (2026-05-27T02:11:23Z) - How well can off-the-shelf LLMs elucidate molecular structures from mass spectra using chain-of-thought reasoning? [51.286853421822705]
大規模言語モデル (LLM) は推論集約的な科学的タスクを約束するが、化学的解釈の能力はまだ不明である。
我々は、分子構造を予測するために、LLMが質量スペクトルデータに対してどのように理由を持つかを評価する、Chain-of-Thought(CoT)プロンプトフレームワークとベンチマークを導入する。
SMILESの妥当性, 式整合性, 構造的類似性の指標による評価の結果, LLMは合成学的に有効で, 部分的に可視な構造を生成できるが, 分子予測の正確性やリンク推論を達成できないことがわかった。
論文 参考訳(メタデータ) (2026-01-09T20:08:42Z) - How to Make Large Language Models Generate 100% Valid Molecules? [82.89165081942201]
大規模言語モデル(LLM)は、いくつかの例から幅広いタスクを実行することを学べる。
SMILESのような表現を使って有効な分子を生成することは、数ショット設定でLLMにとって難しい。
無効なSMILES訂正のためのクロスケミカル言語フレームワークであるSmiSelfを紹介する。
論文 参考訳(メタデータ) (2025-09-27T04:14:19Z) - Improving Chemical Understanding of LLMs via SMILES Parsing [18.532188836688928]
CLEANMOLは、SMILES解析をクリーンで決定論的タスクのスイートに定式化する新しいフレームワークである。
適応的難易度スコアリングを伴う分子事前学習データセットを構築し,これらの課題に対してオープンソースのLCMを事前学習する。
以上の結果から,CLEANMOLは構造的理解を高めるだけでなく,Moll-Instructionsベンチマークのベースラインと競合する。
論文 参考訳(メタデータ) (2025-05-22T07:54:39Z) - ChemMLLM: Chemical Multimodal Large Language Model [52.95382215206681]
分子理解と生成のための化学多モーダル大規模言語モデルであるChemMLLMを提案する。
また、テキスト、分子SMILES文字列、画像にまたがる5つのマルチモーダルタスクを設計し、データセットをキュレートする。
実験結果から,ChemMLLMは評価された全てのタスクにおいて優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-05-22T07:32:17Z) - MolX: Enhancing Large Language Models for Molecular Understanding With A Multi-Modal Extension [44.97089022713424]
タスクハンドリング能力の強い大規模言語モデル(LLM)は、様々な分野において顕著な進歩を見せている。
本研究は, 分子の理解能力を高めるために, MolX と呼ばれるマルチモーダル外部モジュールを組み込むことにより, LLM の分子理解能力を高めることを目的とする。
手作りの分子指紋は、その埋め込みドメイン知識を活用するために組み込まれている。
論文 参考訳(メタデータ) (2024-06-10T20:25:18Z) - Empowering Molecule Discovery for Molecule-Caption Translation with Large Language Models: A ChatGPT Perspective [53.300288393173204]
大規模言語モデル(LLM)は、様々なクロスモーダルタスクにおいて顕著なパフォーマンスを示している。
本研究では,分子カプセル翻訳のためのインコンテキストFew-Shot Molecule Learningパラダイムを提案する。
分子理解とテキストベースの分子生成を含む分子キャプション翻訳におけるMollReGPTの有効性を評価する。
論文 参考訳(メタデータ) (2023-06-11T08:16:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。