論文の概要: How Creative Are Large Language Models in Generating Molecules?
- arxiv url: http://arxiv.org/abs/2604.18031v1
- Date: Mon, 20 Apr 2026 09:57:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.797667
- Title: How Creative Are Large Language Models in Generating Molecules?
- Title(参考訳): 分子生成における大規模言語モデルはいかに創造的か?
- Authors: Wen Tao, Yiwei Wang, Peng Zhou, Bryan Hooi, Wanlong Fang, Tianle Zhang, Xiao Luo, Yuansheng Liu, Alvin Chan,
- Abstract要約: 大規模言語モデル(LLM)は、自然言語プロンプトから直接分子表現を生成することができる。
私たちの研究は、分子生成に必要な能力を創造性として再編成した最初のものです。
- 参考スコア(独自算出の注目度): 63.331894720250624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecule generation requires satisfying multiple chemical and biological constraints while searching a large and structured chemical space. This makes it a non-binary problem, where effective models must identify non-obvious solutions under constraints while maintaining exploration to improve success by escaping local optima. From this perspective, creativity is a functional requirement in molecular generation rather than an aesthetic notion. Large language models (LLMs) can generate molecular representations directly from natural language prompts, but it remains unclear what type of creativity they exhibit in this setting and how it should be evaluated. In this work, we study the creative behavior of LLMs in molecular generation through a systematic empirical evaluation across physicochemical, ADMET, and biological activity tasks. We characterize creativity along two complementary dimensions, convergent creativity and divergent creativity, and analyze how different factors shape these behaviors. Our results indicate that LLMs exhibit distinct patterns of creative behavior in molecule generation, such as an increase in constraint satisfaction when additional constraints are imposed. Overall, our work is the first to reframe the abilities required for molecule generation as creativity, providing a systematic understanding of creativity in LLM-based molecular generation and clarifying the appropriate use of LLMs in molecular discovery pipelines.
- Abstract(参考訳): 分子生成は、大規模で構造化された化学空間を探索しながら、複数の化学的および生物学的制約を満たす必要がある。
これは非バイナリ問題であり、実効的なモデルでは、制約の下で非オブザードな解を識別し、局所最適解を逃れることにより、改善のための探索を継続しなければならない。
この観点から見れば、創造性は美的概念ではなく分子生成における機能的な要件である。
大規模言語モデル(LLM)は、自然言語のプロンプトから直接分子表現を生成することができるが、どのような創造性を示すのか、どのように評価されるべきなのかは不明である。
本研究では, 分子生成におけるLDMの創造的挙動を, 物理化学, ADMET, 生物活性タスクの体系的評価を通じて研究する。
創造性は2つの相補的な側面、収束した創造性と分岐した創造性に沿って特徴づけられ、異なる要因がこれらの行動をどのように形成するかを分析する。
以上の結果から, LLMは分子生成において, 付加的な制約が課される際の制約満足度の増加など, 創造的行動の異なるパターンを示すことが示唆された。
全体として、我々の研究は、分子生成に必要な能力を創造性として再構成し、LLMベースの分子生成における創造性を体系的に理解し、分子発見パイプラインにおけるLLMの適切な使用を明確にする最初のものである。
関連論文リスト
- MolRGen: A Training and Evaluation Setting for De Novo Molecular Generation with Reasonning Models [48.34354151490484]
我々は、推論に基づく大規模言語モデルのトレーニングと評価のためのベンチマークとデータセットであるMorRGenを紹介する。
まず,textitde novo分子生成と特性予測のためのモデルの評価と訓練を行う。
第2に、生成分子の品質と多様性の両方をキャプチャする、多様性を意識した新しいトップ・ドルスコアを導入する。
論文 参考訳(メタデータ) (2026-03-18T20:21:04Z) - $\text{M}^{2}$LLM: Multi-view Molecular Representation Learning with Large Language Models [59.125833618091846]
分子構造ビュー,分子タスクビュー,分子規則ビューの3つの視点を統合した多視点フレームワークを提案する。
実験によると、$textM2$LLMは、分類タスクと回帰タスクをまたいだ複数のベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-08-12T05:46:47Z) - MolMiner: Towards Controllable, 3D-Aware, Fragment-Based Molecular Design [7.366789601705544]
MolMinerは、分子設計のための断片的、幾何学的、秩序に依存しない自己回帰モデルである。
MolMinerは12個以上の性質を持つ分子の条件生成をサポートし、物理化学的および構造的標的に対して柔軟な制御を可能にする。
論文 参考訳(メタデータ) (2024-11-10T22:00:55Z) - MolTRES: Improving Chemical Language Representation Learning for Molecular Property Prediction [14.353313239109337]
MolTRESは化学言語表現学習フレームワークである。
ジェネレータと識別器のトレーニングが組み込まれており、より難しい例からモデルを学習することができる。
我々のモデルは、一般的な分子特性予測タスクにおける既存の最先端モデルよりも優れています。
論文 参考訳(メタデータ) (2024-07-09T01:14:28Z) - Creativity Has Left the Chat: The Price of Debiasing Language Models [1.223779595809275]
大規模言語モデル(LLM)の創造性に対する人間からのフィードバックからの強化学習の意図しない結果について検討する。
我々の発見は、コピーライティング、広告作成、顧客ペルソナ生成といったクリエイティブなタスクにLLMを頼っているマーケターにとって大きな意味を持つ。
論文 参考訳(メタデータ) (2024-06-08T22:14:51Z) - Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [49.64512917330373]
本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。
TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。
我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文 参考訳(メタデータ) (2024-03-20T02:15:55Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。