論文の概要: Closing the Prior-Posterior Loop: Self-Reflective Molecular Design with Analysis-Driven LLM Iteration
- arxiv url: http://arxiv.org/abs/2606.09520v1
- Date: Mon, 08 Jun 2026 14:09:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:07.177074
- Title: Closing the Prior-Posterior Loop: Self-Reflective Molecular Design with Analysis-Driven LLM Iteration
- Title(参考訳): 先行ループの閉鎖:解析駆動型LCM反復による自己反射分子設計
- Authors: Junyi Gong, Zijie Qiu, Ben Zhong Tang,
- Abstract要約: 単一数を物理化学的理性に置き換えることで,LSMを因果的理性へと変換することを示す。
我々のシステムは、軌道エネルギー、原子電荷、電子密度を供給する自己反射モジュールで、検索強化世代を結合する。
- 参考スコア(独自算出の注目度): 0.15293427903448023
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Can a general-purpose large language model design molecules with the precision of a seasoned chemist? Current LLM-based frameworks answer this question with scalar feedback loops-generate, score, reject-that amount to informed trial-and-error. Here we show that replacing a single number with the full physicochemical rationale from first-principles calculations transforms the LLM from a stochastic sampler into a causal reasoner. Our system couples retrieval-augmented generation with a self-reflection module that feeds orbital energies, atomic charges, and electron densities-rather than compressed scores-back into the design loop. On HOMO-LUMO gap targets from 1.0 to 5.0 eV, this structure-property-relationship (SPR) reflection achieves a deviation as low as 0.0003 eV and a 100% success rate on moderate tasks, decisively outperforming scalar-feedback and non-reflective baselines. The framework generalizes seamlessly to dipole-moment design and proves robust across five distinct LLM backbones. These results establish a new paradigm: when the model understands not only that a molecule fails, but why, iterative molecular design becomes genuinely mechanistic.
- Abstract(参考訳): 調味化学者の精度を考慮した汎用大規模言語モデル設計分子は可能か?
現在のLLMベースのフレームワークはこの質問に答え、スカラーフィードバックループの生成、スコア、リジェクションの量によって、インフォームドトライアルとエラーに対処している。
ここでは、第一原理計算から1つの数に完全物理化学的理性を持たせることで、確率的サンプリング器から因果的推論器へとLLMを変換することを示す。
我々のシステムは、圧縮されたスコアではなく、軌道エネルギー、原子電荷、電子密度を設計ループにフィードバックする自己反射モジュールと、検索強化世代を結合する。
HOMO-LUMOギャップターゲットの1.0から5.0eVでは、この構造確率関係(SPR)反射は0.0003eVの偏差と、適度なタスクにおける100%の成功率を達成し、スカラーフィードバックと非反射ベースラインを決定的に上回る。
このフレームワークはダイポールモーメント設計にシームレスに一般化し、5つの異なるLCMバックボーンで堅牢であることを示す。
これらの結果は新しいパラダイムを確立し、モデルが分子が失敗するだけでなく、なぜ反復的な分子設計が真に機械的になるのかを理解する。
関連論文リスト
- MolLingo: Molecule-Native Representations for LLM-Powered Scientific Agents [57.28652712579434]
分子設計を自動化するために化学者の推論過程をエミュレートするマルチエージェントシステムであるMolLingoを提案する。
MolLingoは、共有メモリモジュールを通じて、文学エージェント、化学エージェント、オーケストレーションをコーディネートすることで、この問題に対処する。
初期治療設計におけるケーススタディとして、MolLingoは、結合部位の幾何学と残基レベルのタンパク質コンテキストにおけるChemist Agentの推論を根拠にしている。
論文 参考訳(メタデータ) (2026-05-27T02:11:23Z) - From Residuals to Reasons: LLM-Guided Mechanism Inference from Tabular Data [10.795877029195845]
科学的応用のための機械学習における永続的な課題は、予測と理解を共同で達成することである。
マルチエージェント残差文脈学習(MARICL)を導入する。
MARICLは、すべてのデータセットのベースモデルに対して一貫して改善されている。
論文 参考訳(メタデータ) (2026-05-21T15:34:08Z) - Proteo-R1: Reasoning Foundation Models for De Novo Protein Design [129.2825640976092]
推論誘導型タンパク質設計フレームワークであるbfProteo-R1を紹介する。
アンフェロメトリ生成から分子内理解を分離する。
Proteo-R1は、最新の幾何学的生成モデルと推論の安定、解釈可能、モジュール的な統合を実現する。
論文 参考訳(メタデータ) (2026-05-01T06:52:27Z) - RxnNano:Training Compact LLMs for Chemical Reaction and Retrosynthesis Prediction via Hierarchical Curriculum Learning [20.904697361501174]
私たちは、これらの知識をモデルに取り入れることが、中心的な課題であると主張している。
3つの重要な革新を通じて,化学的な理解を大規模に優先する統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2026-02-10T07:42:23Z) - How well can off-the-shelf LLMs elucidate molecular structures from mass spectra using chain-of-thought reasoning? [51.286853421822705]
大規模言語モデル (LLM) は推論集約的な科学的タスクを約束するが、化学的解釈の能力はまだ不明である。
我々は、分子構造を予測するために、LLMが質量スペクトルデータに対してどのように理由を持つかを評価する、Chain-of-Thought(CoT)プロンプトフレームワークとベンチマークを導入する。
SMILESの妥当性, 式整合性, 構造的類似性の指標による評価の結果, LLMは合成学的に有効で, 部分的に可視な構造を生成できるが, 分子予測の正確性やリンク推論を達成できないことがわかった。
論文 参考訳(メタデータ) (2026-01-09T20:08:42Z) - Learning to Reason in LLMs by Expectation Maximization [55.721496945401846]
我々は推論を潜在変数モデルとして定式化し、推論を学ぶための期待最大化目標を導出する。
この見解はEMと現代の報酬に基づく最適化を結びつけるものであり、正しい答えを正当化する有理性を生成するサンプリング分布を設計することの主な課題であることを示している。
論文 参考訳(メタデータ) (2025-12-23T08:56:49Z) - MoRA: On-the-fly Molecule-aware Low-Rank Adaptation Framework for LLM-based Multi-Modal Molecular Assistant [23.60380089071549]
そこで本研究では,各分子のインスタンス固有のパラメータ空間アライメント手法を提案する。
MoRAは入力分子グラフごとに一意に低ランク適応重みを生じる。
実験により、MoRAのインスタンス固有の動的適応は静的適応ベースラインよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-10-14T07:54:43Z) - MolReasoner: Toward Effective and Interpretable Reasoning for Molecular LLMs [30.030008221150407]
MolReasonerは、大規模言語モデルを記憶から化学推論に移行するために設計された2段階のフレームワークである。
まず,GPT-4o で生成した合成Chain-of-Thought(CoT) サンプルを用いてモデルの推論能力を初期化し,化学的精度を検証した Mol-SFT を提案する。
その後、Moll-RLは、化学構造と言語的記述との整合性を明確に設計した特殊報酬関数による強化学習を適用した。
論文 参考訳(メタデータ) (2025-08-04T05:10:11Z) - Rao-Blackwell Gradient Estimators for Equivariant Denoising Diffusion [55.95767828747407]
分子やタンパク質の生成のようなドメインでは、物理系はモデルにとって重要な固有の対称性を示す。
学習のばらつきを低減し、確率的に低い分散勾配推定器を提供するフレームワークを提案する。
また,軌道拡散法(Orbit Diffusion)と呼ばれる手法を用いて,損失とサンプリングの手順を取り入れた推定器の実用的実装を提案する。
論文 参考訳(メタデータ) (2025-02-14T03:26:57Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - Predicting molecular dipole moments by combining atomic partial charges
and atomic dipoles [3.0980025155565376]
高レベル結合クラスター理論を用いて計算した分子$boldsymbolmu$を再現するために、「MuML」モデルが組み合わされた。
校正委員会モデルを用いて予測の不確かさを確実に推定できることを実証する。
論文 参考訳(メタデータ) (2020-03-27T14:35:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。