論文の概要: VALID-Mol: a Systematic Framework for Validated LLM-Assisted Molecular Design
- arxiv url: http://arxiv.org/abs/2506.23339v1
- Date: Sun, 29 Jun 2025 17:17:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.835454
- Title: VALID-Mol: a Systematic Framework for Validated LLM-Assisted Molecular Design
- Title(参考訳): VALID-Mol:LCM支援分子設計のための体系的枠組み
- Authors: Malikussaid, Hilal Hudan Nuha,
- Abstract要約: 大規模言語モデル(LLM)と化学検証を統合するためのフレームワークであるVALID-Molを提案する。
提案手法は, メソジカル・プロンプト・エンジニアリング, 自動ケミカル・バリデーション, 微調整ドメイン適応LDMを組み合わせることで, 合成可能な分子を確実に生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large Language Models (LLMs) demonstrate remarkable potential for scientific discovery, but their application in domains requiring factual accuracy and domain-specific constraints remains challenging. In molecular design for drug discovery, LLMs can suggest creative molecular modifications but often produce chemically invalid or impractical structures. We present VALID-Mol, a systematic framework for integrating chemical validation with LLM-driven molecular design that increases the rate of generating valid chemical structures from 3% to 83%. Our approach combines methodical prompt engineering, automated chemical validation, and a fine-tuned domain-adapted LLM to ensure reliable generation of synthesizable molecules with improved properties. Beyond the specific implementation, we contribute a generalizable methodology for scientifically-constrained LLM applications, with quantifiable reliability improvements. Computational predictions suggest our framework can generate promising candidates for synthesis with up to 17-fold computationally predicted improvements in target affinity while maintaining synthetic accessibility. We provide a detailed analysis of our prompt engineering process, validation architecture, and fine-tuning approach, offering a reproducible blueprint for applying LLMs to other scientific domains where domain-specific validation is essential.
- Abstract(参考訳): 大規模言語モデル (LLM) は科学的発見に顕著な可能性を示しているが、事実の正確性や領域固有の制約を必要とする領域への応用は依然として困難である。
薬物発見のための分子設計では、LSMは創造的な分子修飾を提案できるが、しばしば化学的に無効または非実用的な構造を生成する。
VALID-Molは化学バリデーションとLCM駆動の分子設計を統合するための体系的なフレームワークであり、有効な化学構造の生成速度を3%から83%に向上させる。
提案手法は, メソジカル・プロンプト・エンジニアリング, 自動ケミカル・バリデーション, 微調整ドメイン適応LDMを組み合わせることで, 信頼性の高い合成可能な分子の創出と特性の向上を両立させる。
具体的実装の他に、科学的に制約されたLLMアプリケーションのための一般化可能な方法論を提供し、信頼性を定量的に改善する。
計算的予測により,本フレームワークは,合成アクセシビリティを維持しつつ,目標親和性の向上を最大17倍の予測で予測できる可能性が示唆された。
ドメイン固有の検証が不可欠である他の科学領域にLLMを適用するための再現可能な青写真を提供する。
関連論文リスト
- ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - AutoChemSchematic AI: A Closed-Loop, Physics-Aware Agentic Framework for Auto-Generating Chemical Process and Instrumentation Diagrams [2.5875933818780363]
現在のAI手法では、化学プロセスのスケーリングにおいて重要な役割を担っているにもかかわらず、PFDやPIDを自動生成することはできない。
産業用PFDとPIDの自動生成のための閉ループ対応物理フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-30T13:32:00Z) - Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [20.250683535089617]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
物理的、化学的に詳細なセマンティクスを特異的な分子表現と融合することにより、TransDLMは様々な情報ソースを効果的に統合し、正確な最適化を導く。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - Cross-Modal Learning for Chemistry Property Prediction: Large Language Models Meet Graph Machine Learning [0.0]
グラフニューラルネットワーク(GNN)の分析能力と大規模言語モデル(LLM)の言語生成・予測能力を利用する多モード融合(MMF)フレームワークを提案する。
本フレームワークは,グラフ構造化データのモデリングにおけるGNNの有効性とLLMのゼロショットおよび少数ショット学習能力を組み合わせることにより,オーバーフィッティングのリスクを低減し,予測の改善を実現する。
論文 参考訳(メタデータ) (2024-08-27T11:10:39Z) - Many-Shot In-Context Learning for Molecular Inverse Design [56.65345962071059]
大規模言語モデル(LLM)は、数ショットのインコンテキスト学習(ICL)において、優れたパフォーマンスを示している。
マルチショットICLで利用可能な実験データの不足を克服する,新しい半教師付き学習手法を開発した。
示すように、この新しい手法は、既存の分子設計のためのICL法を大幅に改善し、科学者にとってアクセスしやすく、使いやすくする。
論文 参考訳(メタデータ) (2024-07-26T21:10:50Z) - Integrating Chemistry Knowledge in Large Language Models via Prompt Engineering [2.140221068402338]
本稿では,科学領域における大規模言語モデル(LLM)の性能向上を目的として,ドメイン固有の知識の統合について検討する。
ベンチマークデータセットは、小さな分子の複雑な物理化学的性質、薬理学の薬物性、酵素や結晶材料の機能的特性に適合する。
提案したドメイン知識組み込みのプロンプトエンジニアリング手法は,従来のプロンプトエンジニアリング手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2024-04-22T16:55:44Z) - DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。
DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文 参考訳(メタデータ) (2024-03-07T02:53:40Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z) - Molecular Design in Synthetically Accessible Chemical Space via Deep
Reinforcement Learning [0.0]
既存の生成法は、最適化中に分子特性の分布を好適にシフトできる能力に制限されていると論じる。
本稿では,分子設計のための新しい強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-29T16:29:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。