Fugu-MT 論文翻訳(概要): Utilizing Large Language Models in an iterative paradigm with domain feedback for zero-shot molecule optimization

論文の概要: Utilizing Large Language Models in an iterative paradigm with domain feedback for zero-shot molecule optimization

arxiv url: http://arxiv.org/abs/2410.13147v7
Date: Sun, 08 Dec 2024 04:33:07 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-10 16:49:05.222135
Title: Utilizing Large Language Models in an iterative paradigm with domain feedback for zero-shot molecule optimization
Title（参考訳）: ゼロショット分子最適化のためのドメインフィードバックを用いた反復パラダイムにおける大規模言語モデルの利用
Authors: Khiem Le, Nitesh V. Chawla,
Abstract要約: 本稿では,シンプルなドメインフィードバックプロバイダである$textRe3$DFを提案する。 $textRe3$DFは、修飾分子が化学的に無効である場合、外部ツールキットRDKitを使用して分子幻覚を処理する。 20の単価目標に対して、$textRe3$DFはそれぞれ16.96%、20.76%を緩い(textttl)と厳格な(texttts)の閾値で増加させる。
参考スコア（独自算出の注目度）: 21.293944661913386
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Molecule optimization is a critical task in drug discovery to optimize desired properties of a given molecule through chemical modification. Despite Large Language Models (LLMs) holding the potential to efficiently simulate this task by using natural language to direct the optimization, straightforwardly utilizing them shows limited performance. In this work, we facilitate utilizing LLMs in an iterative paradigm by proposing a simple yet highly effective domain feedback provider, namely $\text{Re}^3$DF. In detail, $\text{Re}^3$DF harnesses an external toolkit, RDKit, to handle the molecule hallucination, if the modified molecule is chemically invalid. Otherwise, its desired properties are computed and compared to the original one, establishing reliable domain feedback with correct direction and distance towards the objective, followed by a retrieved example, to guide the LLM to refine the modified molecule. We conduct experiments across both single- and multi-property objectives with 2 thresholds, where $\text{Re}^3$DF shows significant improvements. Particularly, for 20 single-property objectives, $\text{Re}^3$DF enhances Hit ratio by 16.96% and 20.76% under loose (\texttt{l}) and strict (\texttt{s}) thresholds, respectively. For 32 multi-property objectives, $\text{Re}^3$DF enhances Hit ratio by 6.04% and 5.25%.
Abstract（参考訳）: 分子最適化は、化学修飾によって与えられた分子の望ましい性質を最適化する薬物発見において重要な課題である。大きな言語モデル(LLM)は、自然言語を使って最適化を指示することで、このタスクを効率的にシミュレートする可能性を秘めているが、直接的に利用すると、性能は限られている。本研究では,シンプルなドメインフィードバックプロバイダ,すなわち$\text{Re}^3$DFを提案することで,LCMを反復パラダイムで活用しやすくする。詳しくは、$\text{Re}^3$DFは、修飾された分子が化学的に無効である場合、外部ツールキットRDKitを用いて分子幻覚を処理する。そうでなければ、その望ましい性質は計算され、元の特性と比較され、目的に向かって正しい方向と距離で信頼できるドメインフィードバックが確立され、次に、LLMを誘導して修飾された分子を洗練させる。 2つのしきい値を持つ単目的と多目的の両方で実験を行い、$\text{Re}^3$DFは大幅な改善を示す。特に、20個の単値目的に対して、$\text{Re}^3$DFは、それぞれ16.96%、20.76%を緩い(\texttt{l})と厳密な(\texttt{s})閾値で増加させる。 32の多目的に対して、$\text{Re}^3$DFはヒット率を6.04%と5.25%向上させる。

関連論文リスト

DrugR: Optimizing Molecular Drugs through LLM-based Explicit Reasoning [24.70952870676648]
DrugRは、明示的で段階的な薬理学的推論を最適化プロセスに導入する、大きな言語モデルである。提案手法は, ドメイン固有の事前学習, 逆データ工学による微調整, 自己バランス型多粒性強化学習を統合した。実験結果から、Dr.Rは構造的類似性や標的結合親和性を損なうことなく、複数の特性を包括的に拡張できることが示された。
論文参考訳（メタデータ） (2026-02-09T02:26:25Z)
SEISMO: Increasing Sample Efficiency in Molecular Optimization with a Trajectory-Aware LLM Agent [0.7377073690542307]
オンライン推論時間分子最適化エージェントSEISMOを紹介する。集団ベースの学習やバッチ学習を必要とせずに、すべてのオラクルコール後に更新される。従来の方法よりも曲線の2～3倍高い面積を達成し、50オラクルコール以内のタスクスコアに到達することが多い。
論文参考訳（メタデータ） (2026-01-31T11:23:48Z)
An Auditable Agent Platform For Automated Molecular Optimisation [0.0]
薬物発見は、データ、専門知識、ツールが散在すると、しばしば勢いを失う。このループを短くするため、分子最適化を自動化するエージェントフレームワークを使用した階層的なツールを構築しました。
論文参考訳（メタデータ） (2025-08-05T13:41:32Z)
Large Language Models for Controllable Multi-property Multi-objective Molecule Optimization [2.152507712409726]
我々はC-MuMOInstructを紹介した。C-MuMOInstructは、明示的でプロパティ固有の目的を持つマルチプロパティ最適化に焦点を当てた最初の命令チューニングデータセットである。 GeLLMO-Cs は命令調整型 LLM で,目標となるプロパティ固有の最適化を行うことができる。実験の結果,GeLLMO-Csは高いベースラインを一貫して上回り,最大126%の成功率を達成した。
論文参考訳（メタデータ） (2025-05-29T20:29:14Z)
$\mathtt{GeLLM^3O}$: Generalizing Large Language Models for Multi-property Molecule Optimization [2.152507712409726]
大規模言語モデル(LLM)は、新しいタスクに対するドメイン外の顕著な一般化性を示す。我々は、複雑なマルチプロパティ分子最適化タスクに特化して、最初の高品質な命令チューニングデータセットである$mathttMoMUInstruct$を紹介した。 $mathttGeLLM3O$sは一貫して最先端のベースラインを上回っている。
論文参考訳（メタデータ） (2025-02-19T03:14:11Z)
DrugImproverGPT: A Large Language Model for Drug Optimization with Fine-Tuning via Structured Policy Optimization [53.27954325490941]
大規模言語モデル(LLM)の微調整は、特定の目的に向けて結果を生成するために不可欠である。本研究は,薬物最適化LSMに基づく生成モデルを微調整するための新しい強化学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2025-02-11T04:00:21Z)
Automatic Annotation Augmentation Boosts Translation between Molecules and Natural Language [7.458295743918249]
本稿では,Language-based Automatic AugmentationフレームワークであるLA$3$を紹介した。 LA$3$の有効性を示すために、LaChEBI-20という拡張データセットを作成し、確立したデータセットから分子のアノテーションを書き換える。ベンチマークアーキテクチャに基づいてLaMolT5をトレーニングし、分子表現と拡張アノテーションのマッピングを学習する。
論文参考訳（メタデータ） (2025-02-10T16:29:21Z)
Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [77.50732023411811]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。 TransDLMは標準化された化学命名法を分子の意味表現として利用し、プロパティ要求をテキスト記述に暗黙的に埋め込む。提案手法は, 分子構造類似性を最適化し, ベンチマークデータセットの化学的特性を向上するための最先端手法を超越した手法である。
論文参考訳（メタデータ） (2024-10-17T14:30:27Z)
XMOL: Explainable Multi-property Optimization of Molecules [2.320539066224081]
複数の分子特性を同時に最適化するために,分子のマルチプロパティ最適化(XMOL)を提案する。我々のアプローチは、最先端の幾何学的拡散モデルに基づいており、それらをマルチプロパティ最適化に拡張している。最適化プロセス全体を通して解釈的および説明可能な技術を統合する。
論文参考訳（メタデータ） (2024-09-12T06:35:04Z)
Decoding-Time Language Model Alignment with Multiple Objectives [116.42095026960598]
既存の手法は主に、1つの報酬関数に対してLMを最適化することに集中し、それらの適応性は様々な目的に制限される。本稿では,予測の線形結合から次のトークンを出力する復号時間アルゴリズムである$textbfmulti-objective decoding (MOD)$を提案する。提案手法は, 自然条件下であっても, 既存のアプローチが準最適であることを示すとともに, 提案手法の最適性を保証する。
論文参考訳（メタデータ） (2024-06-27T02:46:30Z)
Step-DPO: Step-wise Preference Optimization for Long-chain Reasoning of LLMs [54.05511925104712]
本稿では,Step-DPOと呼ばれるシンプルで効果的でデータ効率のよい手法を提案する。 Step-DPOは、個々の推論ステップを、論理的に回答を評価するのではなく、優先最適化の単位として扱う。以上の結果から,70B パラメータ以上のモデルでは,10K の選好データペアと500 Step-DPO トレーニングステップ以下では,MATH の精度が約3%向上する可能性が示唆された。
論文参考訳（メタデータ） (2024-06-26T17:43:06Z)
Bypass Back-propagation: Optimization-based Structural Pruning for Large Language Models via Policy Gradient [57.9629676017527]
大規模言語モデルを用いた最適化に基づく構造解析手法を提案する。我々は,プルーニングモデルの損失を最適化することにより,確率空間におけるプルーニングマスクを直接学習する。 A100 GPUで13Bモデルに対して約35GBのメモリで2.7時間動作させる。
論文参考訳（メタデータ） (2024-06-15T09:31:03Z)
Self-Play Preference Optimization for Language Model Alignment [75.83359213697854]
近年の進歩は、嗜好の確率で直接作業することで、人間の嗜好をより正確に反映できることを示している。本稿では,言語モデルアライメントのためのセルフプレイ方式を提案する。我々の手法はSPPO(Self-Play Preference Optimization)と呼ばれ、繰り返しポリシー更新を利用してナッシュ均衡を確実に近似する。
論文参考訳（メタデータ） (2024-05-01T17:59:20Z)
Monte Carlo Tree Search Boosts Reasoning via Iterative Preference Learning [55.96599486604344]
本稿では,Large Language Models (LLMs) の推論能力向上を目的とした,反復的な選好学習プロセスによるアプローチを提案する。我々は、MCTS(Monte Carlo Tree Search)を用いて好みデータを反復的に収集し、そのルックアヘッド機能を利用して、インスタンスレベルの報酬をよりきめ細かいステップレベルの信号に分解する。提案アルゴリズムはDPO(Direct Preference Optimization)を用いて,新たに生成されたステップレベルの優先度データを用いてLCMポリシーを更新する。
論文参考訳（メタデータ） (2024-05-01T11:10:24Z)
Agent-FLAN: Designing Data and Methods of Effective Agent Tuning for Large Language Models [56.00992369295851]
オープンソースのLarge Language Models(LLM)は、さまざまなNLPタスクで大きな成功を収めていますが、エージェントとして振る舞う場合、それでもAPIベースのモデルよりもはるかに劣っています。本稿では,(1) エージェント学習コーパスを,(1) エージェント学習データの分布から大きくシフトするエージェント推論と,(2) エージェントタスクが必要とする能力に異なる学習速度を示すエージェント学習コーパスと,(3) 幻覚を導入することでエージェント能力を改善する際の副作用について述べる。本稿では,エージェントのためのFLANモデルを効果的に構築するためのエージェントFLANを提案する。
論文参考訳（メタデータ） (2024-03-19T16:26:10Z)
Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文参考訳（メタデータ） (2024-02-27T03:33:23Z)
DrugAssist: A Large Language Model for Molecule Optimization [29.95488215594247]
DrugAssistは、人間と機械の対話を通じて最適化を行う対話型分子最適化モデルである。 DrugAssistは、単一および複数プロパティの最適化において、主要な結果を得た。分子最適化タスクの微調整言語モデルのための,MomoOpt-Instructionsと呼ばれる大規模命令ベースデータセットを公開している。
論文参考訳（メタデータ） (2023-12-28T10:46:56Z)
Pareto Optimization to Accelerate Multi-Objective Virtual Screening [11.356174411578515]
EGFRおよびIGF1Rの選択的二重阻害剤であると考えられる4M分子の仮想ライブラリーを探索するツールを開発した。このワークフローと関連するオープンソースソフトウェアは、分子設計プロジェクトのスクリーニング負担を軽減することができる。
論文参考訳（メタデータ） (2023-10-16T17:19:46Z)
Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。 QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。 QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2020-11-03T18:51:18Z)
MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文参考訳（メタデータ） (2020-10-05T20:18:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。