Fugu-MT 論文翻訳(概要): DrugAssist: A Large Language Model for Molecule Optimization

論文の概要: DrugAssist: A Large Language Model for Molecule Optimization

arxiv url: http://arxiv.org/abs/2401.10334v1
Date: Thu, 28 Dec 2023 10:46:56 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-28 16:23:30.688386
Title: DrugAssist: A Large Language Model for Molecule Optimization
Title（参考訳）: DrugAssist: 分子最適化のための大規模言語モデル
Authors: Geyan Ye, Xibao Cai, Houtim Lai, Xing Wang, Junhong Huang, Longyue Wang, Wei Liu, Xiangxiang Zeng
Abstract要約: DrugAssistは、人間と機械の対話を通じて最適化を行う対話型分子最適化モデルである。 DrugAssistは、単一および複数プロパティの最適化において、主要な結果を得た。分子最適化タスクの微調整言語モデルのための,MomoOpt-Instructionsと呼ばれる大規模命令ベースデータセットを公開している。
参考スコア（独自算出の注目度）: 29.95488215594247
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Recently, the impressive performance of large language models (LLMs) on a wide range of tasks has attracted an increasing number of attempts to apply LLMs in drug discovery. However, molecule optimization, a critical task in the drug discovery pipeline, is currently an area that has seen little involvement from LLMs. Most of existing approaches focus solely on capturing the underlying patterns in chemical structures provided by the data, without taking advantage of expert feedback. These non-interactive approaches overlook the fact that the drug discovery process is actually one that requires the integration of expert experience and iterative refinement. To address this gap, we propose DrugAssist, an interactive molecule optimization model which performs optimization through human-machine dialogue by leveraging LLM's strong interactivity and generalizability. DrugAssist has achieved leading results in both single and multiple property optimization, simultaneously showcasing immense potential in transferability and iterative optimization. In addition, we publicly release a large instruction-based dataset called MolOpt-Instructions for fine-tuning language models on molecule optimization tasks. We have made our code and data publicly available at https://github.com/blazerye/DrugAssist, which we hope to pave the way for future research in LLMs' application for drug discovery.
Abstract（参考訳）: 近年,多種多様なタスクにおける大規模言語モデル(LLM)の印象的な性能は,薬物発見にLLMを適用しようとする試みが増えている。しかしながら、分子最適化は、薬物発見パイプラインにおいて重要な課題であり、現在、LSMにはほとんど関与していない領域である。既存のアプローチのほとんどは、専門家のフィードバックを生かさずに、データによって提供される化学構造の基本パターンのみを捉えることに重点を置いている。これらの非相互作用的なアプローチは、薬物発見プロセスが専門家の経験と反復的改善の統合を必要とするものであるという事実を見落としている。このギャップに対処するために,LSMの強い相互作用性と一般化性を活用し,人間と機械の対話を通して最適化を行う対話型分子最適化モデルであるDragonAssistを提案する。 DrugAssistは、単一および複数プロパティの最適化において主要な成果を上げ、同時にトランスファービリティと反復最適化の潜在的な可能性を示している。さらに,分子最適化タスクの微調整言語モデルに対して,MomoOpt-Instructionsと呼ばれる大規模な命令ベースデータセットを公開している。我々のコードとデータはhttps://github.com/blazerye/DrugAssistで公開されています。

関連論文リスト

Large Language Models for Controllable Multi-property Multi-objective Molecule Optimization [2.152507712409726]
我々はC-MuMOInstructを紹介した。C-MuMOInstructは、明示的でプロパティ固有の目的を持つマルチプロパティ最適化に焦点を当てた最初の命令チューニングデータセットである。 GeLLMO-Cs は命令調整型 LLM で,目標となるプロパティ固有の最適化を行うことができる。実験の結果,GeLLMO-Csは高いベースラインを一貫して上回り,最大126%の成功率を達成した。
論文参考訳（メタデータ） (2025-05-29T20:29:14Z)
DrugPilot: LLM-based Parameterized Reasoning Agent for Drug Discovery [54.79763887844838]
大規模言語モデル(LLM)と自律エージェントの統合は、自動推論とタスク実行を通じて科学的発見を促進する大きな可能性を秘めている。本稿では,薬物発見におけるエンドツーエンド科学のために設計されたパラメータ化推論アーキテクチャを備えたLSMベースのエージェントシステムであるDrarmPilotを紹介する。 DrugPilot は ReAct や LoT のような最先端のエージェントよりも優れており、タスク完了率は98.0%、93.5%、64.0%である。
論文参考訳（メタデータ） (2025-05-20T05:18:15Z)
Collaborative Expert LLMs Guided Multi-Objective Molecular Optimization [51.104444856052204]
我々は,多目的分子最適化のための協調型大規模言語モデル(LLM)システムであるMultiMolを提案する。 6つの多目的最適化タスクに対する評価において、MultiMolは既存の手法を著しく上回り、82.30%の成功率を達成した。
論文参考訳（メタデータ） (2025-03-05T13:47:55Z)
GeLLMO: Generalizing Large Language Models for Multi-property Molecule Optimization [2.152507712409726]
大規模言語モデル(LLM)は、新しいタスクに対するドメイン外の顕著な一般化性を示す。複雑なマルチプロパタイト分子最適化タスクに特化した,最初の高品質な命令チューニングデータセットである MuMOInstruct を紹介する。分子最適化のための命令調整型LCMであるGeLLMOsを開発した。
論文参考訳（メタデータ） (2025-02-19T03:14:11Z)
DrugImproverGPT: A Large Language Model for Drug Optimization with Fine-Tuning via Structured Policy Optimization [53.27954325490941]
大規模言語モデル(LLM)の微調整は、特定の目的に向けて結果を生成するために不可欠である。本研究は,薬物最適化LSMに基づく生成モデルを微調整するための新しい強化学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2025-02-11T04:00:21Z)
Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [77.50732023411811]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。 TransDLMは標準化された化学命名法を分子の意味表現として利用し、プロパティ要求をテキスト記述に暗黙的に埋め込む。提案手法は, 分子構造類似性を最適化し, ベンチマークデータセットの化学的特性を向上するための最先端手法を超越した手法である。
論文参考訳（メタデータ） (2024-10-17T14:30:27Z)
QPO: Query-dependent Prompt Optimization via Multi-Loop Offline Reinforcement Learning [58.767866109043055]
クエリ依存型プロンプト最適化(QPO)を導入し、入力クエリに合わせて最適なプロンプトを生成するために、小さな事前訓練された言語モデルを反復的に微調整する。我々は、オープンソースのタスクに様々なプロンプトをベンチマークする副産物として、すでに大量に存在するオフラインのプロンプトデータから洞察を得る。様々なLLMスケールと多様なNLPおよび数学タスクの実験は、ゼロショットと少数ショットの両方のシナリオにおいて、我々の手法の有効性とコスト効率を実証している。
論文参考訳（メタデータ） (2024-08-20T03:06:48Z)
Many-Shot In-Context Learning for Molecular Inverse Design [56.65345962071059]
大規模言語モデル(LLM)は、数ショットのインコンテキスト学習(ICL)において、優れたパフォーマンスを示している。マルチショットICLで利用可能な実験データの不足を克服する,新しい半教師付き学習手法を開発した。示すように、この新しい手法は、既存の分子設計のためのICL法を大幅に改善し、科学者にとってアクセスしやすく、使いやすくする。
論文参考訳（メタデータ） (2024-07-26T21:10:50Z)
LICO: Large Language Models for In-Context Molecular Optimization [33.5918976228562]
ブラックボックス最適化のために任意のベースLLMを拡張する汎用モデルであるlicOを導入する。ドメイン上で定義されたさまざまな関数セットに対して、コンテキスト内予測を行うようにモデルを訓練する。トレーニングが完了すると、licOはコンテクスト内でのプロンプトによって、見つからない分子の性質に一般化できる。
論文参考訳（メタデータ） (2024-06-27T02:43:18Z)
Efficient Evolutionary Search Over Chemical Space with Large Language Models [31.31899988523534]
最適化の目的は区別できない。化学対応大規模言語モデル(LLM)を進化的アルゴリズムに導入する。我々のアルゴリズムは最終解の質と収束速度の両方を改善する。
論文参考訳（メタデータ） (2024-06-23T06:22:49Z)
Large Language Model Distilling Medication Recommendation Model [61.89754499292561]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文参考訳（メタデータ） (2024-02-05T08:25:22Z)
InstructMol: Multi-Modal Integration for Building a Versatile and Reliable Molecular Assistant in Drug Discovery [19.870192393785043]
LLM(Large Language Models)は、複雑な分子データとの相互作用の再構築を約束する。我々の新しい貢献であるInstructMolは、インストラクションチューニングアプローチを通じて、分子構造と自然言語を効果的に整合させる。 InstructMolは、薬物発見関連分子タスクの大幅なパフォーマンス向上を示す。
論文参考訳（メタデータ） (2023-11-27T16:47:51Z)
Connecting Large Language Models with Evolutionary Algorithms Yields Powerful Prompt Optimizers [70.18534453485849]
EvoPromptは離散的なプロンプト最適化のためのフレームワークである。進化的アルゴリズム(EA)の概念は、優れた性能と高速収束を示すものである。人為的なプロンプトと既存の方法で自動プロンプト生成を著しく上回っている。
論文参考訳（メタデータ） (2023-09-15T16:50:09Z)
Improving Small Language Models on PubMedQA via Generative Data Augmentation [4.96649519549027]
大規模言語モデル (LLM) は自然言語処理の分野で顕著な進歩を遂げている。小型言語モデル(SLM)はその効率で知られているが、限られた能力と訓練データに悩まされることが多い。医療領域におけるSLMの改善を目的とした,LLMに基づく生成データ拡張を用いた新しい手法を提案する。
論文参考訳（メタデータ） (2023-05-12T23:49:23Z)
SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。 SSM-DTAフレームワークについて述べる。
論文参考訳（メタデータ） (2022-06-20T14:53:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。