論文の概要: Small Molecule Optimization with Large Language Models
- arxiv url: http://arxiv.org/abs/2407.18897v1
- Date: Fri, 26 Jul 2024 17:51:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-29 12:39:55.422701
- Title: Small Molecule Optimization with Large Language Models
- Title(参考訳): 大規模言語モデルを用いた小分子最適化
- Authors: Philipp Guevorguian, Menua Bedrosian, Tigran Fahradyan, Gayane Chilingaryan, Hrant Khachatrian, Armen Aghajanyan,
- Abstract要約: 計算特性を持つ110M分子の新規コーパスを微調整した2つの言語モデルについて述べる。
ブラックボックスオラクルへのアクセスに制限がある場合、言語モデルを利用して任意の特性の分子を最適化する新しい最適化アルゴリズムを導入する。
- 参考スコア(独自算出の注目度): 17.874902319523663
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advancements in large language models have opened new possibilities for generative molecular drug design. We present Chemlactica and Chemma, two language models fine-tuned on a novel corpus of 110M molecules with computed properties, totaling 40B tokens. These models demonstrate strong performance in generating molecules with specified properties and predicting new molecular characteristics from limited samples. We introduce a novel optimization algorithm that leverages our language models to optimize molecules for arbitrary properties given limited access to a black box oracle. Our approach combines ideas from genetic algorithms, rejection sampling, and prompt optimization. It achieves state-of-the-art performance on multiple molecular optimization benchmarks, including an 8% improvement on Practical Molecular Optimization compared to previous methods. We publicly release the training corpus, the language models and the optimization algorithm.
- Abstract(参考訳): 大規模言語モデルの最近の進歩は、生成分子ドラッグデザインの新しい可能性を開いた。
計算特性を持つ110M分子の新規コーパスを微調整した2つの言語モデルであるChemlacticaとChemmaについて述べる。
これらのモデルは、特定の性質を持つ分子を生成し、限られたサンプルから新しい分子特性を予測する上で、強い性能を示す。
ブラックボックスオラクルへのアクセスに制限がある場合、言語モデルを利用して任意の特性の分子を最適化する新しい最適化アルゴリズムを導入する。
我々のアプローチは、遺伝的アルゴリズム、拒絶サンプリング、即時最適化のアイデアを組み合わせている。
複数の分子最適化ベンチマークの最先端性能を達成し、従来の手法と比較して、実用的分子最適化の8%の改善を含む。
トレーニングコーパス、言語モデル、最適化アルゴリズムを公開しています。
関連論文リスト
- Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [77.50732023411811]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
TransDLMは標準化された化学命名法を分子の意味表現として利用し、プロパティ要求をテキスト記述に暗黙的に埋め込む。
提案手法は, 分子構造類似性を最適化し, ベンチマークデータセットの化学的特性を向上するための最先端手法を超越した手法である。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - XMOL: Explainable Multi-property Optimization of Molecules [2.320539066224081]
複数の分子特性を同時に最適化するために,分子のマルチプロパティ最適化(XMOL)を提案する。
我々のアプローチは、最先端の幾何学的拡散モデルに基づいており、それらをマルチプロパティ最適化に拡張している。
最適化プロセス全体を通して解釈的および説明可能な技術を統合する。
論文 参考訳(メタデータ) (2024-09-12T06:35:04Z) - In-Context Learning for Few-Shot Molecular Property Prediction [56.67309268480843]
本稿では,文脈内学習の基盤となる概念に適応し,数発の分子特性予測のための新しいアルゴリズムを開発する。
提案手法は分子特性を(分子, 特性測定)ペアの文脈から予測することを学び, 微調整をせずに新しい性質に迅速に適応する。
論文 参考訳(メタデータ) (2023-10-13T05:12:48Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - Molecule Optimization via Fragment-based Generative Models [21.888942129750124]
創薬において、分子最適化は、望ましい薬物特性の観点から薬候補をより良いものにするための重要なステップである。
本稿では,計算量最適化分子に対する革新的シリコアプローチを提案し,最適化分子グラフを生成するために問題を定式化する。
我々の生成モデルはフラグメントベースの薬物設計の重要なアイデアに従い、小さなフラグメントを変更することで分子を最適化します。
論文 参考訳(メタデータ) (2020-12-08T05:52:16Z) - Reinforced Molecular Optimization with Neighborhood-Controlled Grammars [63.84003497770347]
分子最適化のためのグラフ畳み込みポリシネットワークであるMNCE-RLを提案する。
我々は、元の近傍制御された埋め込み文法を拡張して、分子グラフ生成に適用する。
提案手法は, 分子最適化タスクの多種多様さにおいて, 最先端性能を実現する。
論文 参考訳(メタデータ) (2020-11-14T05:42:15Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z) - Graph Polish: A Novel Graph Generation Paradigm for Molecular
Optimization [7.1696593196695035]
本稿では,従来の「二言語翻訳」タスクから「単言語」タスクへ分子最適化を変換する新しい分子最適化パラダイムであるグラフポーランドを提案する。
本稿では,最適化段階における長期的依存関係を捉えるために,効果的で効率的な学習フレームワークT&Sの研磨法を提案する。
論文 参考訳(メタデータ) (2020-08-14T08:36:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。