論文の概要: C5T5: Controllable Generation of Organic Molecules with Transformers
- arxiv url: http://arxiv.org/abs/2108.10307v1
- Date: Mon, 23 Aug 2021 17:53:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-24 15:35:20.810026
- Title: C5T5: Controllable Generation of Organic Molecules with Transformers
- Title(参考訳): c5t5:トランスフォーマーによる有機分子の制御可能な生成
- Authors: Daniel Rothchild, Alex Tamkin, Julie Yu, Ujval Misra, Joseph Gonzalez
- Abstract要約: C5T5は, 有機材料を所望の特性で設計するための, 自己監督型事前学習法である。
C5T5は、有機化学者に豊富な構造情報を直感的にエンコードする標準化された分子表現であるIUPACの名前で運営されている。
薬物発見に関連する4つの物理特性に対するC5T5の有効性を実証し,分子を望ましい性質値に変化させるための化学的に直感的な戦略を学習することを示した。
- 参考スコア(独自算出の注目度): 8.42831608927688
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Methods for designing organic materials with desired properties have high
potential impact across fields such as medicine, renewable energy,
petrochemical engineering, and agriculture. However, using generative modeling
to design substances with desired properties is difficult because candidate
compounds must satisfy multiple constraints, including synthetic accessibility
and other metrics that are intuitive to domain experts but challenging to
quantify. We propose C5T5, a novel self-supervised pretraining method that
enables transformers to make zero-shot select-and-replace edits, altering
organic substances towards desired property values. C5T5 operates on IUPAC
names -- a standardized molecular representation that intuitively encodes rich
structural information for organic chemists but that has been largely ignored
by the ML community. Our technique requires no edited molecule pairs to train
and only a rough estimate of molecular properties, and it has the potential to
model long-range dependencies and symmetric molecular structures more easily
than graph-based methods. C5T5 also provides a powerful interface to domain
experts: it grants users fine-grained control over the generative process by
selecting and replacing IUPAC name fragments, which enables experts to leverage
their intuitions about structure-activity relationships. We demonstrate C5T5's
effectiveness on four physical properties relevant for drug discovery, showing
that it learns successful and chemically intuitive strategies for altering
molecules towards desired property values.
- Abstract(参考訳): 望ましい性質を持つ有機材料を設計する方法は、医学、再生可能エネルギー、石油化学工学、農業などの分野に高い影響を与える。
しかし、候補化合物は、合成アクセシビリティやその他のドメインの専門家にとって直感的だが定量化が難しいメトリクスを含む、複数の制約を満たす必要があるため、望ましい特性を持つ物質を設計するために生成モデリングを使用することは困難である。
C5T5は、トランスフォーマーがゼロショット選択置換編集を可能とし、有機物を所望のプロパティ値に変化させる、新しい自己教師型事前学習法である。
C5T5はIUPACの名前で運営されており、有機化学者の豊富な構造情報を直感的にコード化しているが、MLコミュニティからは無視されている。
本手法では, 合成分子対を必要とせず, 分子特性を大まかに見積もるだけで, 長距離依存性や対称分子構造をグラフ法よりも容易にモデル化することができる。
C5T5はまた、ドメインエキスパートに強力なインターフェースを提供する: IUPAC名フラグメントを選択して置き換えることで、ユーザが生成プロセスのきめ細かい制御を許可する。
薬物発見に関連する4つの物理特性に対するC5T5の有効性を実証し,分子を望ましい性質値に変化させるための化学的に直感的な戦略を学習することを示した。
関連論文リスト
- GraphXForm: Graph transformer for computer-aided molecular design with application to extraction [73.1842164721868]
本稿では,デコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormについて述べる。
液液抽出のための2つの溶媒設計課題について評価し,4つの最先端分子設計技術より優れていることを示した。
論文 参考訳(メタデータ) (2024-11-03T19:45:15Z) - Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [49.64512917330373]
本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。
TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。
我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文 参考訳(メタデータ) (2024-03-20T02:15:55Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - LLamol: A Dynamic Multi-Conditional Generative Transformer for De Novo
Molecular Design [0.0]
LLamolはLLama 2アーキテクチャに基づいた単一の新しい生成トランスフォーマーモデルである。
モデルが最大4つの条件で単一条件および多条件の有機分子生成を順応的に処理できることを実証する。
より詳しくは,個別に,あるいは数値特性と組み合わせて,トークンシーケンスを条件付けに活用するモデルの能力について紹介する。
論文 参考訳(メタデータ) (2023-11-24T10:59:12Z) - Domain-Agnostic Molecular Generation with Chemical Feedback [44.063584808910896]
MolGenは、分子生成に特化した事前訓練された分子言語モデルである。
1億以上の分子SELFIESを再構成することで構造的および文法的な洞察を内部化する。
我々の化学フィードバックパラダイムは、モデルを分子幻覚から遠ざけ、モデルの推定確率と実世界の化学的嗜好との整合性を確保する。
論文 参考訳(メタデータ) (2023-01-26T17:52:56Z) - Molecule Generation from Input-Attributions over Graph Convolutional
Networks [4.468952886990851]
本稿では,グラフ畳み込みネットワークモデルと新しい分子を生成する入力帰属法を含む自動プロセスを提案する。
また、このような自動ツールの実用化において、過度な最適化と適用性の問題についても検討し、これらを2つの重要な側面として認識する。
論文 参考訳(メタデータ) (2022-01-25T09:13:26Z) - Geometric Transformer for End-to-End Molecule Properties Prediction [92.28929858529679]
分子特性予測のためのトランスフォーマーに基づくアーキテクチャを導入し,分子の形状を捉える。
分子幾何学の初期符号化による古典的な位置エンコーダと、学習されたゲート自己保持機構を改変する。
論文 参考訳(メタデータ) (2021-10-26T14:14:40Z) - Reinforced Molecular Optimization with Neighborhood-Controlled Grammars [63.84003497770347]
分子最適化のためのグラフ畳み込みポリシネットワークであるMNCE-RLを提案する。
我々は、元の近傍制御された埋め込み文法を拡張して、分子グラフ生成に適用する。
提案手法は, 分子最適化タスクの多種多様さにおいて, 最先端性能を実現する。
論文 参考訳(メタデータ) (2020-11-14T05:42:15Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z) - End-to-End Differentiable Molecular Mechanics Force Field Construction [0.5269923665485903]
化学環境を知覚するためにグラフニューラルネットワークを用いる別のアプローチを提案する。
プロセス全体がモジュール化されており、モデルパラメータに関してエンドツーエンドの差別化が可能である。
本手法は, 従来の原子型を再現するだけでなく, 既存の分子力学力場を正確に再現し, 拡張することができることを示す。
論文 参考訳(メタデータ) (2020-10-02T20:59:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。