論文の概要: Gotta be SAFE: A New Framework for Molecular Design
- arxiv url: http://arxiv.org/abs/2310.10773v1
- Date: Mon, 16 Oct 2023 19:12:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-18 19:19:49.555098
- Title: Gotta be SAFE: A New Framework for Molecular Design
- Title(参考訳): 安全であるべき: 分子設計のための新しい枠組み
- Authors: Emmanuel Noutahi, Cristian Gabellini, Michael Craig, Jonathan S.C Lim,
Prudencio Tossou
- Abstract要約: SAFE(Sequential Attachment-based Fragment Embedding)は化学構造のための新しい表記法である。
SAFEはSMILES文字列を、既存のSMILESとの完全な互換性を維持しながら、相互接続された断片ブロックの順序のないシーケンスとして再定義する。
我々のSAFE-GPTモデルは、多目的かつ堅牢な最適化性能を示す。
- 参考スコア(独自算出の注目度): 1.135672229709142
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Traditional molecular string representations, such as SMILES, often pose
challenges for AI-driven molecular design due to their non-sequential depiction
of molecular substructures. To address this issue, we introduce Sequential
Attachment-based Fragment Embedding (SAFE), a novel line notation for chemical
structures. SAFE reimagines SMILES strings as an unordered sequence of
interconnected fragment blocks while maintaining full compatibility with
existing SMILES parsers. It streamlines complex generative tasks, including
scaffold decoration, fragment linking, polymer generation, and scaffold
hopping, while facilitating autoregressive generation for fragment-constrained
design, thereby eliminating the need for intricate decoding or graph-based
models. We demonstrate the effectiveness of SAFE by training an
87-million-parameter GPT2-like model on a dataset containing 1.1 billion SAFE
representations. Through extensive experimentation, we show that our SAFE-GPT
model exhibits versatile and robust optimization performance. SAFE opens up new
avenues for the rapid exploration of chemical space under various constraints,
promising breakthroughs in AI-driven molecular design.
- Abstract(参考訳): SMILESのような伝統的な分子文字列表現は、しばしばAI駆動の分子設計に挑戦する。
この問題に対処するため,我々は化学構造のための新しい線記法であるシーケンシャルアタッチメントに基づくフラグメント埋め込み(safe)を導入する。
SAFEはSMILES文字列を、既存のSMILESパーサとの完全な互換性を維持しながら、相互接続された断片ブロックの順序のないシーケンスとして再定義する。
足場装飾、フラグメントリンク、ポリマー生成、足場ホッピングなどの複雑な生成タスクを合理化し、フラグメント制約設計の自己回帰生成を容易にし、複雑なデコードやグラフベースモデルの必要性をなくす。
我々は,110億のSAFE表現を含むデータセット上で,8700万パラメータのGPT2ライクなモデルをトレーニングすることにより,SAFEの有効性を示す。
実験により,SAFE-GPTモデルは多目的かつ堅牢な最適化性能を示すことを示した。
SAFEは、様々な制約の下で化学空間を迅速に探索するための新しい道を開き、AI駆動の分子設計のブレークスルーを約束する。
関連論文リスト
- GraphXForm: Graph transformer for computer-aided molecular design with application to extraction [73.1842164721868]
本稿では,デコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormについて述べる。
液液抽出のための2つの溶媒設計課題について評価し,4つの最先端分子設計技術より優れていることを示した。
論文 参考訳(メタデータ) (2024-11-03T19:45:15Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - SAFE setup for generative molecular design [0.0]
逐次アタッチメントベースのフラグメント埋め込み(SAFE)表現は、SMILES生成モデルの代替として最近導入された。
本研究では,データセットのサイズ,乱数化によるデータ拡張,モデルアーキテクチャ,結合切断アルゴリズムに着目し,SAFE生成モデルのトレーニングのための最適設定について検討した。
より大きな、より多様なデータセットによってパフォーマンスが向上し、Rotary Positional Embeddingを使用したLLaMAアーキテクチャが最も堅牢であることが分かりました。
論文 参考訳(メタデータ) (2024-10-26T17:27:33Z) - Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。
私たちのフレームワークは、3つの新しい目標のファミリーにつながります。
Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文 参考訳(メタデータ) (2024-10-10T17:18:30Z) - AUTODIFF: Autoregressive Diffusion Modeling for Structure-based Drug Design [16.946648071157618]
構造に基づく薬物設計のための拡散型フラグメントワイド自己回帰生成モデル(SBDD)を提案する。
我々はまず,分子の局所構造の整合性を保持する共形モチーフという新しい分子組立戦略を設計する。
次に、タンパク質-リガンド複合体とSE(3)等価な畳み込みネットワークとの相互作用をエンコードし、拡散モデルを用いて分子モチーフ・バイ・モチーフを生成する。
論文 参考訳(メタデータ) (2024-04-02T14:44:02Z) - DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。
DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文 参考訳(メタデータ) (2024-03-07T02:53:40Z) - CHA2: CHemistry Aware Convex Hull Autoencoder Towards Inverse Molecular
Design [2.169755083801688]
検索空間全体を包括的に探索して、興味のある性質を持つデ・ノヴォ構造を利用することは不可能である。
この課題に対処するために、難解な探索空間を低次元の潜在体積に減らすことで、分子候補をより効果的に調べることができる。
そこで我々は,高いQEDを持つ新規分子を明らかにする効率的な方法として,高いQEDでトップ分子を取り囲む凸ホールを用いて,潜在表現におけるタイトな部分空間を抽出することを提案する。
論文 参考訳(メタデータ) (2023-02-21T21:05:31Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Scaffold-constrained molecular generation [0.0]
SMILESをベースとしたリカレントニューラルネットワーク(Recurrent Neural Network, RNN)生成モデルを構築し, 足場制約付き生成を実現するため, サンプリング手法を改良した。
本稿では,様々なタスクにおいて足場制約付き生成を行う手法について紹介する。
論文 参考訳(メタデータ) (2020-09-15T15:41:18Z) - Learning To Navigate The Synthetically Accessible Chemical Space Using
Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。
このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。
本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文 参考訳(メタデータ) (2020-04-26T21:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。