論文の概要: Gotta be SAFE: A New Framework for Molecular Design
- arxiv url: http://arxiv.org/abs/2310.10773v2
- Date: Sun, 10 Dec 2023 23:26:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-13 19:32:51.057239
- Title: Gotta be SAFE: A New Framework for Molecular Design
- Title(参考訳): 安全であるべき: 分子設計のための新しい枠組み
- Authors: Emmanuel Noutahi, Cristian Gabellini, Michael Craig, Jonathan S.C Lim,
Prudencio Tossou
- Abstract要約: SAFE(Sequential Attachment-based Fragment Embedding)は化学構造のための新しい表記法である。
SAFEはSMILES文字列を、既存のSMILESsとの互換性を維持しながら、相互接続された断片ブロックの順序のないシーケンスとして再定義する。
我々のSAFE-GPTモデルは、多目的かつ堅牢な最適化性能を示す。
- 参考スコア(独自算出の注目度): 1.135672229709142
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Traditional molecular string representations, such as SMILES, often pose
challenges for AI-driven molecular design due to their non-sequential depiction
of molecular substructures. To address this issue, we introduce Sequential
Attachment-based Fragment Embedding (SAFE), a novel line notation for chemical
structures. SAFE reimagines SMILES strings as an unordered sequence of
interconnected fragment blocks while maintaining compatibility with existing
SMILES parsers. It streamlines complex generative tasks, including scaffold
decoration, fragment linking, polymer generation, and scaffold hopping, while
facilitating autoregressive generation for fragment-constrained design, thereby
eliminating the need for intricate decoding or graph-based models. We
demonstrate the effectiveness of SAFE by training an 87-million-parameter
GPT2-like model on a dataset containing 1.1 billion SAFE representations.
Through targeted experimentation, we show that our SAFE-GPT model exhibits
versatile and robust optimization performance. SAFE opens up new avenues for
the rapid exploration of chemical space under various constraints, promising
breakthroughs in AI-driven molecular design.
- Abstract(参考訳): SMILESのような伝統的な分子文字列表現は、しばしばAI駆動の分子設計に挑戦する。
この問題に対処するため,我々は化学構造のための新しい線記法であるシーケンシャルアタッチメントに基づくフラグメント埋め込み(safe)を導入する。
SAFEはSMILES文字列を、既存のSMILESパーサとの互換性を維持しながら、相互接続された断片ブロックの順序のないシーケンスとして再定義する。
足場装飾、フラグメントリンク、ポリマー生成、足場ホッピングなどの複雑な生成タスクを合理化し、フラグメント制約設計の自己回帰生成を容易にし、複雑なデコードやグラフベースモデルの必要性をなくす。
我々は,110億のSAFE表現を含むデータセット上で,8700万パラメータのGPT2ライクなモデルをトレーニングすることにより,SAFEの有効性を示す。
対象とする実験により,我々のSAFE-GPTモデルは多目的かつ堅牢な最適化性能を示すことを示す。
SAFEは、様々な制約の下で化学空間を迅速に探索するための新しい道を開き、AI駆動の分子設計のブレークスルーを約束する。
関連論文リスト
- AUTODIFF: Autoregressive Diffusion Modeling for Structure-based Drug Design [16.946648071157618]
構造に基づく薬物設計のための拡散型フラグメントワイド自己回帰生成モデル(SBDD)を提案する。
我々はまず,分子の局所構造の整合性を保持する共形モチーフという新しい分子組立戦略を設計する。
次に、タンパク質-リガンド複合体とSE(3)等価な畳み込みネットワークとの相互作用をエンコードし、拡散モデルを用いて分子モチーフ・バイ・モチーフを生成する。
論文 参考訳(メタデータ) (2024-04-02T14:44:02Z) - DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。
DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文 参考訳(メタデータ) (2024-03-07T02:53:40Z) - Sculpting Molecules in 3D: A Flexible Substructure Aware Framework for
Text-Oriented Molecular Optimization [11.336868279763804]
本稿では,多モードガイダンス生成/最適化タスクとして定式化することで,逆設計問題に対処する革新的な手法を提案する。
提案手法は,分子生成・最適化タスク,すなわち3DToMoloの実装のためのテクスチャ構造アライメント対称拡散フレームワークを含む。
3つのガイダンス生成設定での試行は、最先端の手法と比較して、ヒット生成性能が優れていることを示している。
論文 参考訳(メタデータ) (2024-03-06T03:15:25Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - CHA2: CHemistry Aware Convex Hull Autoencoder Towards Inverse Molecular
Design [2.169755083801688]
検索空間全体を包括的に探索して、興味のある性質を持つデ・ノヴォ構造を利用することは不可能である。
この課題に対処するために、難解な探索空間を低次元の潜在体積に減らすことで、分子候補をより効果的に調べることができる。
そこで我々は,高いQEDを持つ新規分子を明らかにする効率的な方法として,高いQEDでトップ分子を取り囲む凸ホールを用いて,潜在表現におけるタイトな部分空間を抽出することを提案する。
論文 参考訳(メタデータ) (2023-02-21T21:05:31Z) - Reprogramming Pretrained Language Models for Antibody Sequence Infilling [72.13295049594585]
抗体の計算設計には、構造的一貫性を維持しながら、新規で多様な配列を生成することが含まれる。
近年のディープラーニングモデルでは優れた結果が得られたが、既知の抗体配列/構造対の数が限られているため、性能が劣化することが多い。
これは、ソース言語でトレーニング済みのモデルを再利用して、異なる言語で、データが少ないタスクに適応するものです。
論文 参考訳(メタデータ) (2022-10-05T20:44:55Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Scaffold-constrained molecular generation [0.0]
SMILESをベースとしたリカレントニューラルネットワーク(Recurrent Neural Network, RNN)生成モデルを構築し, 足場制約付き生成を実現するため, サンプリング手法を改良した。
本稿では,様々なタスクにおいて足場制約付き生成を行う手法について紹介する。
論文 参考訳(メタデータ) (2020-09-15T15:41:18Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z) - Learning To Navigate The Synthetically Accessible Chemical Space Using
Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。
このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。
本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文 参考訳(メタデータ) (2020-04-26T21:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。