Fugu-MT 論文翻訳(概要): Gotta be SAFE: A New Framework for Molecular Design

論文の概要: Gotta be SAFE: A New Framework for Molecular Design

arxiv url: http://arxiv.org/abs/2310.10773v2
Date: Sun, 10 Dec 2023 23:26:18 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-13 19:32:51.057239
Title: Gotta be SAFE: A New Framework for Molecular Design
Title（参考訳）: 安全であるべき: 分子設計のための新しい枠組み
Authors: Emmanuel Noutahi, Cristian Gabellini, Michael Craig, Jonathan S.C Lim, Prudencio Tossou
Abstract要約: SAFE(Sequential Attachment-based Fragment Embedding)は化学構造のための新しい表記法である。 SAFEはSMILES文字列を、既存のSMILESsとの互換性を維持しながら、相互接続された断片ブロックの順序のないシーケンスとして再定義する。我々のSAFE-GPTモデルは、多目的かつ堅牢な最適化性能を示す。
参考スコア（独自算出の注目度）: 1.135672229709142
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Traditional molecular string representations, such as SMILES, often pose challenges for AI-driven molecular design due to their non-sequential depiction of molecular substructures. To address this issue, we introduce Sequential Attachment-based Fragment Embedding (SAFE), a novel line notation for chemical structures. SAFE reimagines SMILES strings as an unordered sequence of interconnected fragment blocks while maintaining compatibility with existing SMILES parsers. It streamlines complex generative tasks, including scaffold decoration, fragment linking, polymer generation, and scaffold hopping, while facilitating autoregressive generation for fragment-constrained design, thereby eliminating the need for intricate decoding or graph-based models. We demonstrate the effectiveness of SAFE by training an 87-million-parameter GPT2-like model on a dataset containing 1.1 billion SAFE representations. Through targeted experimentation, we show that our SAFE-GPT model exhibits versatile and robust optimization performance. SAFE opens up new avenues for the rapid exploration of chemical space under various constraints, promising breakthroughs in AI-driven molecular design.
Abstract（参考訳）: SMILESのような伝統的な分子文字列表現は、しばしばAI駆動の分子設計に挑戦する。この問題に対処するため,我々は化学構造のための新しい線記法であるシーケンシャルアタッチメントに基づくフラグメント埋め込み(safe)を導入する。 SAFEはSMILES文字列を、既存のSMILESパーサとの互換性を維持しながら、相互接続された断片ブロックの順序のないシーケンスとして再定義する。足場装飾、フラグメントリンク、ポリマー生成、足場ホッピングなどの複雑な生成タスクを合理化し、フラグメント制約設計の自己回帰生成を容易にし、複雑なデコードやグラフベースモデルの必要性をなくす。我々は,110億のSAFE表現を含むデータセット上で,8700万パラメータのGPT2ライクなモデルをトレーニングすることにより,SAFEの有効性を示す。対象とする実験により,我々のSAFE-GPTモデルは多目的かつ堅牢な最適化性能を示すことを示す。 SAFEは、様々な制約の下で化学空間を迅速に探索するための新しい道を開き、AI駆動の分子設計のブレークスルーを約束する。

関連論文リスト

OMTRA: A Multi-Task Generative Model for Structure-Based Drug Design [0.2578364360202627]
我々はOMTRAにおける統一的アプローチを提案し、薬物設計(SBDD)に関連する多くのタスクを柔軟に実行する。我々は、500Mの3次元分子コンバータのデータセットをキュレートし、タンパク質リガンドデータを補完し、トレーニングに利用可能な化学的多様性を拡大する。 OMTRAは, ポケットコンディショニングド・ノボ設計およびドッキングにおける技術性能の状態を把握しているが, 大規模プレトレーニングとマルチタスクトレーニングの効果は軽度である。
論文参考訳（メタデータ） (2025-12-04T18:46:35Z)
Monte Carlo Tree Diffusion with Multiple Experts for Protein Design [50.056670856059014]
マスク付き拡散モデルと木探索を統合したMCTD-MEを提案する。自己回帰型プランナーとは異なり、MCTD-MEはロールアウトエンジンとして生物物理学的な拡散デノナイジングを使用している。このフレームワークはモデルに依存しず、デノボタンパク質工学や多目的分子生成を含む逆フォールディングを越えて適用できる。
論文参考訳（メタデータ） (2025-09-19T09:24:42Z)
MODA: A Unified 3D Diffusion Framework for Multi-Task Target-Aware Molecular Generation [16.07694748790297]
我々は,断片成長,リンカー設計,足場ホッピング,サイドチェーン装飾をベイズマスクスケジューラと統合する拡散フレームワークMODAを紹介する。トレーニング中、連続した空間的断片がマスクされ、1つのパスで識別され、モデルがタスク全体にわたって共有された幾何学的および化学的先行性を学ぶことができる。
論文参考訳（メタデータ） (2025-07-09T18:19:50Z)
DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文参考訳（メタデータ） (2025-02-13T18:29:48Z)
GenMol: A Drug Discovery Generalist with Discrete Diffusion [43.29814519270451]
Generalist Molecular Generative Model (GenMol) は、薬物発見パイプラインの様々な側面に対処する汎用的なフレームワークである。離散拡散フレームワークでは、フラグメントをマスク付きトークンに置き換えることで分子を最適化するフラグメントリマッシングを導入する。 GenMolは、デノボ生成およびフラグメント制約生成においてSAFE表現に基づいてトレーニングされた以前のGPTベースのモデルよりも大幅に優れている。
論文参考訳（メタデータ） (2025-01-10T18:30:05Z)
RFL: Simplifying Chemical Structure Recognition with Ring-Free Language [66.47173094346115]
化学構造を階層的に記述する新しいリング自由言語(RFL)を提案する。 RFLは複雑な分子構造を複数の部分に分解し、特異性と簡潔性の両方を保証する。分子骨格と個々の環を段階的に予測する骨格生成モジュールからなる普遍的な分子骨格デコーダ(MSD)を提案する。
論文参考訳（メタデータ） (2024-12-10T15:29:32Z)
GraphXForm: Graph transformer for computer-aided molecular design with application to extraction [73.1842164721868]
本稿では,デコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormについて述べる。液液抽出のための2つの溶媒設計課題について評価し,4つの最先端分子設計技術より優れていることを示した。
論文参考訳（メタデータ） (2024-11-03T19:45:15Z)
Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文参考訳（メタデータ） (2024-11-03T01:56:15Z)
SAFE setup for generative molecular design [0.0]
逐次アタッチメントベースのフラグメント埋め込み(SAFE)表現は、SMILES生成モデルの代替として最近導入された。本研究では,データセットのサイズ,乱数化によるデータ拡張,モデルアーキテクチャ,結合切断アルゴリズムに着目し,SAFE生成モデルのトレーニングのための最適設定について検討した。より大きな、より多様なデータセットによってパフォーマンスが向上し、Rotary Positional Embeddingを使用したLLaMAアーキテクチャが最も堅牢であることが分かりました。
論文参考訳（メタデータ） (2024-10-26T17:27:33Z)
Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。私たちのフレームワークは、3つの新しい目標のファミリーにつながります。 Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文参考訳（メタデータ） (2024-10-10T17:18:30Z)
AUTODIFF: Autoregressive Diffusion Modeling for Structure-based Drug Design [16.946648071157618]
構造に基づく薬物設計のための拡散型フラグメントワイド自己回帰生成モデル(SBDD)を提案する。我々はまず,分子の局所構造の整合性を保持する共形モチーフという新しい分子組立戦略を設計する。次に、タンパク質-リガンド複合体とSE(3)等価な畳み込みネットワークとの相互作用をエンコードし、拡散モデルを用いて分子モチーフ・バイ・モチーフを生成する。
論文参考訳（メタデータ） (2024-04-02T14:44:02Z)
DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。 DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文参考訳（メタデータ） (2024-03-07T02:53:40Z)
CHA2: CHemistry Aware Convex Hull Autoencoder Towards Inverse Molecular Design [2.169755083801688]
検索空間全体を包括的に探索して、興味のある性質を持つデ・ノヴォ構造を利用することは不可能である。この課題に対処するために、難解な探索空間を低次元の潜在体積に減らすことで、分子候補をより効果的に調べることができる。そこで我々は,高いQEDを持つ新規分子を明らかにする効率的な方法として,高いQEDでトップ分子を取り囲む凸ホールを用いて,潜在表現におけるタイトな部分空間を抽出することを提案する。
論文参考訳（メタデータ） (2023-02-21T21:05:31Z)
Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文参考訳（メタデータ） (2022-08-23T17:01:16Z)
Scaffold-constrained molecular generation [0.0]
SMILESをベースとしたリカレントニューラルネットワーク(Recurrent Neural Network, RNN)生成モデルを構築し, 足場制約付き生成を実現するため, サンプリング手法を改良した。本稿では,様々なタスクにおいて足場制約付き生成を行う手法について紹介する。
論文参考訳（メタデータ） (2020-09-15T15:41:18Z)
Learning To Navigate The Synthetically Accessible Chemical Space Using Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文参考訳（メタデータ） (2020-04-26T21:40:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。