論文の概要: Analysis of training and seed bias in small molecules generated with a
conditional graph-based variational autoencoder -- Insights for practical
AI-driven molecule generation
- arxiv url: http://arxiv.org/abs/2107.08987v1
- Date: Mon, 19 Jul 2021 16:00:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-20 14:35:43.953396
- Title: Analysis of training and seed bias in small molecules generated with a
conditional graph-based variational autoencoder -- Insights for practical
AI-driven molecule generation
- Title(参考訳): 条件付きグラフ型変分オートエンコーダによる小分子の訓練と種子バイアスの解析 -ai駆動分子生成のための洞察-
- Authors: Seung-gu Kang, Joseph A. Morrone, Jeffrey K. Weber, Wendy D. Cornell
- Abstract要約: 活性条件付きグラフベース変分オートエンコーダ(VAE)の出力に及ぼすシードとトレーニングバイアスの影響を解析する。
グラフに基づく生成モデルは, 所望の条件付き活性と, 生成分子における好ましくない物理特性の創出に優れていた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The application of deep learning to generative molecule design has shown
early promise for accelerating lead series development. However, questions
remain concerning how factors like training, dataset, and seed bias impact the
technology's utility to medicine and computational chemists. In this work, we
analyze the impact of seed and training bias on the output of an
activity-conditioned graph-based variational autoencoder (VAE). Leveraging a
massive, labeled dataset corresponding to the dopamine D2 receptor, our
graph-based generative model is shown to excel in producing desired conditioned
activities and favorable unconditioned physical properties in generated
molecules. We implement an activity swapping method that allows for the
activation, deactivation, or retention of activity of molecular seeds, and we
apply independent deep learning classifiers to verify the generative results.
Overall, we uncover relationships between noise, molecular seeds, and training
set selection across a range of latent-space sampling procedures, providing
important insights for practical AI-driven molecule generation.
- Abstract(参考訳): 生成分子設計への深層学習の適用は、リードシリーズ開発を加速させる早期の約束を示している。
しかしながら、トレーニングやデータセット、シードバイアスといった要因が、医学や計算化学者に対する技術の有用性に与える影響について疑問が残る。
本研究では,活動条件付きグラフベース変分オートエンコーダ(VAE)の出力に及ぼすシードおよびトレーニングバイアスの影響を分析する。
ドパミンD2受容体に対応する大規模ラベル付きデータセットを用いて, グラフベース生成モデルを用いて, 所望の条件付活性と生成分子における好ましくない物理特性を発現させる。
本研究では, 分子種子の活性の活性化, 脱活性化, 維持を可能にする活性スワッピング法を実装し, 独立な深層学習分類法を適用し, 生成結果の検証を行う。
全体として、ノイズ、分子種、トレーニングセットの選択の関係を、様々な潜在空間サンプリング手順で明らかにし、実用的なAI駆動分子生成のための重要な洞察を提供する。
関連論文リスト
- UniGEM: A Unified Approach to Generation and Property Prediction for Molecules [33.94641403669206]
分子生成と特性予測をうまく統合する最初の統一モデルUniGEMを提案する。
我々の重要な革新は、分子足場が形成された後、後段で予測タスクが活性化される新しい2相生成プロセスにある。
UniGEMの背景にある原則は、自然言語処理やコンピュータビジョンなど幅広い応用を約束している。
論文 参考訳(メタデータ) (2024-10-14T13:58:13Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z) - Supervised Pretraining for Molecular Force Fields and Properties
Prediction [16.86839767858162]
本研究では, 原子電荷と3次元ジオメトリーを入力とし, 分子エネルギーをラベルとする8800万分子のデータセット上で, ニューラルネットワークを事前学習することを提案する。
実験により、スクラッチからのトレーニングと比較して、事前訓練されたモデルを微調整すると、7つの分子特性予測タスクと2つの力場タスクのパフォーマンスが大幅に向上することが示された。
論文 参考訳(メタデータ) (2022-11-23T08:36:50Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - A biologically-inspired evaluation of molecular generative machine
learning [17.623886600638716]
分子生成モデル評価のためのバイオインスパイアされた新しいベンチマークを提案する。
本稿では, 創出出力評価のための相補的手法として, レクリエーション指標, 薬物-標的親和性予測, 分子ドッキングを提案する。
論文 参考訳(メタデータ) (2022-08-20T11:01:10Z) - Pre-training Transformers for Molecular Property Prediction Using
Reaction Prediction [0.0]
トランスファーラーニングはコンピュータビジョンや自然言語処理といった分野に大きな影響を与えた。
反応データを用いた分子表現学習のための事前学習手法を提案する。
未学習のベースラインモデルと比較して,12タスクのうち5タスクに対して統計的に有意な正の効果を示した。
論文 参考訳(メタデータ) (2022-07-06T14:51:38Z) - Target-aware Molecular Graph Generation [37.937378787812264]
そこで我々は,SiamFlowを提案する。これはフローが潜在空間内のターゲットシーケンス埋め込みの分布に適合するように強制する。
具体的には、アライメント損失と一様損失を用いて、ターゲットシーケンスの埋め込みと薬物グラフの埋め込みを合意に導く。
実験により,提案手法は,分子グラフ生成に向けた潜在空間における有意な表現を定量的に学習することを示す。
論文 参考訳(メタデータ) (2022-02-10T04:31:14Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。