論文の概要: Pre-training with Fractional Denoising to Enhance Molecular Property Prediction
- arxiv url: http://arxiv.org/abs/2407.11086v1
- Date: Sun, 14 Jul 2024 11:09:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 20:00:37.453642
- Title: Pre-training with Fractional Denoising to Enhance Molecular Property Prediction
- Title(参考訳): 分子特性予測の促進を目的としたフラクショナルデノイングによる事前学習
- Authors: Yuyan Ni, Shikun Feng, Xin Hong, Yuancheng Sun, Wei-Ying Ma, Zhi-Ming Ma, Qiwei Ye, Yanyan Lan,
- Abstract要約: 本稿では,Frad(Farential Denoising)と呼ばれる分子前訓練フレームワークを導入し,ノイズ設計と強制学習等価性による制約を分離する。
実験により、我々のフレームワークは既存の手法を一貫して上回り、力の予測、量子化学特性、結合親和性タスクにまたがって最先端の結果を確立する。
- 参考スコア(独自算出の注目度): 26.93248595345132
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deep learning methods have been considered promising for accelerating molecular screening in drug discovery and material design. Due to the limited availability of labelled data, various self-supervised molecular pre-training methods have been presented. While many existing methods utilize common pre-training tasks in computer vision (CV) and natural language processing (NLP), they often overlook the fundamental physical principles governing molecules. In contrast, applying denoising in pre-training can be interpreted as an equivalent force learning, but the limited noise distribution introduces bias into the molecular distribution. To address this issue, we introduce a molecular pre-training framework called fractional denoising (Frad), which decouples noise design from the constraints imposed by force learning equivalence. In this way, the noise becomes customizable, allowing for incorporating chemical priors to significantly improve molecular distribution modeling. Experiments demonstrate that our framework consistently outperforms existing methods, establishing state-of-the-art results across force prediction, quantum chemical properties, and binding affinity tasks. The refined noise design enhances force accuracy and sampling coverage, which contribute to the creation of physically consistent molecular representations, ultimately leading to superior predictive performance.
- Abstract(参考訳): ディープラーニング法は、薬物発見と材料設計における分子スクリーニングの促進に有望であると考えられている。
ラベル付きデータの可用性が限られているため、様々な自己制御型分子事前学習法が提案されている。
多くの既存の手法はコンピュータビジョン(CV)や自然言語処理(NLP)で一般的な事前学習タスクを利用しているが、分子の基本的な物理原理を見落としていることが多い。
対照的に、事前学習におけるノイズの除去は等価な力学習と解釈できるが、限られたノイズ分布は分子分布にバイアスをもたらす。
この問題に対処するために,Frad ( fractional denoising) と呼ばれる分子事前学習フレームワークを導入する。
このように、ノイズはカスタマイズ可能となり、化学プリエントを組み込むことで分子分布モデリングを大幅に改善することができる。
実験により、我々のフレームワークは既存の手法を一貫して上回り、力の予測、量子化学特性、結合親和性タスクにまたがって最先端の結果を確立する。
改良されたノイズ設計は、物理的に一貫した分子表現の生成に寄与する力の精度とサンプリングカバレッジを高め、最終的には優れた予測性能をもたらす。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - Sliced Denoising: A Physics-Informed Molecular Pre-Training Method [29.671249096191726]
本稿では,スライスデノナイジング(SliDe)と呼ばれる分子前訓練法を提案する。
SliDeは、結合の長さ、角度、ねじれ角を乱す新しいノイズ戦略を使用して、コンフォーメーションよりも優れたサンプリングを実現する。
その結果,現在最先端の遮音法と比較して,推定力場の精度は42%向上した。
論文 参考訳(メタデータ) (2023-11-03T07:58:05Z) - Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - MolCAP: Molecular Chemical reActivity pretraining and
prompted-finetuning enhanced molecular representation learning [3.179128580341411]
MolCAPは、化学反応性(IMR)知識に基づくグラフ事前学習トランスフォーマーであり、微調整を誘導する。
MolCAPによって推進され、基礎的なグラフニューラルネットワークでさえ、以前のモデルを上回る驚くべきパフォーマンスを達成することができる。
論文 参考訳(メタデータ) (2023-06-13T13:48:06Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Denoise Pretraining on Nonequilibrium Molecules for Accurate and
Transferable Neural Potentials [8.048439531116367]
より正確で伝達可能なGNNポテンシャル予測を実現するために,非平衡分子配座の事前学習を提案する。
小分子で事前学習したモデルでは、顕著な伝達性を示し、多様な分子系で微調整された場合の性能が向上した。
論文 参考訳(メタデータ) (2023-03-03T21:15:22Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z) - Pre-training via Denoising for Molecular Property Prediction [53.409242538744444]
本稿では,3次元分子構造の大規模データセットを平衡に利用した事前学習手法について述べる。
近年のノイズレギュラー化の進展に触発されて, 事前学習の目的は, 雑音の除去に基づくものである。
論文 参考訳(メタデータ) (2022-05-31T22:28:34Z) - Analysis of training and seed bias in small molecules generated with a
conditional graph-based variational autoencoder -- Insights for practical
AI-driven molecule generation [0.0]
活性条件付きグラフベース変分オートエンコーダ(VAE)の出力に及ぼすシードとトレーニングバイアスの影響を解析する。
グラフに基づく生成モデルは, 所望の条件付き活性と, 生成分子における好ましくない物理特性の創出に優れていた。
論文 参考訳(メタデータ) (2021-07-19T16:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。