論文の概要: Contextual Representation Anchor Network to Alleviate Selection Bias in Few-Shot Drug Discovery
- arxiv url: http://arxiv.org/abs/2410.20711v1
- Date: Mon, 28 Oct 2024 03:54:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:15:28.210234
- Title: Contextual Representation Anchor Network to Alleviate Selection Bias in Few-Shot Drug Discovery
- Title(参考訳): 短距離薬物発見における選択バイアス軽減のための文脈表現アンカーネットワーク
- Authors: Ruifeng Li, Wei Liu, Xiangxin Zhou, Mingqian Li, Yuhua Zhou, Yuan Yao, Qiang Zhang, Hongyang Chen,
- Abstract要約: 本稿では,分子の表現のクラスタ中心をアンカーと呼ぶ,文脈表現アンカーネットワーク(CRA)を提案する。
CRAは、文脈増強を含む二重増強機構を導入し、類似の未標識分子を動的に回収する。
我々は,MoleculeNetおよびFS-Molベンチマークおよびドメイン転送実験におけるアプローチを評価した。
- 参考スコア(独自算出の注目度): 24.39705006290841
- License:
- Abstract: In the drug discovery process, the low success rate of drug candidate screening often leads to insufficient labeled data, causing the few-shot learning problem in molecular property prediction. Existing methods for few-shot molecular property prediction overlook the sample selection bias, which arises from non-random sample selection in chemical experiments. This bias in data representativeness leads to suboptimal performance. To overcome this challenge, we present a novel method named contextual representation anchor Network (CRA), where an anchor refers to a cluster center of the representations of molecules and serves as a bridge to transfer enriched contextual knowledge into molecular representations and enhance their expressiveness. CRA introduces a dual-augmentation mechanism that includes context augmentation, which dynamically retrieves analogous unlabeled molecules and captures their task-specific contextual knowledge to enhance the anchors, and anchor augmentation, which leverages the anchors to augment the molecular representations. We evaluate our approach on the MoleculeNet and FS-Mol benchmarks, as well as in domain transfer experiments. The results demonstrate that CRA outperforms the state-of-the-art by 2.60% and 3.28% in AUC and $\Delta$AUC-PR metrics, respectively, and exhibits superior generalization capabilities.
- Abstract(参考訳): 薬物発見過程において、薬物候補スクリーニングの成功率が低いことは、しばしばラベル付きデータに不足をもたらし、分子特性予測において数発の学習問題を引き起こす。
化学実験における非ランダムなサンプル選択から生じるサンプル選択バイアスを、数発の分子特性予測のための既存の方法が見落としている。
データ代表性のこのバイアスは、最適以下のパフォーマンスをもたらす。
この課題を克服するために, アンカーは分子の表現のクラスタ中心を指し, 豊富な文脈知識を分子表現に伝達し, 表現性を高めるブリッジとして機能する, 文脈表現アンカーネットワーク (CRA) という新しい手法を提案する。
CRAは、文脈増強機構を導入し、文脈増強機構は、動的に類似の未標識分子を検索し、そのタスク固有の文脈知識を捉えてアンカーを強化する。
我々は,MoleculeNetおよびFS-Molベンチマークおよびドメイン転送実験におけるアプローチを評価した。
その結果、CRAはAUCの2.60%、AUCの3.28%、Delta$AUC-PRの3.28%を上回り、優れた一般化能力を示している。
関連論文リスト
- FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Contrastive Dual-Interaction Graph Neural Network for Molecular Property Prediction [0.0]
本稿では,分子特性予測のための自己教師付きグラフニューラルネットワークフレームワークであるDIG-Molを紹介する。
DIG-Molは2つの相互接続ネットワークと運動量蒸留ネットワークを統合し、分子特性を効率的に改善する。
我々は,様々な分子特性予測タスクにおける広範囲な実験的評価により,DIG-Molの最先端性能を確立した。
論文 参考訳(メタデータ) (2024-05-04T10:09:27Z) - Classifier-free graph diffusion for molecular property targeting [14.488714063757278]
この研究は、プロパティターゲティング、すなわち、ターゲットの化学的性質に条件付けられた分子を生成するタスクに焦点を当てている。
本稿では,条件情報を直接学習プロセスに注入して動作する分類器フリーなDiGress(FreeGress)を提案する。
提案手法は,DieGressのプロパティターゲティングタスクに対して,平均絶対誤差を最大79%改善することを示す。
論文 参考訳(メタデータ) (2023-12-28T23:34:38Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - Mitigating Molecular Aggregation in Drug Discovery with Predictive
Insights from Explainable AI [1.0499611180329804]
分子凝集の原因の理解の欠如は、凝集分子を検出するための予測ツールの開発に困難をもたらす。
本稿では, 凝集分子と非凝集分子のデータセットを識別する分子特性と, 分子凝集を予測する機械学習アプローチについて検討する。
提案手法では,解析可能なグラフニューラルネットワークとファクトファクトを使用して,アグリゲーションを確実に予測し,説明し,将来のスクリーニングのための追加の洞察と設計ルールを提供する。
論文 参考訳(メタデータ) (2023-06-03T22:30:45Z) - Context-enriched molecule representations improve few-shot drug
discovery [8.379853456273674]
数発の薬物発見のための新しい方法を提案する。
私たちの基本的な考え方は、既知のコンテキストや参照分子に関する知識によって分子表現を豊かにすることです。
本手法は,FS-Molベンチマークデータセットにおいて,薬物発見のためのいくつかの方法と比較した。
論文 参考訳(メタデータ) (2023-04-24T17:58:05Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。