論文の概要: Conformal Drug Property Prediction with Density Estimation under
Covariate Shift
- arxiv url: http://arxiv.org/abs/2310.12033v1
- Date: Wed, 18 Oct 2023 15:17:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-19 16:07:18.783092
- Title: Conformal Drug Property Prediction with Density Estimation under
Covariate Shift
- Title(参考訳): 濃度推定による共変量シフトによる共形薬物特性予測
- Authors: Siddhartha Laghuvarapu and Zhen Lin and Jimeng Sun
- Abstract要約: Conformal Prediction (CP) は、分子特性の予測セットをカバレッジ保証付きで作成するための有望なツールである。
ほとんどのデータセットは限られたラベル付きデータを含んでいるが、これは分子が引き出される広大な化学空間を表すものではないかもしれない。
CoDrugは、トレーニングデータと非ラベルデータの両方を活用するエネルギーベースモデルと、分子集合の密度を評価するためにカーネル密度推定(KDE)を採用している。
- 参考スコア(独自算出の注目度): 36.55557979582956
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In drug discovery, it is vital to confirm the predictions of pharmaceutical
properties from computational models using costly wet-lab experiments. Hence,
obtaining reliable uncertainty estimates is crucial for prioritizing drug
molecules for subsequent experimental validation. Conformal Prediction (CP) is
a promising tool for creating such prediction sets for molecular properties
with a coverage guarantee. However, the exchangeability assumption of CP is
often challenged with covariate shift in drug discovery tasks: Most datasets
contain limited labeled data, which may not be representative of the vast
chemical space from which molecules are drawn. To address this limitation, we
propose a method called CoDrug that employs an energy-based model leveraging
both training data and unlabelled data, and Kernel Density Estimation (KDE) to
assess the densities of a molecule set. The estimated densities are then used
to weigh the molecule samples while building prediction sets and rectifying for
distribution shift. In extensive experiments involving realistic distribution
drifts in various small-molecule drug discovery tasks, we demonstrate the
ability of CoDrug to provide valid prediction sets and its utility in
addressing the distribution shift arising from de novo drug design models. On
average, using CoDrug can reduce the coverage gap by over 35% when compared to
conformal prediction sets not adjusted for covariate shift.
- Abstract(参考訳): 創薬においては, 費用のかかるウェットラブ実験を用いて計算モデルから医薬特性の予測を確認することが重要である。
したがって、信頼性の高い不確実性推定を得ることは、その後の実験的検証のために薬物分子の優先順位付けに不可欠である。
コンフォーマル予測(CP)は、そのような分子特性の予測セットをカバレッジ保証で作成するための有望なツールである。
しかし、CPの交換可能性の仮定は、薬物発見タスクの共変量シフトにしばしば挑戦される: ほとんどのデータセットは、限られたラベル付きデータを含んでおり、これは分子が引き出される広大な化学空間を表すものではないかもしれない。
この制限に対処するために、トレーニングデータと非ラベルデータの両方を利用したエネルギーモデルを用いたCoDrug法と、分子集合の密度を評価するカーネル密度推定(KDE)を提案する。
推定密度は、予測セットを構築しながら分子サンプルを測り、分布シフトを補正するために使用される。
様々な小分子薬物発見タスクにおける現実的な分布ドリフトに関する広範な実験において、我々は、CoDrugがド・ノボの薬物設計モデルから生じる分布シフトに有効な予測セットを提供する能力を実証した。
平均的にCoDrugを用いることで、共変量シフトに調整されていない共変予測セットと比較して、カバレッジギャップを35%以上削減することができる。
関連論文リスト
- GramSeq-DTA: A grammar-based drug-target affinity prediction approach fusing gene expression information [1.2289361708127877]
薬物や標的の構造情報と化学摂動情報を統合するGramSeq-DTAを提案する。
我々の手法は、広く使われているDTAデータセットで検証された場合、現在の最先端のDTA予測モデルよりも優れている。
論文 参考訳(メタデータ) (2024-11-03T03:17:09Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - SE(3)-Invariant Multiparameter Persistent Homology for Chiral-Sensitive
Molecular Property Prediction [1.534667887016089]
多パラメータ持続ホモロジー(MPPH)を用いた新しい分子指紋生成法を提案する。
この技術は、正確な分子特性予測が不可欠である薬物発見と材料科学において、かなりの重要性を持っている。
分子特性の予測における既存の最先端手法よりも優れた性能を示し,MoleculeNetベンチマークで広範囲な評価を行った。
論文 参考訳(メタデータ) (2023-12-12T09:33:54Z) - Accurate, reliable and interpretable solubility prediction of druglike
molecules with attention pooling and Bayesian learning [1.8275108630751844]
可溶性のシリコ予測は, 仮想スクリーニングと鉛最適化において有用性について研究されている。
近年,物理に基づく手法は高スループットタスクには適さないため,実験データを用いた機械学習(ML)手法が普及している。
本稿では,グラフニューラルネットワーク(GNN)を自己注意型読み出し層で開発し,予測性能を向上させる。
論文 参考訳(メタデータ) (2022-09-29T07:48:10Z) - Low cost prediction of probability distributions of molecular properties
for early virtual screening [0.8702432681310399]
本稿では, 階層的相関再構築手法を適用し, 人口統計, 財務, 天文学的データの解析に応用した。
この手法は、望まれる物理化学的/ADMET特性の可能性が低い化合物の迅速な拒絶を可能にするため、医薬化学者にとって大きな支援となる。
論文 参考訳(メタデータ) (2022-07-21T13:29:26Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Adaptive Invariance for Molecule Property Prediction [38.637412590671865]
異種データを超えた一般化や外挿が可能な予測器を学習するための新しい手法を提案する。
提案手法は,最近提案された不変リスク最小化に基づいて拡張する。
我々の予測器は最先端の伝達学習手法をかなりの差で上回っている。
論文 参考訳(メタデータ) (2020-05-05T19:47:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。