論文の概要: Conformal Drug Property Prediction with Density Estimation under
Covariate Shift
- arxiv url: http://arxiv.org/abs/2310.12033v1
- Date: Wed, 18 Oct 2023 15:17:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-19 16:07:18.783092
- Title: Conformal Drug Property Prediction with Density Estimation under
Covariate Shift
- Title(参考訳): 濃度推定による共変量シフトによる共形薬物特性予測
- Authors: Siddhartha Laghuvarapu and Zhen Lin and Jimeng Sun
- Abstract要約: Conformal Prediction (CP) は、分子特性の予測セットをカバレッジ保証付きで作成するための有望なツールである。
ほとんどのデータセットは限られたラベル付きデータを含んでいるが、これは分子が引き出される広大な化学空間を表すものではないかもしれない。
CoDrugは、トレーニングデータと非ラベルデータの両方を活用するエネルギーベースモデルと、分子集合の密度を評価するためにカーネル密度推定(KDE)を採用している。
- 参考スコア(独自算出の注目度): 36.55557979582956
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In drug discovery, it is vital to confirm the predictions of pharmaceutical
properties from computational models using costly wet-lab experiments. Hence,
obtaining reliable uncertainty estimates is crucial for prioritizing drug
molecules for subsequent experimental validation. Conformal Prediction (CP) is
a promising tool for creating such prediction sets for molecular properties
with a coverage guarantee. However, the exchangeability assumption of CP is
often challenged with covariate shift in drug discovery tasks: Most datasets
contain limited labeled data, which may not be representative of the vast
chemical space from which molecules are drawn. To address this limitation, we
propose a method called CoDrug that employs an energy-based model leveraging
both training data and unlabelled data, and Kernel Density Estimation (KDE) to
assess the densities of a molecule set. The estimated densities are then used
to weigh the molecule samples while building prediction sets and rectifying for
distribution shift. In extensive experiments involving realistic distribution
drifts in various small-molecule drug discovery tasks, we demonstrate the
ability of CoDrug to provide valid prediction sets and its utility in
addressing the distribution shift arising from de novo drug design models. On
average, using CoDrug can reduce the coverage gap by over 35% when compared to
conformal prediction sets not adjusted for covariate shift.
- Abstract(参考訳): 創薬においては, 費用のかかるウェットラブ実験を用いて計算モデルから医薬特性の予測を確認することが重要である。
したがって、信頼性の高い不確実性推定を得ることは、その後の実験的検証のために薬物分子の優先順位付けに不可欠である。
コンフォーマル予測(CP)は、そのような分子特性の予測セットをカバレッジ保証で作成するための有望なツールである。
しかし、CPの交換可能性の仮定は、薬物発見タスクの共変量シフトにしばしば挑戦される: ほとんどのデータセットは、限られたラベル付きデータを含んでおり、これは分子が引き出される広大な化学空間を表すものではないかもしれない。
この制限に対処するために、トレーニングデータと非ラベルデータの両方を利用したエネルギーモデルを用いたCoDrug法と、分子集合の密度を評価するカーネル密度推定(KDE)を提案する。
推定密度は、予測セットを構築しながら分子サンプルを測り、分布シフトを補正するために使用される。
様々な小分子薬物発見タスクにおける現実的な分布ドリフトに関する広範な実験において、我々は、CoDrugがド・ノボの薬物設計モデルから生じる分布シフトに有効な予測セットを提供する能力を実証した。
平均的にCoDrugを用いることで、共変量シフトに調整されていない共変予測セットと比較して、カバレッジギャップを35%以上削減することができる。
関連論文リスト
- SE(3)-Invariant Multiparameter Persistent Homology for Chiral-Sensitive
Molecular Property Prediction [1.534667887016089]
多パラメータ持続ホモロジー(MPPH)を用いた新しい分子指紋生成法を提案する。
この技術は、正確な分子特性予測が不可欠である薬物発見と材料科学において、かなりの重要性を持っている。
分子特性の予測における既存の最先端手法よりも優れた性能を示し,MoleculeNetベンチマークで広範囲な評価を行った。
論文 参考訳(メタデータ) (2023-12-12T09:33:54Z) - Confidence and Dispersity Speak: Characterising Prediction Matrix for
Unsupervised Accuracy Estimation [51.809741427975105]
この研究は、ラベルを使わずに、分散シフト下でのモデルの性能を評価することを目的としている。
我々は、両方の特性を特徴付けるのに有効であることが示されている核規範を用いる。
核の基準は既存の手法よりも正確で堅牢であることを示す。
論文 参考訳(メタデータ) (2023-02-02T13:30:48Z) - Accurate, reliable and interpretable solubility prediction of druglike
molecules with attention pooling and Bayesian learning [1.8275108630751844]
可溶性のシリコ予測は, 仮想スクリーニングと鉛最適化において有用性について研究されている。
近年,物理に基づく手法は高スループットタスクには適さないため,実験データを用いた機械学習(ML)手法が普及している。
本稿では,グラフニューラルネットワーク(GNN)を自己注意型読み出し層で開発し,予測性能を向上させる。
論文 参考訳(メタデータ) (2022-09-29T07:48:10Z) - Low cost prediction of probability distributions of molecular properties
for early virtual screening [0.8702432681310399]
本稿では, 階層的相関再構築手法を適用し, 人口統計, 財務, 天文学的データの解析に応用した。
この手法は、望まれる物理化学的/ADMET特性の可能性が低い化合物の迅速な拒絶を可能にするため、医薬化学者にとって大きな支援となる。
論文 参考訳(メタデータ) (2022-07-21T13:29:26Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Associative Learning Mechanism for Drug-Target Interaction Prediction [6.107658437700639]
薬物-標的親和性(DTA)は薬物-標的相互作用(DTI)の強さを表す
従来の手法では、DTA予測プロセスの解釈可能性に欠けていた。
本稿では,対話型学習と自動エンコーダ機構を備えたDTA予測手法を提案する。
論文 参考訳(メタデータ) (2022-05-24T14:25:28Z) - The Hidden Uncertainty in a Neural Networks Activations [105.4223982696279]
ニューラルネットワークの潜在表現の分布は、アウト・オブ・ディストリビューション(OOD)データの検出に成功している。
本研究は、この分布が、モデルの不確実性と相関しているかどうかを考察し、新しい入力に一般化する能力を示す。
論文 参考訳(メタデータ) (2020-12-05T17:30:35Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Adaptive Invariance for Molecule Property Prediction [38.637412590671865]
異種データを超えた一般化や外挿が可能な予測器を学習するための新しい手法を提案する。
提案手法は,最近提案された不変リスク最小化に基づいて拡張する。
我々の予測器は最先端の伝達学習手法をかなりの差で上回っている。
論文 参考訳(メタデータ) (2020-05-05T19:47:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。