論文の概要: ADMEOOD: Out-of-Distribution Benchmark for Drug Property Prediction
- arxiv url: http://arxiv.org/abs/2310.07253v1
- Date: Wed, 11 Oct 2023 07:30:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 00:05:43.628875
- Title: ADMEOOD: Out-of-Distribution Benchmark for Drug Property Prediction
- Title(参考訳): admeood: 薬物特性予測のためのアウトオブディストリビューションベンチマーク
- Authors: Shuoying Wei, Xinlong Wen, Lida Zhu, Songquan Li, Rongbo Zhu
- Abstract要約: 本研究は,OODデータセットの体系的キュレーターであるADMEOODと薬物特性予測のためのベンチマークを提案する。
ノイズシフトとコンセプション・コンフリクト・ドリフト(CCD)の2種類のOODデータシフトを含んでいる。
- 参考スコア(独自算出の注目度): 0.6749750044497732
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Obtaining accurate and valid information for drug molecules is a crucial and
challenging task. However, chemical knowledge and information have been
accumulated over the past 100 years from various regions, laboratories, and
experimental purposes. Little has been explored in terms of the
out-of-distribution (OOD) problem with noise and inconsistency, which may lead
to weak robustness and unsatisfied performance. This study proposes a novel
benchmark ADMEOOD, a systematic OOD dataset curator and benchmark specifically
designed for drug property prediction. ADMEOOD obtained 27 ADME (Absorption,
Distribution, Metabolism, Excretion) drug properties from Chembl and relevant
literature. Additionally, it includes two kinds of OOD data shifts: Noise Shift
and Concept Conflict Drift (CCD). Noise Shift responds to the noise level by
categorizing the environment into different confidence levels. On the other
hand, CCD describes the data which has inconsistent label among the original
data. Finally, it tested on a variety of domain generalization models, and the
experimental results demonstrate the effectiveness of the proposed partition
method in ADMEOOD: ADMEOOD demonstrates a significant difference performance
between in-distribution and out-of-distribution data. Moreover, ERM (Empirical
Risk Minimization) and other models exhibit distinct trends in performance
across different domains and measurement types.
- Abstract(参考訳): 薬物分子の正確かつ有効な情報を得ることは重要かつ困難な課題である。
しかし、この100年間、様々な地域、研究室、実験目的から化学知識や情報が蓄積されてきた。
ノイズや不整合によるアウト・オブ・ディストリビューション(OOD)の問題に関してはほとんど検討されていないが、弱い堅牢性と不満足なパフォーマンスをもたらす可能性がある。
本研究は,OODデータセットの体系的キュレーターであるADMEOODと薬物特性予測のためのベンチマークを提案する。
ADMEOOD はケムブルから 27 ADME (Absorption, Distribution, Metabolism, Excretion) の薬物特性と関連文献を得た。
さらに、ノイズシフトとコンセプト衝突ドリフト(CCD)という2種類のOODデータシフトも含まれている。
ノイズシフトは環境を異なる信頼レベルに分類することでノイズレベルに反応する。
一方、CCDは、元のデータ間で一貫性のないラベルを持つデータを記述している。
最後に,様々な領域一般化モデルを用いて実験を行い,ADMEOODにおける分割法の有効性を実験的に検証した。
さらに、EMM(Empirical Risk Minimization)や他のモデルでは、異なる領域や測定タイプにわたるパフォーマンスの傾向を示す。
関連論文リスト
- Rethinking the Evaluation of Out-of-Distribution Detection: A Sorites Paradox [70.57120710151105]
既存のアウト・オブ・ディストリビューション(OOD)検出ベンチマークは、サンプルを新しいラベルでOODデータとして分類する。
いくつかの限界OODサンプルは、実際には分布内(ID)サンプルに密接なセマンティック内容を持ち、OODサンプルをソリテスパラドックス(英語版)と判定する。
この問題に対処するため,Incremental Shift OOD (IS-OOD) というベンチマークを構築した。
論文 参考訳(メタデータ) (2024-06-14T09:27:56Z) - Redesigning Out-of-Distribution Detection on 3D Medical Images [0.5207048071888255]
我々は,ボリューム医療画像とそれに関連する下流タスクの具体例に基づいて,OOD検出問題を再検討した。
本稿では,下流モデルの性能を画像間の擬似指標として用いて異常サンプルを定義する。
我々はこの重み付けを期待パフォーマンスドロップ(EPD)と呼ばれる新しい指標に組み込む。
論文 参考訳(メタデータ) (2023-08-07T10:28:31Z) - LINe: Out-of-Distribution Detection by Leveraging Important Neurons [15.797257361788812]
本稿では,分布内データとOODデータ間のモデル出力の差を解析するための新しい側面を紹介する。
本稿では,分布検出のポストホックアウトのための新しい手法であるLINe( Leveraging Important Neurons)を提案する。
論文 参考訳(メタデータ) (2023-03-24T13:49:05Z) - Unsupervised Evaluation of Out-of-distribution Detection: A Data-centric
Perspective [55.45202687256175]
アウト・オブ・ディストリビューション(OOD)検出法は、個々のテストサンプルがイン・ディストリビューション(IND)なのかOODなのかという、試験対象の真実を持っていると仮定する。
本稿では,OOD検出における教師なし評価問題を初めて紹介する。
我々は,OOD検出性能の教師なし指標としてGscoreを計算する3つの方法を提案する。
論文 参考訳(メタデータ) (2023-02-16T13:34:35Z) - Energy-based Out-of-Distribution Detection for Graph Neural Networks [76.0242218180483]
我々は,GNNSafeと呼ばれるグラフ上での学習のための,シンプルで強力で効率的なOOD検出モデルを提案する。
GNNSafeは、最先端技術に対するAUROCの改善を最大17.0%で達成しており、そのような未開発領域では単純だが強力なベースラインとして機能する可能性がある。
論文 参考訳(メタデータ) (2023-02-06T16:38:43Z) - Augmenting Softmax Information for Selective Classification with
Out-of-Distribution Data [7.221206118679026]
既存のポストホック法はOOD検出でのみ評価した場合とは大きく異なる性能を示す。
本稿では,特徴に依存しない情報を用いて,ソフトマックスに基づく信頼度を向上するSCOD(Softmax Information Retaining Combination, SIRC)の新たな手法を提案する。
多様なImageNetスケールのデータセットと畳み込みニューラルネットワークアーキテクチャの実験は、SIRCがSCODのベースラインを一貫して一致または上回っていることを示している。
論文 参考訳(メタデータ) (2022-07-15T14:39:57Z) - DrugOOD: Out-of-Distribution (OOD) Dataset Curator and Benchmark for
AI-aided Drug Discovery -- A Focus on Affinity Prediction Problems with Noise
Annotations [90.27736364704108]
我々は、AI支援薬物発見のための体系的なOODデータセットキュレーターおよびベンチマークであるTarmOODを提案する。
DrugOODには、ベンチマークプロセスを完全に自動化するオープンソースのPythonパッケージが付属している。
我々は、薬物標的結合親和性予測という、AIDDにおける最も重要な問題の1つに焦点を当てる。
論文 参考訳(メタデータ) (2022-01-24T12:32:48Z) - Exploring Covariate and Concept Shift for Detection and Calibration of
Out-of-Distribution Data [77.27338842609153]
キャラクタリゼーションにより、OODデータの検出と信頼性校正には、それぞれのシフトに対する感度が重要であることが明らかになった。
分布内データのみを用いて両シフトでのOOD検出を改善するために,幾何学的に着想を得た手法を提案する。
我々は,OOD検出とキャリブレーションの両面で,異なるタイプのシフトの下でうまく機能する手法を最初に提案する。
論文 参考訳(メタデータ) (2021-10-28T15:42:55Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。