論文の概要: ImDrug: A Benchmark for Deep Imbalanced Learning in AI-aided Drug
Discovery
- arxiv url: http://arxiv.org/abs/2209.07921v1
- Date: Fri, 16 Sep 2022 13:35:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-19 12:14:48.725720
- Title: ImDrug: A Benchmark for Deep Imbalanced Learning in AI-aided Drug
Discovery
- Title(参考訳): ImDrug:AI支援薬発見における深層不均衡学習のベンチマーク
- Authors: Lanqing Li, Liang Zeng, Ziqi Gao, Shen Yuan, Yatao Bian, Bingzhe Wu,
Hengtong Zhang, Chan Lu, Yang Yu, Wei Liu, Hongteng Xu, Jia Li, Peilin Zhao,
Pheng-Ann Heng
- Abstract要約: 現実世界の医薬品のデータセットは、しばしば高度に不均衡な分布を示す。
ImDrugはオープンソースのPythonライブラリを備えたベンチマークで、4つの不均衡設定、11のAI対応データセット、54の学習タスク、16のベースラインアルゴリズムで構成されています。
ドラッグ発見パイプラインの幅広い範囲にまたがる問題やソリューションに対して、アクセス可能でカスタマイズ可能なテストベッドを提供する。
- 参考スコア(独自算出の注目度): 79.08833067391093
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The last decade has witnessed a prosperous development of computational
methods and dataset curation for AI-aided drug discovery (AIDD). However,
real-world pharmaceutical datasets often exhibit highly imbalanced
distribution, which is largely overlooked by the current literature but may
severely compromise the fairness and generalization of machine learning
applications. Motivated by this observation, we introduce ImDrug, a
comprehensive benchmark with an open-source Python library which consists of 4
imbalance settings, 11 AI-ready datasets, 54 learning tasks and 16 baseline
algorithms tailored for imbalanced learning. It provides an accessible and
customizable testbed for problems and solutions spanning a broad spectrum of
the drug discovery pipeline such as molecular modeling, drug-target interaction
and retrosynthesis. We conduct extensive empirical studies with novel
evaluation metrics, to demonstrate that the existing algorithms fall short of
solving medicinal and pharmaceutical challenges in the data imbalance scenario.
We believe that ImDrug opens up avenues for future research and development, on
real-world challenges at the intersection of AIDD and deep imbalanced learning.
- Abstract(参考訳): この10年でAIDD(AI-Aided Drug Discovery)のための計算手法とデータセットのキュレーションが盛んになった。
しかし、現実世界の製薬データセットはしばしば高度にバランスの取れない分布を示しており、現在の文献では見過ごされているが、機械学習応用の公平性と一般化を著しく損なう可能性がある。
この観察から得られたImDrugは、オープンソースのPythonライブラリを備えた包括的なベンチマークで、4つの不均衡設定、11のAI対応データセット、54の学習タスク、16のベースラインアルゴリズムで構成されている。
分子モデリング、薬物標的相互作用、レトロシンセシスなど、幅広い薬物発見パイプラインにまたがる問題やソリューションに対して、アクセス可能でカスタマイズ可能なテストベッドを提供する。
既存のアルゴリズムが,データ不均衡シナリオにおける薬学的および薬学的課題の解決に不足していることを証明するため,新しい評価指標を用いた広範な実証研究を行った。
我々はImDrugが、AIDDと深い不均衡学習の交差点における現実世界の課題について、将来の研究開発のための道を開くと信じている。
関連論文リスト
- Drug Discovery SMILES-to-Pharmacokinetics Diffusion Models with Deep Molecular Understanding [1.4952056744888913]
ImagandはSMILES-to-Pharmacokinetic (S2PK)拡散モデルであり、SMILES入力に条件付けされたPKターゲット特性の配列を生成することができる。
Imagandは、データの重複する空間に対する有望なソリューションであり、研究者は薬物発見研究のためのリガンドPKデータを効率的に生成することができる。
論文 参考訳(メタデータ) (2024-08-14T16:01:02Z) - Synthetic Data from Diffusion Models Improve Drug Discovery Prediction [1.3686993145787065]
データあいまいさは、重要な研究課題に答えようとする研究者にとって、データのキュレーションを難しくする。
本稿では,リガンドおよび薬物動態データをエンドツーエンドに生成できる新しい拡散GNNモデルSyngandを提案する。
我々は,AqSolDB,LD50,hERGを中心とした下流回帰タスクにおいて,Syngand生成した合成目標データの有効性について,最初の有望な結果を示した。
論文 参考訳(メタデータ) (2024-05-06T19:09:37Z) - Comprehensive evaluation of deep and graph learning on drug-drug
interactions prediction [43.5957881547028]
近年の人工知能(AI)や深層学習モデル、グラフ学習モデルは、生体医学的応用において有用性を確立している。
DDI(DDI)は、ある薬物が人体に別の薬物が存在することに対する効果の変化を指す。
高度なAIとディープラーニングを正しく適用するために、開発者とユーザは、データリソースの可用性やエンコーディングなど、さまざまな課題に直面する。
論文 参考訳(メタデータ) (2023-06-08T14:54:50Z) - Knowledge-augmented Graph Machine Learning for Drug Discovery: A Survey [6.288056740658763]
グラフ機械学習(GML)は、グラフ構造化バイオメディカルデータをモデル化する優れた能力で注目されている。
近年の研究では、より正確で解釈可能な薬物発見を実現するために、外部のバイオメディカル知識をGMLパイプラインに統合することを提案した。
論文 参考訳(メタデータ) (2023-02-16T12:38:01Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Predicting Seriousness of Injury in a Traffic Accident: A New Imbalanced
Dataset and Benchmark [62.997667081978825]
本稿では,交通事故における傷害の重大性を予測するために,機械学習アルゴリズムの性能を評価する新しいデータセットを提案する。
データセットは、英国運輸省から公開されているデータセットを集約することで作成される。
論文 参考訳(メタデータ) (2022-05-20T21:15:26Z) - Deep learning for drug repurposing: methods, databases, and applications [54.08583498324774]
新しい治療法のために既存の薬物を再利用することは、実験コストの低減で薬物開発を加速する魅力的な解決策である。
本稿では,薬物再資源化のための深層学習手法とツールの活用に関するガイドラインを紹介する。
論文 参考訳(メタデータ) (2022-02-08T09:42:08Z) - DrugOOD: Out-of-Distribution (OOD) Dataset Curator and Benchmark for
AI-aided Drug Discovery -- A Focus on Affinity Prediction Problems with Noise
Annotations [90.27736364704108]
我々は、AI支援薬物発見のための体系的なOODデータセットキュレーターおよびベンチマークであるTarmOODを提案する。
DrugOODには、ベンチマークプロセスを完全に自動化するオープンソースのPythonパッケージが付属している。
我々は、薬物標的結合親和性予測という、AIDDにおける最も重要な問題の1つに焦点を当てる。
論文 参考訳(メタデータ) (2022-01-24T12:32:48Z) - Dropout: Explicit Forms and Capacity Control [57.36692251815882]
各種機械学習問題におけるドロップアウトによるキャパシティ制御について検討する。
ディープラーニングでは、ドロップアウトによるデータ依存型正規化器が、基礎となるディープニューラルネットワークのクラスであるRademacherの複雑さを直接制御していることを示す。
MovieLens, MNIST, Fashion-MNISTなどの実世界のデータセットに関する理論的知見を評価する。
論文 参考訳(メタデータ) (2020-03-06T19:10:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。