論文の概要: Current Methods for Drug Property Prediction in the Real World
- arxiv url: http://arxiv.org/abs/2309.17161v1
- Date: Tue, 25 Jul 2023 17:50:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 05:39:20.717852
- Title: Current Methods for Drug Property Prediction in the Real World
- Title(参考訳): 現実世界における薬物特性予測の現状と課題
- Authors: Jacob Green, Cecilia Cabrera Diaz, Maximilian A. H. Jakobs, Andrea
Dimitracopoulos, Mark van der Wilk, Ryan D. Greenhalgh
- Abstract要約: 薬物特性の予測は、高価な臨床試験の前に資産の破壊を可能にするために、薬物発見の鍵となる。
異なる論文が異なるデータセットやメソッドをベンチマークしているため、どの方法やアプローチが最も適しているかは、実践者にとって依然として不明である。
私たちの大規模な経験的研究は、さまざまなデータセットや手法に関する多くの初期の研究を結び付けています。
最良の方法はデータセットに依存しており、古典的なMLメソッドで構築された機能は、ディープラーニングよりも優れていることが分かりました。
- 参考スコア(独自算出の注目度): 9.061842820405486
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting drug properties is key in drug discovery to enable de-risking of
assets before expensive clinical trials, and to find highly active compounds
faster. Interest from the Machine Learning community has led to the release of
a variety of benchmark datasets and proposed methods. However, it remains
unclear for practitioners which method or approach is most suitable, as
different papers benchmark on different datasets and methods, leading to
varying conclusions that are not easily compared. Our large-scale empirical
study links together numerous earlier works on different datasets and methods;
thus offering a comprehensive overview of the existing property classes,
datasets, and their interactions with different methods. We emphasise the
importance of uncertainty quantification and the time and therefore cost of
applying these methods in the drug development decision-making cycle. We
discover that the best method depends on the dataset, and that engineered
features with classical ML methods often outperform deep learning.
Specifically, QSAR datasets are typically best analysed with classical methods
such as Gaussian Processes while ADMET datasets are sometimes better described
by Trees or Deep Learning methods such as Graph Neural Networks or language
models. Our work highlights that practitioners do not yet have a
straightforward, black-box procedure to rely on, and sets the precedent for
creating practitioner-relevant benchmarks. Deep learning approaches must be
proven on these benchmarks to become the practical method of choice in drug
property prediction.
- Abstract(参考訳): 薬物特性の予測は、高価な臨床試験の前に資産の破壊を可能とし、より早く高い活性化合物を見つけるために、薬物発見の鍵となる。
機械学習コミュニティからの関心は、さまざまなベンチマークデータセットと提案されたメソッドのリリースにつながった。
しかし、異なる論文が異なるデータセットとメソッドをベンチマークしているため、どの方法やアプローチが最も適しているかは、いまだに不明であり、比較が容易ではない結論に繋がる。
我々の大規模な実証的研究は、さまざまなデータセットとメソッドに関する多くの初期の研究を結びつけ、既存のプロパティクラス、データセット、および異なるメソッドとのインタラクションに関する包括的な概要を提供する。
我々は、医薬品開発意思決定サイクルにおいて、不確実性定量化の重要性と時間とコストを強調する。
最良の方法はデータセットに依存しており、古典的なMLメソッドで構築された機能は、ディープラーニングよりも優れていることが分かりました。
特に、qsarデータセットは典型的にはガウス過程のような古典的手法で分析され、アドメットデータセットは木やグラフニューラルネットワークや言語モデルのようなディープラーニング手法によって記述される。
私たちの研究は、実践者が頼りにする単純でブラックボックスな手順をまだ持っていないことを強調し、実践者が関連するベンチマークを作成する前例を定めています。
深層学習のアプローチは、これらのベンチマークで証明され、薬物特性予測の実用的な選択方法となる必要がある。
関連論文リスト
- A large dataset curation and benchmark for drug target interaction [0.7699646945563469]
生物活性データは、薬物の発見と再資源化において重要な役割を担っている。
複数の公開ソースからキュレートされた非常に大きなデータセットを標準化し、効率的に表現する方法を提案する。
論文 参考訳(メタデータ) (2024-01-30T17:06:25Z) - Machine Learning Small Molecule Properties in Drug Discovery [44.62264781248437]
我々は, 結合親和性, 溶解性, ADMET (吸収, 分布, 代謝, 排出, 毒性) を含む幅広い特性について検討する。
化学指紋やグラフベースニューラルネットワークなど,既存の一般的な記述子や埋め込みについて論じる。
最後に、モデル予測の理解を提供する技術、特に薬物発見における重要な意思決定について評価する。
論文 参考訳(メタデータ) (2023-08-02T22:18:41Z) - A Critical Re-evaluation of Benchmark Datasets for (Deep) Learning-Based
Matching Algorithms [11.264467955516706]
確立された13のデータセットの難易度と適切性を評価するための4つの手法を提案する。
一般的なデータセットの多くは、かなり簡単な分類タスクを処理している。
ベンチマークデータセットを得るための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-03T07:54:54Z) - DCID: Deep Canonical Information Decomposition [84.59396326810085]
本稿では,2つの1次元目標変数間で共有される信号の同定について考察する。
そこで本研究では,地中トラスラベルの存在下で使用可能な評価指標であるICMを提案する。
また、共有変数を学習するための単純かつ効果的なアプローチとして、Deep Canonical Information Decomposition (DCID)を提案する。
論文 参考訳(メタデータ) (2023-06-27T16:59:06Z) - Time Associated Meta Learning for Clinical Prediction [78.99422473394029]
本稿では,時間関連メタラーニング(TAML)手法を提案する。
タスク分割後のスパーシリティ問題に対処するため、TAMLは時間情報共有戦略を採用し、正のサンプル数を増やす。
複数の臨床データセットに対するTAMLの有効性を示す。
論文 参考訳(メタデータ) (2023-03-05T03:54:54Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Towards General and Efficient Active Learning [20.888364610175987]
アクティブラーニングは、限られたアノテーション予算を利用するために最も有益なサンプルを選択することを目的としている。
本稿では,新しい汎用能動学習法(GEAL)を提案する。
提案手法は,同一モデルの単一パス推定を用いて,異なるデータセット上でデータ選択処理を行うことができる。
論文 参考訳(メタデータ) (2021-12-15T08:35:28Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Siloed Federated Learning for Multi-Centric Histopathology Datasets [0.17842332554022694]
本稿では,医学領域における深層学習アーキテクチャのための新しいフェデレーション学習手法を提案する。
局所統計バッチ正規化(BN)層が導入され、協調的に訓練されるが中心に固有のモデルが作られる。
本研究では,Camelyon16およびCamelyon17データセットから抽出した腫瘍組織像の分類法についてベンチマークを行った。
論文 参考訳(メタデータ) (2020-08-17T15:49:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。