論文の概要: Accelerating high-throughput virtual screening through molecular
pool-based active learning
- arxiv url: http://arxiv.org/abs/2012.07127v1
- Date: Sun, 13 Dec 2020 19:13:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-09 12:39:25.940799
- Title: Accelerating high-throughput virtual screening through molecular
pool-based active learning
- Title(参考訳): 分子プールを用いた能動学習による高スループット仮想スクリーニングの高速化
- Authors: David E. Graff, Eugene I. Shakhnovich, Connor W. Coley
- Abstract要約: ライブラリのサブセットの予測親和性に基づいてトレーニングされた構造プロパティモデルが、残りのライブラリメンバーにどのように適用できるかを示す。
欲求獲得戦略を用いても,計算コストの大幅な削減が観察された。
- 参考スコア(独自算出の注目度): 2.17167311150369
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Structure-based virtual screening is an important tool in early stage drug
discovery that scores the interactions between a target protein and candidate
ligands. As virtual libraries continue to grow (in excess of $10^8$ molecules),
so too do the resources necessary to conduct exhaustive virtual screening
campaigns on these libraries. However, Bayesian optimization techniques can aid
in their exploration: a surrogate structure-property relationship model trained
on the predicted affinities of a subset of the library can be applied to the
remaining library members, allowing the least promising compounds to be
excluded from evaluation. In this study, we assess various surrogate model
architectures, acquisition functions, and acquisition batch sizes as applied to
several protein-ligand docking datasets and observe significant reductions in
computational costs, even when using a greedy acquisition strategy; for
example, 87.9% of the top-50000 ligands can be found after testing only 2.4% of
a 100M member library. Such model-guided searches mitigate the increasing
computational costs of screening increasingly large virtual libraries and can
accelerate high-throughput virtual screening campaigns with applications beyond
docking.
- Abstract(参考訳): 構造に基づく仮想スクリーニングは、標的タンパク質と候補リガンドとの相互作用を評価する早期の薬物発見において重要なツールである。
仮想ライブラリが(10^8$の分子以上で)成長を続けるにつれ、これらのライブラリ上で徹底した仮想スクリーニングキャンペーンを行うために必要なリソースも増加する。
しかし、ベイズ最適化手法は、ライブラリのサブセットの予測親和性に基づいて訓練された代理構造-プロパティ関係モデルを、残りのライブラリメンバーに適用することができ、最も期待できない化合物を評価から除外することができる。
本研究では,いくつかのタンパク質リガンドドドドッキングデータセットに適用した様々なサロゲートモデルアーキテクチャ,獲得関数,取得バッチサイズを評価し,欲望取得戦略を用いた場合においても計算コストの大幅な削減を観察する。
このようなモデル誘導検索は、ますます大きな仮想ライブラリをスクリーニングする計算コストの増大を緩和し、ドッキング以外のアプリケーションによる高いスループットの仮想スクリーニングキャンペーンを加速させる。
関連論文リスト
- Understanding active learning of molecular docking and its applications [0.6554326244334868]
本研究では,2次元構造のみを用いて,能動的学習手法がドッキングスコアを効果的に予測する方法を検討する。
以上の結果から,サロゲートモデルではドッキング量の高い化合物に代表される構造パターンを記憶する傾向が示唆された。
我々の総合的な分析は、仮想スクリーニングキャンペーンにおけるアクティブラーニング手法の信頼性と潜在的な適用可能性を示している。
論文 参考訳(メタデータ) (2024-06-14T05:43:42Z) - The Power of Resets in Online Reinforcement Learning [73.64852266145387]
ローカルシミュレータアクセス(あるいはローカルプランニング)を用いたオンライン強化学習を通してシミュレータのパワーを探求する。
カバー性が低いMPPは,Qstar$-realizabilityのみのサンプル効率で学習可能であることを示す。
ローカルシミュレーターアクセス下では, 悪名高いExogenous Block MDP問題が抽出可能であることを示す。
論文 参考訳(メタデータ) (2024-04-23T18:09:53Z) - Pareto Optimization to Accelerate Multi-Objective Virtual Screening [11.356174411578515]
EGFRおよびIGF1Rの選択的二重阻害剤であると考えられる4M分子の仮想ライブラリーを探索するツールを開発した。
このワークフローと関連するオープンソースソフトウェアは、分子設計プロジェクトのスクリーニング負担を軽減することができる。
論文 参考訳(メタデータ) (2023-10-16T17:19:46Z) - DrugCLIP: Contrastive Protein-Molecule Representation Learning for
Virtual Screening [16.31607535765497]
DrugCLIPは、仮想スクリーニングのための新しい対照的な学習フレームワークである。
明示的な結合親和性スコアなしで、大量のペアデータから結合タンパク質ポケットと分子の表現を調整できる。
様々な仮想スクリーニングベンチマークにおいて、従来のドッキングや教師あり学習方法よりも大幅に優れています。
論文 参考訳(メタデータ) (2023-10-10T07:08:35Z) - Large-scale Pretraining Improves Sample Efficiency of Active Learning
based Molecule Virtual Screening [3.140895145221042]
能動的学習とベイズ最適化は、探索空間を狭める効果的な方法として証明されている。
本研究では,ベイズ最適化能動学習フレームワークにおける事前学習型トランスフォーマベース言語モデルとグラフニューラルネットワークの性能について検討した。
最高の事前訓練されたモデルは、99.5百万の化合物を含む超大型ライブラリのわずか0.6%をスクリーニングした後、ドッキングスコアによってトップ50000の58.97%を識別し、以前の最先端ベースラインよりも8%改善した。
論文 参考訳(メタデータ) (2023-09-20T23:43:42Z) - Factorization of Multi-Agent Sampling-Based Motion Planning [72.42734061131569]
現代のロボティクスは、共有環境内で複数のエンボディエージェントを動作させることが多い。
標準的なサンプリングベースのアルゴリズムは、ロボットの関節空間における解の探索に使用できる。
我々は、因子化の概念をサンプリングベースアルゴリズムに統合し、既存の手法への最小限の変更しか必要としない。
本稿では, PRM* のサンプル複雑性の観点から解析的ゲインを導出し, RRG の実証結果を示す。
論文 参考訳(メタデータ) (2023-04-01T15:50:18Z) - An efficient graph generative model for navigating ultra-large
combinatorial synthesis libraries [1.5495593104596397]
仮想的でオンデマンドな化学ライブラリーは、化学空間の広大な合成可能な領域をアンロックすることで、早期の薬物発見を変革した。
近年、これらの図書館は数百万から数兆の化合物から急速に成長し、様々な治療標的に対する、発見されていない強力なヒットを隠蔽している。
本稿では,これらの課題を克服するために, Combinatorial Synthesis Library Variational Auto-Encoder (CSLVAE)を提案する。
論文 参考訳(メタデータ) (2022-10-19T15:43:13Z) - Single-Modal Entropy based Active Learning for Visual Question Answering [75.1682163844354]
視覚質問応答(VQA)のマルチモーダル設定におけるアクティブラーニングに対処する
マルチモーダルな入力,画像,質問を考慮し,有効サンプル取得のための新しい手法を提案する。
私たちの新しいアイデアは、実装が簡単で、コスト効率が高く、他のマルチモーダルタスクにも容易に適応できます。
論文 参考訳(メタデータ) (2021-10-21T05:38:45Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - A Provably Efficient Sample Collection Strategy for Reinforcement
Learning [123.69175280309226]
オンライン強化学習(RL)における課題の1つは、エージェントがその振る舞いを最適化するために、環境の探索とサンプルの活用をトレードオフする必要があることである。
1) 生成モデル(環境のスパースシミュレータなど)にアクセス可能な状態のサンプル数を規定する「対象別」アルゴリズム,2) 所定のサンプルをできるだけ早く生成する「対象別」サンプル収集。
論文 参考訳(メタデータ) (2020-07-13T15:17:35Z) - Bayesian active learning for production, a systematic study and a
reusable library [85.32971950095742]
本稿では,現在のアクティブラーニング技術の主な欠点について分析する。
実世界のデータセットの最も一般的な課題が深層能動学習プロセスに与える影響について,系統的研究を行った。
部分的不確実性サンプリングやより大きいクエリサイズといった,アクティブな学習ループを高速化する2つの手法を導出する。
論文 参考訳(メタデータ) (2020-06-17T14:51:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。