論文の概要: We Should at Least Be Able to Design Molecules That Dock Well
- arxiv url: http://arxiv.org/abs/2006.16955v4
- Date: Mon, 28 Jun 2021 08:21:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 22:37:29.076208
- Title: We Should at Least Be Able to Design Molecules That Dock Well
- Title(参考訳): ドッキングする分子をデザインするには、最善を尽くす必要がある
- Authors: Tobiasz Cieplinski, Tomasz Danel, Sabina Podlewska, Stanislaw
Jastrzebski
- Abstract要約: そこで本研究では,タンパク質への分子結合を評価する一般的な計算手法であるドッキングに基づくベンチマークを提案する。
グラフベース生成モデルでは,ドッキングスコアの高い分子を現実的な大きさのトレーニングセットを用いて学習すると生成できないことが観察された。
本稿では,簡易なスコアリング関数に基づくベンチマークの簡易版を提案し,テストしたモデルで部分的に解けることを示す。
- 参考スコア(独自算出の注目度): 5.751280593108197
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Designing compounds with desired properties is a key element of the drug
discovery process. However, measuring progress in the field has been
challenging due to the lack of realistic retrospective benchmarks, and the
large cost of prospective validation. To close this gap, we propose a benchmark
based on docking, a popular computational method for assessing molecule binding
to a protein. Concretely, the goal is to generate drug-like molecules that are
scored highly by SMINA, a popular docking software. We observe that popular
graph-based generative models fail to generate molecules with a high docking
score when trained using a realistically sized training set. This suggests a
limitation of the current incarnation of models for de novo drug design.
Finally, we propose a simplified version of the benchmark based on a simpler
scoring function, and show that the tested models are able to partially solve
it. We release the benchmark as an easy to use package available at
https://github.com/cieplinski-tobiasz/smina-docking-benchmark. We hope that our
benchmark will serve as a stepping stone towards the goal of automatically
generating promising drug candidates.
- Abstract(参考訳): 望ましい性質を持つ化合物を設計することは、創薬過程の重要な要素である。
しかし、現実的な振り返りベンチマークの欠如と、将来的な検証の大幅なコストのため、この分野の進捗の測定は困難だった。
このギャップを埋めるために,タンパク質への分子結合を評価する一般的な計算手法であるドッキングに基づくベンチマークを提案する。
具体的には、人気のあるドッキングソフトウェアであるsminaによって高得点の薬のような分子を作ることが目標だ。
グラフベース生成モデルでは,ドッキングスコアの高い分子を現実的な大きさのトレーニングセットを用いて学習すると生成できないことが観察された。
これは、現在のデ・ノヴォの薬物設計モデルに限界があることを示唆している。
最後に、より単純なスコアリング関数に基づくベンチマークの簡易版を提案し、テストモデルで部分的に解くことができることを示す。
ベンチマークはhttps://github.com/cieplinski-tobiasz/smina-docking-benchmarkで入手可能なパッケージとしてリリースしています。
当社のベンチマークが、将来有望な薬物候補を自動的に生成する目標に向けた足掛かりになることを期待しています。
関連論文リスト
- Dockformer: A transformer-based molecular docking paradigm for large-scale virtual screening [29.886873241333433]
複合ライブラリのサイズが大きくなるにつれて、従来のドッキングモデルの複雑さが増す。
ディープラーニングアルゴリズムは、ドッキングプロセスのスピードを高めるために、データ駆動リサーチと開発モデルを提供することができる。
本研究では,Dockformerという,ディープラーニングに基づくドッキング手法を紹介する。
論文 参考訳(メタデータ) (2024-11-11T06:25:13Z) - Small Effect Sizes in Malware Detection? Make Harder Train/Test Splits! [51.668411293817464]
業界関係者は、モデルが数億台のマシンにデプロイされているため、マルウェア検出精度の小さな改善に気を配っている。
学術研究はしばしば1万のサンプルの順序で公開データセットに制限される。
利用可能なサンプルのプールから難易度ベンチマークを生成するためのアプローチを考案する。
論文 参考訳(メタデータ) (2023-12-25T21:25:55Z) - Delta Score: Improving the Binding Assessment of Structure-Based Drug
Design Methods [14.272327734087598]
そこで本研究では,有形医薬品要求量に基づく新しい評価基準であるデルタスコアについて紹介する。
実験の結果,現行の深部生成モデルで生成する分子はデルタ値で評価すると,地上基準真理よりもかなり遅れていることがわかった。
論文 参考訳(メタデータ) (2023-11-01T08:37:39Z) - Lo-Hi: Practical ML Drug Discovery Benchmark [0.0]
薬物発見の望みの1つは、機械学習モデルを使用して分子特性を予測することである。
既存の分子特性予測のベンチマークは非現実的であり、実際にモデルを適用することとは相容れない。
我々は、実薬発見プロセスに対応する、新しい実践的なemphLo-Hiベンチマークを作成しました。
論文 参考訳(メタデータ) (2023-10-10T08:06:32Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - nanoLM: an Affordable LLM Pre-training Benchmark via Accurate Loss Prediction across Scales [65.01417261415833]
我々は,最大更新パラメトリゼーション(muP)がスケーリング法則の正確な適合を可能にするという観測に基づいて,事前学習損失を予測する手法を提案する。
トレーニング前コストの約14%で、52Bまでのモデルの損失を正確に予測できる。
NanoLMのゴールは、限られた資源を持つ研究者が大きなモデルで有意義な結論に達することを可能にすることです。
論文 参考訳(メタデータ) (2023-04-14T00:45:01Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - DOCKSTRING: easy molecular docking yields better benchmarks for ligand
design [3.848364262836075]
本稿では、3つのコンポーネントからなる機械学習モデルの有意義かつ堅牢な比較のためのバンドルであるDOCKSTRINGを提案する。
Pythonパッケージはロバストなリガンドとターゲットの準備プロトコルを実装しており、非専門家が意味のあるドッキングスコアを得ることができる。
私たちのデータセットには、ドッキングのポーズと、フルマトリックスである最初のサイズが含まれています。
論文 参考訳(メタデータ) (2021-10-29T01:37:13Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。