論文の概要: We Should at Least Be Able to Design Molecules That Dock Well
- arxiv url: http://arxiv.org/abs/2006.16955v4
- Date: Mon, 28 Jun 2021 08:21:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 22:37:29.076208
- Title: We Should at Least Be Able to Design Molecules That Dock Well
- Title(参考訳): ドッキングする分子をデザインするには、最善を尽くす必要がある
- Authors: Tobiasz Cieplinski, Tomasz Danel, Sabina Podlewska, Stanislaw
Jastrzebski
- Abstract要約: そこで本研究では,タンパク質への分子結合を評価する一般的な計算手法であるドッキングに基づくベンチマークを提案する。
グラフベース生成モデルでは,ドッキングスコアの高い分子を現実的な大きさのトレーニングセットを用いて学習すると生成できないことが観察された。
本稿では,簡易なスコアリング関数に基づくベンチマークの簡易版を提案し,テストしたモデルで部分的に解けることを示す。
- 参考スコア(独自算出の注目度): 5.751280593108197
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Designing compounds with desired properties is a key element of the drug
discovery process. However, measuring progress in the field has been
challenging due to the lack of realistic retrospective benchmarks, and the
large cost of prospective validation. To close this gap, we propose a benchmark
based on docking, a popular computational method for assessing molecule binding
to a protein. Concretely, the goal is to generate drug-like molecules that are
scored highly by SMINA, a popular docking software. We observe that popular
graph-based generative models fail to generate molecules with a high docking
score when trained using a realistically sized training set. This suggests a
limitation of the current incarnation of models for de novo drug design.
Finally, we propose a simplified version of the benchmark based on a simpler
scoring function, and show that the tested models are able to partially solve
it. We release the benchmark as an easy to use package available at
https://github.com/cieplinski-tobiasz/smina-docking-benchmark. We hope that our
benchmark will serve as a stepping stone towards the goal of automatically
generating promising drug candidates.
- Abstract(参考訳): 望ましい性質を持つ化合物を設計することは、創薬過程の重要な要素である。
しかし、現実的な振り返りベンチマークの欠如と、将来的な検証の大幅なコストのため、この分野の進捗の測定は困難だった。
このギャップを埋めるために,タンパク質への分子結合を評価する一般的な計算手法であるドッキングに基づくベンチマークを提案する。
具体的には、人気のあるドッキングソフトウェアであるsminaによって高得点の薬のような分子を作ることが目標だ。
グラフベース生成モデルでは,ドッキングスコアの高い分子を現実的な大きさのトレーニングセットを用いて学習すると生成できないことが観察された。
これは、現在のデ・ノヴォの薬物設計モデルに限界があることを示唆している。
最後に、より単純なスコアリング関数に基づくベンチマークの簡易版を提案し、テストモデルで部分的に解くことができることを示す。
ベンチマークはhttps://github.com/cieplinski-tobiasz/smina-docking-benchmarkで入手可能なパッケージとしてリリースしています。
当社のベンチマークが、将来有望な薬物候補を自動的に生成する目標に向けた足掛かりになることを期待しています。
関連論文リスト
- Small Effect Sizes in Malware Detection? Make Harder Train/Test Splits! [51.668411293817464]
業界関係者は、モデルが数億台のマシンにデプロイされているため、マルウェア検出精度の小さな改善に気を配っている。
学術研究はしばしば1万のサンプルの順序で公開データセットに制限される。
利用可能なサンプルのプールから難易度ベンチマークを生成するためのアプローチを考案する。
論文 参考訳(メタデータ) (2023-12-25T21:25:55Z) - Delta Score: Improving the Binding Assessment of Structure-Based Drug
Design Methods [14.272327734087598]
そこで本研究では,有形医薬品要求量に基づく新しい評価基準であるデルタスコアについて紹介する。
実験の結果,現行の深部生成モデルで生成する分子はデルタ値で評価すると,地上基準真理よりもかなり遅れていることがわかった。
論文 参考訳(メタデータ) (2023-11-01T08:37:39Z) - Lo-Hi: Practical ML Drug Discovery Benchmark [0.0]
薬物発見の望みの1つは、機械学習モデルを使用して分子特性を予測することである。
既存の分子特性予測のベンチマークは非現実的であり、実際にモデルを適用することとは相容れない。
我々は、実薬発見プロセスに対応する、新しい実践的なemphLo-Hiベンチマークを作成しました。
論文 参考訳(メタデータ) (2023-10-10T08:06:32Z) - TacoGFN: Target Conditioned GFlowNet for Structure-Based Drug Design [4.157149426347366]
我々は、特定のタンパク質ポケットターゲットに条件付けされた薬物様化合物の自動生成を目指している。
ポケットコンディショニングされた分子生成タスクをRL問題とし,ターゲット条件生成フローネットワークモデルであるTacoGFNを開発した。
論文 参考訳(メタデータ) (2023-10-05T00:45:04Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - DOCKSTRING: easy molecular docking yields better benchmarks for ligand
design [3.848364262836075]
本稿では、3つのコンポーネントからなる機械学習モデルの有意義かつ堅牢な比較のためのバンドルであるDOCKSTRINGを提案する。
Pythonパッケージはロバストなリガンドとターゲットの準備プロトコルを実装しており、非専門家が意味のあるドッキングスコアを得ることができる。
私たちのデータセットには、ドッキングのポーズと、フルマトリックスである最初のサイズが含まれています。
論文 参考訳(メタデータ) (2021-10-29T01:37:13Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [66.84839948236478]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。