論文の概要: Assigning Confidence to Molecular Property Prediction
- arxiv url: http://arxiv.org/abs/2102.11439v1
- Date: Tue, 23 Feb 2021 01:03:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-24 13:56:19.801473
- Title: Assigning Confidence to Molecular Property Prediction
- Title(参考訳): 分子特性予測に自信を割り当てる
- Authors: AkshatKumar Nigam, Robert Pollice, Matthew F. D. Hurley, Riley J.
Hickman, Matteo Aldeghi, Naruki Yoshikawa, Seyone Chithrananda, Vincent A.
Voelz, Al\'an Aspuru-Guzik
- Abstract要約: 機械学習は、既存のデータセットから学び、目に見えない分子の予測を実行する強力な戦略として登場した。
薬物設計に関連する分子特性を予測するための一般的な戦略、それに対応する不確実性源および不確実性および信頼性を定量化する方法について議論する。
- 参考スコア(独自算出の注目度): 1.015785232738621
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Introduction: Computational modeling has rapidly advanced over the last
decades, especially to predict molecular properties for chemistry, material
science and drug design. Recently, machine learning techniques have emerged as
a powerful and cost-effective strategy to learn from existing datasets and
perform predictions on unseen molecules. Accordingly, the explosive rise of
data-driven techniques raises an important question: What confidence can be
assigned to molecular property predictions and what techniques can be used for
that purpose?
Areas covered: In this work, we discuss popular strategies for predicting
molecular properties relevant to drug design, their corresponding uncertainty
sources and methods to quantify uncertainty and confidence. First, our
considerations for assessing confidence begin with dataset bias and size,
data-driven property prediction and feature design. Next, we discuss property
simulation via molecular docking, and free-energy simulations of binding
affinity in detail. Lastly, we investigate how these uncertainties propagate to
generative models, as they are usually coupled with property predictors.
Expert opinion: Computational techniques are paramount to reduce the
prohibitive cost and timing of brute-force experimentation when exploring the
enormous chemical space. We believe that assessing uncertainty in property
prediction models is essential whenever closed-loop drug design campaigns
relying on high-throughput virtual screening are deployed. Accordingly,
considering sources of uncertainty leads to better-informed experimental
validations, more reliable predictions and to more realistic expectations of
the entire workflow. Overall, this increases confidence in the predictions and
designs and, ultimately, accelerates drug design.
- Abstract(参考訳): 導入: 計算モデリングは、特に化学、材料科学、薬物設計の分子特性を予測するために、過去数十年間で急速に進歩しています。
近年、機械学習技術は、既存のデータセットから学習し、目に見えない分子の予測を行うための強力で費用効率のよい戦略として出現している。
したがって、データ駆動技術が爆発的に増加し、重要な疑問が持ち上がる: 分子特性予測にどんな信頼が割り当てられるか、その目的にどんな技術が使えるのか?
本研究では, 薬物設計に関連する分子特性を予測するための一般的な戦略, 対応する不確実性源, 不確実性と信頼性を定量化する手法について論じる。
まず、信頼度を評価するための考察は、データセットのバイアスとサイズ、データ駆動プロパティ予測、特徴設計から始まります。
次に,分子ドッキングによる特性シミュレーションと結合親和性の自由エネルギーシミュレーションについて詳しく述べる。
最後に,これらの不確かさが生成モデルにどのように伝播するかについて検討する。
専門家の意見: 巨大な化学空間を探索するときの残酷な力の実験の禁止的な費用そしてタイミングを減らすために計算技術は最も重要です。
高スループットの仮想スクリーニングに頼ったクローズドループ医薬品設計キャンペーンが展開されるたびに、プロパティ予測モデルにおける不確実性を評価することが不可欠です。
したがって、不確実性の源を考慮すると、より詳細な実験的検証、より信頼性の高い予測、およびワークフロー全体のより現実的な期待につながります。
全体として、これは予測および設計の信頼を高め、最終的に薬剤の設計を加速します。
関連論文リスト
- Balancing Molecular Information and Empirical Data in the Prediction of Physico-Chemical Properties [8.649679686652648]
本稿では,分子記述子と表現学習を組み合わせた一般的な手法を提案する。
提案したハイブリッドモデルは,グラフニューラルネットワークを用いた化学構造情報を利用する。
構造に基づく予測が信頼できない場合を自動的に検出し、表現学習に基づく予測によって修正する。
論文 参考訳(メタデータ) (2024-06-12T10:51:00Z) - Towards robust prediction of material properties for nuclear reactor design under scarce data -- a study in creep rupture property [7.068581430279433]
主な課題は、データセットの可用性と、データ、モデル、予測の不確実性についての十分な考慮である。
本稿では, 原子炉設計における材料特性の信頼性予測を目的とした, 不確実性と事前知識の両面でのメタラーニングに基づくアプローチを提案する。
論文 参考訳(メタデータ) (2024-05-28T06:20:14Z) - CogDPM: Diffusion Probabilistic Models via Cognitive Predictive Coding [62.075029712357]
本研究は認知拡散確率モデル(CogDPM)を紹介する。
CogDPMは拡散モデルの階層的サンプリング能力に基づく精度推定法と拡散モデル固有の性質から推定される精度重み付きガイダンスを備える。
我々は,Universal Kindomの降水量と表面風速データセットを用いた実世界の予測タスクにCogDPMを適用した。
論文 参考訳(メタデータ) (2024-05-03T15:54:50Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Confidence and Dispersity Speak: Characterising Prediction Matrix for
Unsupervised Accuracy Estimation [51.809741427975105]
この研究は、ラベルを使わずに、分散シフト下でのモデルの性能を評価することを目的としている。
我々は、両方の特性を特徴付けるのに有効であることが示されている核規範を用いる。
核の基準は既存の手法よりも正確で堅牢であることを示す。
論文 参考訳(メタデータ) (2023-02-02T13:30:48Z) - Low cost prediction of probability distributions of molecular properties
for early virtual screening [0.8702432681310399]
本稿では, 階層的相関再構築手法を適用し, 人口統計, 財務, 天文学的データの解析に応用した。
この手法は、望まれる物理化学的/ADMET特性の可能性が低い化合物の迅速な拒絶を可能にするため、医薬化学者にとって大きな支援となる。
論文 参考訳(メタデータ) (2022-07-21T13:29:26Z) - What Should I Know? Using Meta-gradient Descent for Predictive Feature
Discovery in a Single Stream of Experience [63.75363908696257]
計算強化学習は、未来の感覚の予測を通じて、エージェントの世界の知覚を構築しようとする。
この一連の作業において、オープンな課題は、エージェントがどの予測が意思決定を最も支援できるかを、無限に多くの予測から決定することである。
本稿では,エージェントが何を予測するかを学習するメタ段階的な降下過程,(2)選択した予測の見積もり,3)将来の報酬を最大化するポリシーを生成する方法を紹介する。
論文 参考訳(メタデータ) (2022-06-13T21:31:06Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - Calibrated Uncertainty for Molecular Property Prediction using Ensembles
of Message Passing Neural Networks [11.47132155400871]
我々は、分子や物質の特性を予測するために特別に設計されたメッセージパッシングニューラルネットワークを拡張した。
その結果,分子生成エネルギーのキャリブレーションの不確実性を考慮した予測モデルが得られた。
論文 参考訳(メタデータ) (2021-07-13T13:28:11Z) - Quantifying sources of uncertainty in drug discovery predictions with
probabilistic models [0.0]
予測の不確実性を知ることは、高価な投資決定を行い、患者の安全が最重要である場合に重要である。
薬物発見における機械学習(ML)モデルは、通常、単一の最良の見積もりのみを提供し、不確実性のすべての源を無視します。
確率的予測モデル(PPM)は、データとモデルの両方に不確実性を取り入れ、予測値の分布を返すことができる。
論文 参考訳(メタデータ) (2021-05-18T18:54:54Z) - Explainable Deep Relational Networks for Predicting Compound-Protein
Affinities and Contacts [80.69440684790925]
Deep Relationsは物理にインスパイアされた、本質的に説明可能なアーキテクチャを持つディープリレーショナルネットワークである。
それは最先端技術に対する優れた解釈可能性を示している。
接触予測 9.5, 16.9, 19.3, 5.7 倍の AUPRC をテスト用、複合ユニク、タンパク質ユニク、両ユニクセットで強化する。
論文 参考訳(メタデータ) (2019-12-29T00:14:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。