論文の概要: MUBen: Benchmarking the Uncertainty of Molecular Representation Models
- arxiv url: http://arxiv.org/abs/2306.10060v2
- Date: Mon, 2 Oct 2023 16:44:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-03 17:24:40.634629
- Title: MUBen: Benchmarking the Uncertainty of Molecular Representation Models
- Title(参考訳): MUBen:分子表現モデルの不確かさのベンチマーク
- Authors: Yinghao Li, Lingkai Kong, Yuanqi Du, Yue Yu, Yuchen Zhuang, Wenhao Mu,
Chao Zhang
- Abstract要約: 不確実量化(UQ)法はモデルのキャリブレーションを改善するために用いられる。
我々は、最先端のバックボーン分子表現モデルのための異なるUQ法を評価するMUBenを提案する。
本研究は, バックボーンモデルのUQ選択に関する知見を提供し, 不確実性クリティカルなアプリケーションの研究を容易にする。
- 参考スコア(独自算出の注目度): 34.0371802510095
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large molecular representation models pre-trained on massive unlabeled data
have shown great success in predicting molecular properties. However, these
models may tend to overfit the fine-tuning data, resulting in over-confident
predictions on test data that fall outside of the training distribution. To
address this issue, uncertainty quantification (UQ) methods can be used to
improve the models' calibration of predictions. Although many UQ approaches
exist, not all of them lead to improved performance. While some studies have
included UQ to improve molecular pre-trained models, the process of selecting
suitable backbone and UQ methods for reliable molecular uncertainty estimation
remains underexplored. To address this gap, we present MUBen, which evaluates
different UQ methods for state-of-the-art backbone molecular representation
models to investigate their capabilities. By fine-tuning various backbones
using different molecular descriptors as inputs with UQ methods from different
categories, we critically assess the influence of architectural decisions and
training strategies. Our study offers insights for selecting UQ for backbone
models, which can facilitate research on uncertainty-critical applications in
fields such as materials science and drug discovery.
- Abstract(参考訳): 巨大なラベルのないデータで事前学習された大きな分子表現モデルは、分子特性の予測に大きな成功を収めている。
しかし、これらのモデルは微調整データに過度に適合する傾向があり、トレーニング分布の外にあるテストデータに対する過密な予測をもたらす。
この問題を解決するために、モデルのキャリブレーションを改善するために不確実量化法(UQ)を用いることができる。
多くのUQアプローチが存在するが、それらすべてが性能改善につながるわけではない。
分子前訓練モデルを改善するためのUQを含む研究もあるが、適切なバックボーンの選択プロセスと信頼性の高い分子不確実性推定のためのUQ法はまだ未定である。
このギャップに対処するため,我々は,最先端のバックボーン分子表現モデルのための異なるuq法を評価するmubenを提案する。
異なる分子記述子を異なるカテゴリのUQ手法で入力として様々なバックボーンを微調整することにより、アーキテクチャ決定とトレーニング戦略の影響を批判的に評価する。
本研究は、材料科学や薬物発見などの分野における不確実性クリティカルな応用の研究を促進するために、バックボーンモデルのUQを選択するための洞察を提供する。
関連論文リスト
- Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - Machine Learning Small Molecule Properties in Drug Discovery [44.62264781248437]
我々は, 結合親和性, 溶解性, ADMET (吸収, 分布, 代謝, 排出, 毒性) を含む幅広い特性について検討する。
化学指紋やグラフベースニューラルネットワークなど,既存の一般的な記述子や埋め込みについて論じる。
最後に、モデル予測の理解を提供する技術、特に薬物発見における重要な意思決定について評価する。
論文 参考訳(メタデータ) (2023-08-02T22:18:41Z) - Uncertainty Quantification for Molecular Property Predictions with Graph
Neural Architecture Search [0.755972004983746]
本稿では,分子特性予測のための自動不確実性定量化(UQ)手法であるAutoGNNUQを紹介する。
我々のアプローチでは、分散分解を用いてデータ(アラート)とモデル(エステミック)の不確実性を分離し、それらを減らすための貴重な洞察を提供する。
AutoGNNUQは、正確な不確実性定量化が意思決定に不可欠である薬物発見や材料科学などの領域で広く適用可能である。
論文 参考訳(メタデータ) (2023-07-19T20:03:42Z) - Materials Property Prediction with Uncertainty Quantification: A
Benchmark Study [0.0]
不確実性定量化(UQ)は、堅牢な高性能で一般化可能な材料特性予測モデルの構築において重要性が増している。
本稿では,グラフニューラルネットワークを用いた材料特性予測のためのUQ手法の総合評価を行う。
論文 参考訳(メタデータ) (2022-11-04T03:04:46Z) - Evaluating Point-Prediction Uncertainties in Neural Networks for Drug
Discovery [0.26385121748044166]
ニューラルネットワーク(NN)モデルは、薬物発見プロセスをスピードアップし、失敗率を低下させる可能性がある。
NNモデルの成功には不確実な定量化(UQ)が必要である。
本稿では,薬物発見を目的としたNNモデルの予測不確かさを推定するUQ手法について検討する。
論文 参考訳(メタデータ) (2022-10-31T03:45:11Z) - Towards Robust Visual Question Answering: Making the Most of Biased
Samples via Contrastive Learning [54.61762276179205]
我々は,ビザドサンプルを最大限に活用することで,ロバストなVQAモデルを構築するための新しいコントラスト学習手法 MMBS を提案する。
具体的には、元のトレーニングサンプルからスプリアス相関に関連する情報を排除し、比較学習のための正のサンプルを構築する。
我々は,OODデータセットのVQA-CP v2において,IDデータセットのVQA v2上での堅牢なパフォーマンスを維持しながら,競争性能を達成することで,コントリビューションを検証した。
論文 参考訳(メタデータ) (2022-10-10T11:05:21Z) - Learning continuous models for continuous physics [94.42705784823997]
本研究では,科学技術応用のための機械学習モデルを検証する数値解析理論に基づくテストを開発する。
本研究は,従来のMLトレーニング/テスト手法と一体化して,科学・工学分野におけるモデルの検証を行う方法である。
論文 参考訳(メタデータ) (2022-02-17T07:56:46Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z) - Uncertainty Quantification Using Neural Networks for Molecular Property
Prediction [33.34534208450156]
複数の相補的な性能指標を用いて,5つのベンチマークデータセット上で複数の手法を体系的に評価した。
テストしたどのメソッドも他のどのメソッドよりも絶対的に優れているわけではなく、複数のデータセットにまたがって特に信頼性の高いエラーランキングを生成するものもありません。
我々は,既存の技術が他とよく関係しているように見えるものについて,実践的な勧告で結論付けている。
論文 参考訳(メタデータ) (2020-05-20T13:31:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。