Fugu-MT 論文翻訳(概要): MUBen: Benchmarking the Uncertainty of Pre-Trained Models for Molecular Property Prediction

論文の概要: MUBen: Benchmarking the Uncertainty of Pre-Trained Models for Molecular Property Prediction

arxiv url: http://arxiv.org/abs/2306.10060v1
Date: Wed, 14 Jun 2023 13:06:04 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-26 01:29:00.075913
Title: MUBen: Benchmarking the Uncertainty of Pre-Trained Models for Molecular Property Prediction
Title（参考訳）: MUBen:分子特性予測のための事前学習モデルの不確かさのベンチマーク
Authors: Yinghao Li, Lingkai Kong, Yuanqi Du, Yue Yu, Yuchen Zhuang, Wenhao Mu, Chao Zhang
Abstract要約: 特性予測と不確実性推定の両方において,バックボーンモデルとUQモデルの組み合わせを評価し,それらの性能を定量的に評価する。本研究は、材料科学や薬物発見などの分野における不確実性クリティカルな応用の研究を促進するために、UQモデルとバックボーンモデルを選択するための洞察を提供する。
参考スコア（独自算出の注目度）: 18.007038030585296
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Transformer models pre-trained on massive unlabeled molecular data have shown great success in predicting molecular properties. However, these models can be prone to overfitting during fine-tuning, resulting in over-confident predictions on test data that fall outside of the training distribution. To address this issue, uncertainty quantification (UQ) methods can be used to improve the models' calibration of predictions. Although many UQ approaches exist, not all of them lead to improved performance. While some studies have used UQ to improve molecular pre-trained models, the process of selecting suitable backbone and UQ methods for reliable molecular uncertainty estimation remains underexplored. To address this gap, we present MUBen, which evaluates different combinations of backbone and UQ models to quantify their performance for both property prediction and uncertainty estimation. By fine-tuning various backbone molecular representation models using different molecular descriptors as inputs with UQ methods from different categories, we critically assess the influence of architectural decisions and training strategies. Our study offers insights for selecting UQ and backbone models, which can facilitate research on uncertainty-critical applications in fields such as materials science and drug discovery.
Abstract（参考訳）: 大量のラベルのない分子データに基づいて事前訓練された大きなトランスフォーマーモデルは、分子特性を予測することに成功している。しかし、これらのモデルは微調整中に過度に適合しがちであり、トレーニング分布の外側にあるテストデータに対する過密な予測が引き起こされる。この問題を解決するために、モデルのキャリブレーションを改善するために不確実量化法(UQ)を用いることができる。多くのUQアプローチが存在するが、それらすべてが性能改善につながるわけではない。分子前訓練モデルを改善するためにUQを用いた研究もあるが、信頼性の高い分子不確実性推定のための適切なバックボーンとUQ法を選択するプロセスはまだ未定である。このギャップに対処するために,backboneモデルとuqモデルの異なる組み合わせを評価し,特性予測と不確実性推定の両方のパフォーマンスを定量化するmubenを提案する。異なる分子記述子を用いた様々なバックボーン分子表現モデルを、異なるカテゴリからのUQ手法による入力として微調整することにより、アーキテクチャ決定とトレーニング戦略の影響を批判的に評価する。本研究は、材料科学や薬物発見などの分野における不確実性クリティカルな応用の研究を促進するために、UQモデルとバックボーンモデルを選択するための洞察を提供する。

関連論文リスト

Foundation Models for Discovery and Exploration in Chemical Space [57.97784111110166]
MISTは、大規模なラベルなしデータセットに基づいて訓練された分子基盤モデルのファミリーである。我々は、これらのモデルが化学空間をまたいだ現実世界の問題を解決する能力を実証する。
論文参考訳（メタデータ） (2025-10-20T17:56:01Z)
Composable Score-based Graph Diffusion Model for Multi-Conditional Molecular Generation [85.58520120011269]
本研究では,具体的スコアを用いてスコアマッチングを離散グラフに拡張するComposable Score-based Graph Diffusion Model (CSGD)を提案する。 CSGDは従来の手法よりも平均15.3%の制御性向上を実現していることを示す。本研究は, 離散グラフ生成におけるスコアベースモデリングの実用的利点と, フレキシブルでマルチプロパタイトな分子設計のためのキャパシティを強調した。
論文参考訳（メタデータ） (2025-09-11T13:37:56Z)
Benchmarking Pretrained Molecular Embedding Models For Molecular Representation Learning [0.0]
事前学習されたニューラルネットワークは化学や小さな分子の薬物設計に大きな関心を集めている。本研究は,25データセットにまたがる25モデルについて,これまでで最も広範な比較を行ったものである。
論文参考訳（メタデータ） (2025-08-08T10:29:24Z)
Influence Functions for Scalable Data Attribution in Diffusion Models [52.92223039302037]
拡散モデルは、生成的モデリングに大きな進歩をもたらした。しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。本稿では,テキスト・インフルエンス・ファンクション・フレームワークを開発することにより,このような課題に対処することを目的とする。
論文参考訳（メタデータ） (2024-10-17T17:59:02Z)
Opinion-Unaware Blind Image Quality Assessment using Multi-Scale Deep Feature Statistics [54.08757792080732]
我々は,事前学習された視覚モデルからの深い特徴を統計的解析モデルと統合して,意見認識のないBIQA(OU-BIQA)を実現することを提案する。提案モデルは,最先端のBIQAモデルと比較して,人間の視覚的知覚との整合性に優れる。
論文参考訳（メタデータ） (2024-05-29T06:09:34Z)
Epistemic Uncertainty Quantification For Pre-trained Neural Network [27.444465823508715]
疫学的不確実性定量化(UQ)は、モデルが知識を欠いている場所を特定する。ベイジアンニューラルネットワークに基づく従来のUQ法は、事前訓練された非ベイジアンモデルには適さない。
論文参考訳（メタデータ） (2024-04-15T20:21:05Z)
Unified Uncertainty Estimation for Cognitive Diagnosis Models [70.46998436898205]
本稿では,幅広い認知診断モデルに対する統一的不確実性推定手法を提案する。診断パラメータの不確かさをデータ・アスペクトとモデル・アスペクトに分解する。本手法は有効であり,認知診断の不確実性に関する有用な知見を提供することができる。
論文参考訳（メタデータ） (2024-03-09T13:48:20Z)
Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文参考訳（メタデータ） (2023-10-22T04:06:44Z)
Machine Learning Small Molecule Properties in Drug Discovery [44.62264781248437]
我々は, 結合親和性, 溶解性, ADMET (吸収, 分布, 代謝, 排出, 毒性) を含む幅広い特性について検討する。化学指紋やグラフベースニューラルネットワークなど,既存の一般的な記述子や埋め込みについて論じる。最後に、モデル予測の理解を提供する技術、特に薬物発見における重要な意思決定について評価する。
論文参考訳（メタデータ） (2023-08-02T22:18:41Z)
Uncertainty Quantification for Molecular Property Predictions with Graph Neural Architecture Search [2.711812013460678]
本稿では,分子特性予測のための自動不確実性定量化(UQ)手法であるAutoGNNUQを紹介する。我々のアプローチでは、分散分解を用いてデータ(アラート)とモデル(エステミック)の不確実性を分離し、それらを減らすための貴重な洞察を提供する。 AutoGNNUQは、正確な不確実性定量化が意思決定に不可欠である薬物発見や材料科学などの領域で広く適用可能である。
論文参考訳（メタデータ） (2023-07-19T20:03:42Z)
Evaluating Point-Prediction Uncertainties in Neural Networks for Drug Discovery [0.26385121748044166]
ニューラルネットワーク(NN)モデルは、薬物発見プロセスをスピードアップし、失敗率を低下させる可能性がある。 NNモデルの成功には不確実な定量化(UQ)が必要である。本稿では,薬物発見を目的としたNNモデルの予測不確かさを推定するUQ手法について検討する。
論文参考訳（メタデータ） (2022-10-31T03:45:11Z)
Learning continuous models for continuous physics [94.42705784823997]
本研究では,科学技術応用のための機械学習モデルを検証する数値解析理論に基づくテストを開発する。本研究は,従来のMLトレーニング/テスト手法と一体化して,科学・工学分野におけるモデルの検証を行う方法である。
論文参考訳（メタデータ） (2022-02-17T07:56:46Z)
Conformal Prediction Under Feedback Covariate Shift for Biomolecular Design [56.86533144730384]
本稿では,トレーニングデータとテストデータが統計的に依存した環境での予測不確実性を定量化する手法を提案する。モチベーション・ユースケースとして,本手法が設計したタンパク質の適合性予測の不確かさを定量化する方法を実データで示す。
論文参考訳（メタデータ） (2022-02-08T02:59:12Z)
Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文参考訳（メタデータ） (2021-11-30T06:10:22Z)
Uncertainty Quantification Using Neural Networks for Molecular Property Prediction [33.34534208450156]
複数の相補的な性能指標を用いて,5つのベンチマークデータセット上で複数の手法を体系的に評価した。テストしたどのメソッドも他のどのメソッドよりも絶対的に優れているわけではなく、複数のデータセットにまたがって特に信頼性の高いエラーランキングを生成するものもありません。我々は,既存の技術が他とよく関係しているように見えるものについて,実践的な勧告で結論付けている。
論文参考訳（メタデータ） (2020-05-20T13:31:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。