論文の概要: When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra
- arxiv url: http://arxiv.org/abs/2603.10950v1
- Date: Wed, 11 Mar 2026 16:40:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:33.057483
- Title: When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra
- Title(参考訳): アノテーションをいつ信頼すべきか?質量スペクトルからの分子構造検索のための選択的予測
- Authors: Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman,
- Abstract要約: 臨床代謝学や環境スクリーニングなどの高度な応用では、誤ったアノテーションが深刻な結果をもたらす可能性がある。
我々はMS/MSスペクトルからの分子構造検索のための選択的予測フレームワークを導入する。
- 参考スコア(独自算出の注目度): 3.2012147865361094
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning methods for identifying molecular structures from tandem mass spectra (MS/MS) have advanced rapidly, yet current approaches still exhibit significant error rates. In high-stakes applications such as clinical metabolomics and environmental screening, incorrect annotations can have serious consequences, making it essential to determine when a prediction can be trusted. We introduce a selective prediction framework for molecular structure retrieval from MS/MS spectra, enabling models to abstain from predictions when uncertainty is too high. We formulate the problem within the risk-coverage tradeoff framework and comprehensively evaluate uncertainty quantification strategies at two levels of granularity: fingerprint-level uncertainty over predicted molecular fingerprint bits, and retrieval-level uncertainty over candidate rankings. We compare scoring functions including first-order confidence measures, aleatoric and epistemic uncertainty estimates from second-order distributions, as well as distance-based measures in the latent space. All experiments are conducted on the MassSpecGym benchmark. Our analysis reveals that while fingerprint-level uncertainty scores are poor proxies for retrieval success, computationally inexpensive first-order confidence measures and retrieval-level aleatoric uncertainty achieve strong risk-coverage tradeoffs across evaluation settings. We demonstrate that by applying distribution-free risk control via generalization bounds, practitioners can specify a tolerable error rate and obtain a subset of annotations satisfying that constraint with high probability.
- Abstract(参考訳): タンデム質量スペクトル(MS/MS)から分子構造を同定する機械学習手法は急速に進歩しているが、現在のアプローチでは大きなエラー率を示している。
臨床代謝学や環境スクリーニングなどの高度な応用では、誤ったアノテーションが深刻な結果をもたらす可能性があるため、予測がいつ信頼できるかを決定することが不可欠である。
我々はMS/MSスペクトルからの分子構造検索のための選択的予測フレームワークを導入する。
リスクカバレッジトレードオフフレームワークの問題を定式化し、予測された分子指紋ビットに対する指紋レベルの不確実性と、候補ランキングに対する検索レベルの不確実性という2つのレベルで不確実性定量化戦略を包括的に評価する。
本研究では,2次分布から推定される1次信頼度,アレータリックおよびエピステマティックな不確実性,および潜伏空間における距離に基づく測度などのスコアリング関数を比較した。
実験はすべてMassSpecGymベンチマークで実施されている。
分析の結果, 指紋レベルの不確実性スコアは検索成功のプロキシに乏しいが, 計算コストの低い1次信頼度尺度と検索レベルの不確実性は, 評価設定間での強いリスク被覆トレードオフを実現することがわかった。
一般化境界を通した分布自由リスク制御を適用することで、許容可能なエラー率を指定でき、その制約を高い確率で満たすアノテーションのサブセットを得ることができることを示す。
関連論文リスト
- Uncertainty-Calibrated Explainable AI for Fetal Ultrasound Plane Classification [0.0]
胎児超音波標準平面分類は、出生前生検と異常検診の信頼性を高める。
実世界の展開は、ドメインシフト、画像ノイズ、予測される確率のキャリブレーションによって制限される。
本稿では,胎児平面分類における不確実性校正可能なAIの実践的枠組みを提案する。
論文 参考訳(メタデータ) (2026-01-02T21:32:26Z) - Localized Uncertainty Quantification in Random Forests via Proximities [1.0195618602298684]
機械学習では、不確実性定量化はモデルの予測の信頼性を評価するのに役立つ。
従来のアプローチでは予測精度が重視されることが多いが、不確実性対策の導入に焦点が当てられている。
自然発生試験セットと類似度尺度(確率)をランダム林の副産物と見なす新しいアプローチを提案する。
論文 参考訳(メタデータ) (2025-09-26T20:53:28Z) - Uncertainty-Driven Reliability: Selective Prediction and Trustworthy Deployment in Modern Machine Learning [1.2183405753834562]
この論文は、不確実性推定が機械学習(ML)システムの安全性と信頼性を高める方法について考察する。
まず、モデルのトレーニング軌道は、アーキテクチャの変更や損失を伴わずに活用できるような、豊富な不確実性信号を含むことを示す。
本稿では,タスク間で動作し,深層アンサンブルのコストを回避し,最先端の選択的予測性能を実現する軽量なポストホック禁忌手法を提案する。
論文 参考訳(メタデータ) (2025-08-11T02:33:53Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - Evaluation of uncertainty estimations for Gaussian process regression based machine learning interatomic potentials [0.0]
モデル誤差の定量化には機械学習原子間ポテンシャル(MLIP)の不確実性推定が不可欠である。
予測的GPR標準偏差やアンサンブルに基づく不確実性を含む,GPRに基づくMLIPの不確実性の評価を行った。
論文 参考訳(メタデータ) (2024-10-27T10:06:09Z) - Decomposing Uncertainty for Large Language Models through Input Clarification Ensembling [69.83976050879318]
大規模言語モデル(LLM)では、不確実性の原因を特定することが、信頼性、信頼性、解釈可能性を改善するための重要なステップである。
本稿では,LLMのための不確実性分解フレームワークについて述べる。
提案手法は,入力に対する一連の明確化を生成し,それらをLLMに入力し,対応する予測をアンサンブルする。
論文 参考訳(メタデータ) (2023-11-15T05:58:35Z) - Improving Trustworthiness of AI Disease Severity Rating in Medical
Imaging with Ordinal Conformal Prediction Sets [0.7734726150561088]
統計的に厳密な不確実性定量化の欠如は、AI結果の信頼を損なう重要な要因である。
分布自由不確実性定量化の最近の進歩は、これらの問題に対する実用的な解決策である。
本稿では, 正しい狭窄の重症度を含むことが保証される順序予測セットを形成する手法を実証する。
論文 参考訳(メタデータ) (2022-07-05T18:01:20Z) - Bayesian autoencoders with uncertainty quantification: Towards
trustworthy anomaly detection [78.24964622317634]
本研究では, ベイズオートエンコーダ (BAEs) の定式化により, 全体の異常不確かさを定量化する。
不確実性の質を評価するために,不確実性の予測を拒否するオプションを追加して,異常を分類する作業を検討する。
本実験は,BAEと総異常不確かさが,ベンチマークデータセットと製造用実データセットのセットに与える影響を実証するものである。
論文 参考訳(メタデータ) (2022-02-25T12:20:04Z) - Taming Overconfident Prediction on Unlabeled Data from Hindsight [50.9088560433925]
ラベルのないデータに対する予測の不確実性を最小化することは、半教師付き学習において優れた性能を達成するための鍵となる要素である。
本稿では,アダプティブシャーニング(Adaptive Sharpening, ADS)と呼ばれる2つのメカニズムを提案する。
ADSは、プラグインにすることで最先端のSSLメソッドを大幅に改善する。
論文 参考訳(メタデータ) (2021-12-15T15:17:02Z) - Dense Uncertainty Estimation [62.23555922631451]
本稿では,ニューラルネットワークと不確実性推定手法について検討し,正確な決定論的予測と確実性推定の両方を実現する。
本研究では,アンサンブルに基づく手法と生成モデルに基づく手法の2つの不確実性推定法について検討し,それらの長所と短所を,完全/半端/弱度に制御されたフレームワークを用いて説明する。
論文 参考訳(メタデータ) (2021-10-13T01:23:48Z) - Learning to Predict Error for MRI Reconstruction [67.76632988696943]
提案手法による予測の不確実性は予測誤差と強く相関しないことを示す。
本稿では,2段階の予測誤差の目標ラベルと大小を推定する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-02-13T15:55:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。