論文の概要: Enhancing the Reliability of Medical AI through Expert-guided Uncertainty Modeling
- arxiv url: http://arxiv.org/abs/2604.01898v1
- Date: Thu, 02 Apr 2026 11:01:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.698464
- Title: Enhancing the Reliability of Medical AI through Expert-guided Uncertainty Modeling
- Title(参考訳): 専門家誘導不確実性モデリングによる医療AIの信頼性向上
- Authors: Aleksei Khalin, Ekaterina Zaychenkova, Aleksandr Yugay, Andrey Goncharov, Sergey Korchagin, Alexey Zaytsev, Egor Ershov,
- Abstract要約: AIエラーの予測不可能性は、特に医療のコンテキストにおいて、重大な課題を引き起こします。
本稿では,機械学習モデルの学習目標を生成するために,専門家の反応の不一致を利用した新しいアプローチを提案する。
本実験は, 専門家の知識を取り入れることで, タスクに応じて, 不確実性評価品質を9%から50%に向上させることができることを示した。
- 参考スコア(独自算出の注目度): 35.159273667448176
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial intelligence (AI) systems accelerate medical workflows and improve diagnostic accuracy in healthcare, serving as second-opinion systems. However, the unpredictability of AI errors poses a significant challenge, particularly in healthcare contexts, where mistakes can have severe consequences. A widely adopted safeguard is to pair predictions with uncertainty estimation, enabling human experts to focus on high-risk cases while streamlining routine verification. Current uncertainty estimation methods, however, remain limited, particularly in quantifying aleatoric uncertainty, which arises from data ambiguity and noise. To address this, we propose a novel approach that leverages disagreement in expert responses to generate targets for training machine learning models. These targets are used in conjunction with standard data labels to estimate two components of uncertainty separately, as given by the law of total variance, via a two-ensemble approach, as well as its lightweight variant. We validate our method on binary image classification, binary and multi-class image segmentation, and multiple-choice question answering. Our experiments demonstrate that incorporating expert knowledge can enhance uncertainty estimation quality by $9\%$ to $50\%$ depending on the task, making this source of information invaluable for the construction of risk-aware AI systems in healthcare applications.
- Abstract(参考訳): 人工知能(AI)システムは医療ワークフローを加速し、医療における診断精度を改善し、第2のオピニオンシステムとして機能する。
しかし、AIエラーの予測不可能さは、特にミスが深刻な結果をもたらす医療の状況において、重大な課題を引き起こします。
広く採用されている安全策は、予測と不確実性推定を組み合わせ、人間の専門家が日常的な検証を合理化しながらリスクの高いケースに集中できるようにすることである。
しかし、現在の不確実性推定法は、特にデータのあいまいさやノイズから生じるアレタリック不確かさの定量化に限られている。
そこで本研究では,専門家の回答の不一致を利用して機械学習モデルの学習目標を生成する手法を提案する。
これらのターゲットは、標準データラベルと組み合わせて、2アンサンブルアプローチと軽量な変奏法によって与えられるような、不確実性の2つのコンポーネントを別々に推定するために使用される。
本稿では,二分画像分類,二分画像分割,複数クラス画像分割,複数選択質問応答について検証する。
我々の実験は、専門家の知識を取り入れることで、タスクに応じて不確実性推定品質を9\%から50\%に向上できることを示した。
関連論文リスト
- Agentic Uncertainty Quantification [76.94013626702183]
本稿では,言語化された不確実性をアクティブな双方向制御信号に変換する統合されたデュアルプロセスエージェントUQ(AUQ)フレームワークを提案する。
システム1(Uncertainty-Aware Memory, UAM)とシステム2(Uncertainty-Aware Reflection, UAR)は、これらの説明を合理的な手段として利用し、必要な時にのみターゲットの推論時間解決をトリガーする。
論文 参考訳(メタデータ) (2026-01-22T07:16:26Z) - Benchmarking Uncertainty and its Disentanglement in multi-label Chest X-Ray Classification [11.21639536740362]
コンボリューション(ResNet)とトランスフォーマー(Vision Transformer)アーキテクチャにおける13の不確実性定量化手法を評価する。
Evidential Deep Learning, HetClass NNs, Deep Deterministic Uncertaintyをマルチラベル設定に拡張する。
論文 参考訳(メタデータ) (2025-08-06T13:58:17Z) - Uncertainty-Driven Expert Control: Enhancing the Reliability of Medical Vision-Language Models [52.2001050216955]
既存の方法は、モデル構造を調整したり、高品質なデータで微調整したり、好みの微調整によって、医療ビジョン言語モデル(MedVLM)の性能を向上させることを目的としている。
我々は,MedVLMと臨床専門知識の連携を図るために,Expert-Controlled-Free Guidance (Expert-CFG) という,ループ内のエキスパート・イン・ザ・ループフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-12T09:03:30Z) - Explaining Uncertainty in Multiple Sclerosis Lesion Segmentation Beyond Prediction Errors [30.086986374579414]
本研究では,予測の不確実性の潜在的な原因を説明する新しい枠組みを紹介する。
提案した分析は、不確実性とエラーの関係から関連する医療・工学的要因へと焦点を移す。
症例によっては, 病変の大きさ, 形状, 皮質の関与など, 不確実性が強く関与していることが判明した。
論文 参考訳(メタデータ) (2025-04-07T08:09:27Z) - Uncertainty-aware abstention in medical diagnosis based on medical texts [87.88110503208016]
本研究は,AI支援医療診断における信頼性の重要課題について論じる。
本研究は,診断に自信がなければ,診断システムによる意思決定の回避を可能にする選択予測手法に焦点をあてる。
我々は、選択予測タスクにおける信頼性を高めるための新しい最先端手法であるHUQ-2を紹介する。
論文 参考訳(メタデータ) (2025-02-25T10:15:21Z) - Expert-aware uncertainty estimation for quality control of neural-based blood typing [0.0]
医学的診断において、神経モデルに対する正確な不確実性推定は、二次対位法の補完に不可欠である。
ここでの大きな難点は、サンプルの硬さにラベルがないことである。
我々の新しいアプローチは、ニューラルネットワークの学習プロセスにケース複雑性のエキスパートアセスメントを統合し、決定的なターゲットラベルと補足的複雑性評価の両方を活用する。
実験では、不確実性予測におけるアプローチの強化、専門家ラベルによる2.5倍の改善、およびニューラルネットワークの専門家コンセンサスの推定によるパフォーマンスの35%向上が示されている。
論文 参考訳(メタデータ) (2024-07-15T19:07:02Z) - Certainly Uncertain: A Benchmark and Metric for Multimodal Epistemic and Aleatoric Awareness [106.52630978891054]
視覚言語AIシステムに特有の不確実性の分類法を提案する。
また、精度と校正誤差の両方によく相関する新しい計量信頼度重み付き精度を導入する。
論文 参考訳(メタデータ) (2024-07-02T04:23:54Z) - Evaluating AI systems under uncertain ground truth: a case study in dermatology [43.8328264420381]
不確実性を無視することは、モデル性能の過度に楽観的な推定につながることを示す。
皮膚状態の分類では,データセットの大部分が重大な真理不確実性を示すことが判明した。
論文 参考訳(メタデータ) (2023-07-05T10:33:45Z) - Bayesian autoencoders with uncertainty quantification: Towards
trustworthy anomaly detection [78.24964622317634]
本研究では, ベイズオートエンコーダ (BAEs) の定式化により, 全体の異常不確かさを定量化する。
不確実性の質を評価するために,不確実性の予測を拒否するオプションを追加して,異常を分類する作業を検討する。
本実験は,BAEと総異常不確かさが,ベンチマークデータセットと製造用実データセットのセットに与える影響を実証するものである。
論文 参考訳(メタデータ) (2022-02-25T12:20:04Z) - Enabling risk-aware Reinforcement Learning for medical interventions
through uncertainty decomposition [9.208828373290487]
複雑な制御と意思決定の問題に対処するためのツールとして強化学習(RL)が登場している。
エージェントが学習した明らかに最適なポリシーと、実際の展開の間のギャップを埋めることは、しばしば困難である。
本稿では,各不確実性のネット効果を分解して不確かさを再現するために,分布的アプローチ (UA-DQN) を再キャストする方法を提案する。
論文 参考訳(メタデータ) (2021-09-16T09:36:53Z) - Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。
本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。
本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文 参考訳(メタデータ) (2021-01-24T05:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。