論文の概要: Assessing the Real-World Utility of Explainable AI for Arousal Diagnostics: An Application-Grounded User Study
- arxiv url: http://arxiv.org/abs/2510.21389v1
- Date: Fri, 24 Oct 2025 12:23:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.462376
- Title: Assessing the Real-World Utility of Explainable AI for Arousal Diagnostics: An Application-Grounded User Study
- Title(参考訳): 覚醒診断のための説明可能なAIの現実的有用性の評価--アプリケーション・グラウンド・ユーザ・スタディ
- Authors: Stefan Kraft, Andreas Theissler, Vera Wienhausen-Wilke, Gjergji Kasneci, Hendrik Lensch,
- Abstract要約: 本研究は,8名の睡眠医療従事者を対象に,アプリケーション・グラウンド・ユーザ・スタディを提示する。
我々は,支援のタイプとタイミングが,事象レベル,臨床的に最も関連性の高いカウントベースのパフォーマンス,時間要件,ユーザエクスペリエンスにどのように影響するかを評価する。
- 参考スコア(独自算出の注目度): 10.778389510933401
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial intelligence (AI) systems increasingly match or surpass human experts in biomedical signal interpretation. However, their effective integration into clinical practice requires more than high predictive accuracy. Clinicians must discern \textit{when} and \textit{why} to trust algorithmic recommendations. This work presents an application-grounded user study with eight professional sleep medicine practitioners, who score nocturnal arousal events in polysomnographic data under three conditions: (i) manual scoring, (ii) black-box (BB) AI assistance, and (iii) transparent white-box (WB) AI assistance. Assistance is provided either from the \textit{start} of scoring or as a post-hoc quality-control (\textit{QC}) review. We systematically evaluate how the type and timing of assistance influence event-level and clinically most relevant count-based performance, time requirements, and user experience. When evaluated against the clinical standard used to train the AI, both AI and human-AI teams significantly outperform unaided experts, with collaboration also reducing inter-rater variability. Notably, transparent AI assistance applied as a targeted QC step yields median event-level performance improvements of approximately 30\% over black-box assistance, and QC timing further enhances count-based outcomes. While WB and QC approaches increase the time required for scoring, start-time assistance is faster and preferred by most participants. Participants overwhelmingly favor transparency, with seven out of eight expressing willingness to adopt the system with minor or no modifications. In summary, strategically timed transparent AI assistance effectively balances accuracy and clinical efficiency, providing a promising pathway toward trustworthy AI integration and user acceptance in clinical workflows.
- Abstract(参考訳): 人工知能(AI)システムは、生物医学的な信号解釈において、人間の専門家とますます一致するか、上回っている。
しかし、臨床実践への効果的な統合には高い予測精度が必要である。
臨床医はアルゴリズムレコメンデーションを信頼するために \textit{when} と \textit{why} を識別しなければならない。
本研究は, 夜間の覚醒イベントを3つの条件で評価する, 8人の専門的睡眠医療実践者を対象に, 応用的ユーザスタディを提示する。
(i)手動得点
(二)ブラックボックス(BB)AI支援、及び
三 透明ホワイトボックス(WB)AI支援。
Assistance は、スコア付けの \textit{start} またはポストホックな品質管理 (\textit{QC}) レビューから提供される。
我々は,支援のタイプとタイミングが,事象レベル,臨床的に最も関連性の高いカウントベースのパフォーマンス,時間要件,ユーザエクスペリエンスにどのように影響するかを体系的に評価した。
AIのトレーニングに使用される臨床標準に対して評価すると、AIと人間とAIの双方のチームは、未経験のエキスパートよりも大幅に優れており、コラボレーションはラッター間のばらつきも低減している。
特に、ターゲットとするQCステップとして適用される透明なAIアシストは、ブラックボックスアシストよりも約30倍の中央値のイベントレベルのパフォーマンス向上をもたらし、QCタイミングはカウントベースの結果をさらに強化する。
WBとQCのアプローチは得点に要する時間を増やすが、ほとんどの参加者は起動支援がより速く、好まれる。
参加者は圧倒的に透明性を好んでおり、8人中7人がマイナーまたは無修正でシステムを採用する意思を表明している。
要約すると、戦略的にタイムドな透明なAIアシストは、精度と臨床効率を効果的にバランスさせ、信頼できるAI統合と臨床ワークフローにおけるユーザ受け入れへの有望な経路を提供する。
関連論文リスト
- Trainee Action Recognition through Interaction Analysis in CCATT Mixed-Reality Training [1.5641818606249476]
重要なケア航空輸送チームのメンバーは、飛行中に人工呼吸器、IVポンプ、吸引装置を管理することで重傷を負った兵士を安定させなければならない。
シミュレーションとマルチモーダルデータ分析の最近の進歩は、より客観的で包括的なパフォーマンス評価を可能にする。
本研究では, CCATT のメンバーが, エアロメディカル避難の高圧条件を再現する混合現実感シミュレーションを用いて, どのように訓練されているかを検討する。
論文 参考訳(メタデータ) (2025-09-22T15:19:45Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Beyond Black-Box AI: Interpretable Hybrid Systems for Dementia Care [2.4339626079536925]
近年の大規模言語モデル(LLM)のブームは、人工知能(AI)システムが医療診断に役立つという期待を再燃させた。
ベンチマークスコアはめちゃくちゃですが、LCMアシスタントはまだベッドサイドで測定可能な改善を提供していません。
このスクーピングレビューは、臨床現場で実践的な貢献をするためにAIが制限されている領域を強調することを目的としている。
論文 参考訳(メタデータ) (2025-07-02T01:43:06Z) - The AI Imperative: Scaling High-Quality Peer Review in Machine Learning [49.87236114682497]
AIによるピアレビューは、緊急の研究とインフラの優先事項になるべきだ、と私たちは主張する。
我々は、事実検証の強化、レビュアーのパフォーマンスの指導、品質改善における著者の支援、意思決定におけるAC支援におけるAIの具体的な役割を提案する。
論文 参考訳(メタデータ) (2025-06-09T18:37:14Z) - Completing A Systematic Review in Hours instead of Months with Interactive AI Agents [21.934330935124866]
我々は、大規模な言語モデルを利用した人間中心の対話型AIエージェントInsightAgentを紹介する。
InsightAgentは意味論に基づく大規模な文献コーパスを分割し、より焦点を絞った処理にマルチエージェント設計を採用する。
9人の医療専門家によるユーザスタディでは、可視化と相互作用機構が合成SRの品質を効果的に向上することを示した。
論文 参考訳(メタデータ) (2025-04-21T02:57:23Z) - Over-Relying on Reliance: Towards Realistic Evaluations of AI-Based Clinical Decision Support [12.247046469627554]
私たちは、AIのタスクにおける信頼、信頼、受け入れ、パフォーマンスといった評価指標を超えて進むことを提唱します。
私たちはコミュニティに、AIが医療専門家にもたらす創発的な価値を計測する、生態学的に有効な、ドメインに適した研究環境を優先するよう呼びかけています。
論文 参考訳(メタデータ) (2025-04-10T03:28:56Z) - RAISE -- Radiology AI Safety, an End-to-end lifecycle approach [5.829180249228172]
放射線学へのAIの統合は、臨床ケアの供給と効率を改善する機会をもたらす。
モデルが安全性、有効性、有効性の最高基準を満たすことに注力すべきである。
ここで提示されるロードマップは、放射線学におけるデプロイ可能で信頼性があり、安全なAIの達成を早めることを目的としている。
論文 参考訳(メタデータ) (2023-11-24T15:59:14Z) - Validating polyp and instrument segmentation methods in colonoscopy through Medico 2020 and MedAI 2021 Challenges [58.32937972322058]
メディコオートマチックポリープセグメンテーション(Medico 2020)と「メディコ:医療画像の透明性(MedAI 2021)」コンペティション。
本報告では, それぞれのコントリビューションを包括的に分析し, ベストパフォーマンスメソッドの強さを強調し, クリニックへの臨床翻訳の可能性について考察する。
論文 参考訳(メタデータ) (2023-07-30T16:08:45Z) - Robust and Efficient Medical Imaging with Self-Supervision [80.62711706785834]
医用画像AIの堅牢性とデータ効率を向上させるための統一表現学習戦略であるREMEDISを提案する。
様々な医療画像タスクを研究し, 振り返りデータを用いて3つの現実的な応用シナリオをシミュレートする。
論文 参考訳(メタデータ) (2022-05-19T17:34:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。