論文の概要: Assessing workflow impact and clinical utility of AI-assisted brain aneurysm detection: a multi-reader study
- arxiv url: http://arxiv.org/abs/2503.17786v1
- Date: Sat, 22 Mar 2025 14:32:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-25 14:34:19.130517
- Title: Assessing workflow impact and clinical utility of AI-assisted brain aneurysm detection: a multi-reader study
- Title(参考訳): AIを用いた脳動脈瘤検出のワークフローへの影響評価と臨床的有用性:マルチリーダー研究
- Authors: Tommaso Di Noto, Sofyan Jankowski, Francesco Puccinelli, Guillaume Marie, Sebastien Tourbier, Yasser Aleman-Gomez, Oscar Esteban, Ricardo Corredor-Jerez, Guillaume Saliou, Patric Hagmann, Meritxell Bach Cuadra, Jonas Richiardi,
- Abstract要約: 私たちは、アルゴリズムのトレーニング/検証に360の被験者を使用し、読み出しセッションには見当たらないテストセットとして100を使用します。
その結果,中高生でも中高生でも感度は有意に上昇しないことがわかった。
読者が報告した自信は2つの設定で変化せず、AIアシストが診断の確実性に影響を与えないことを示している。
- 参考スコア(独自算出の注目度): 0.14799025953436756
- License:
- Abstract: Despite the plethora of AI-based algorithms developed for anomaly detection in radiology, subsequent integration into clinical setting is rarely evaluated. In this work, we assess the applicability and utility of an AI-based model for brain aneurysm detection comparing the performance of two readers with different levels of experience (2 and 13 years). We aim to answer the following questions: 1) Do the readers improve their performance when assisted by the AI algorithm? 2) How much does the AI algorithm impact routine clinical workflow? We reuse and enlarge our open-access, Time-Of-Flight Magnetic Resonance Angiography dataset (N=460). We use 360 subjects for training/validating our algorithm and 100 as unseen test set for the reading session. Even though our model reaches state-of-the-art results on the test set (sensitivity=74%, false positive rate=1.6), we show that neither the junior nor the senior reader significantly increase their sensitivity (p=0.59, p=1, respectively). In addition, we find that reading time for both readers is significantly higher in the "AI-assisted" setting than in the "Unassisted" (+15 seconds, on average; p=3x10^(-4) junior, p=3x10^(-5) senior). The confidence reported by the readers is unchanged across the two settings, indicating that the AI assistance does not influence the certainty of the diagnosis. Our findings highlight the importance of clinical validation of AI algorithms in a clinical setting involving radiologists. This study should serve as a reminder to the community to always examine the real-word effectiveness and workflow impact of proposed algorithms.
- Abstract(参考訳): 放射線学における異常検出のためのAIベースのアルゴリズムが多用されているにもかかわらず、その後の臨床環境への統合はめったに評価されない。
本研究では、脳動脈瘤検出のためのAIベースのモデルの適用性と有用性について、異なるレベルの経験を持つ2人の読者のパフォーマンス(2年と13年)を比較した。
私たちは以下の質問に答えることを目指しています。
1) 読者は,AIアルゴリズムによって支援された場合,その性能を向上させることができるか?
2)AIアルゴリズムは日常的な臨床ワークフローにどの程度影響を及ぼすか?
我々は、オープンアクセスのTime-Of-Flight Magnetic Resonance Angiographyデータセット(N=460)を再利用し、拡張する。
私たちは、アルゴリズムのトレーニング/検証に360の被験者を使用し、読み出しセッションには見当たらないテストセットとして100を使用します。
本モデルでは, テストセットの最先端結果(感度=74%, 偽陽性率=1.6)に到達したものの, 若年者も上級読影者も有意に感度を上昇させていない(p=0.59, p=1)。
また, 読解時間は, 平均3×10^(-4) 年少, p=3x10^(-5) 年少, 平均3×10^(-4) 年少, 平均15秒) よりも, 「AI支援」 設定の方が有意に高いことがわかった。
読者が報告した自信は2つの設定で変化せず、AIアシストが診断の確実性に影響を与えないことを示している。
本研究は, 放射線科医を含む臨床現場におけるAIアルゴリズムの臨床的検証の重要性を強調した。
この研究は、提案アルゴリズムの実際の単語の有効性とワークフローへの影響を常に調査するためのコミュニティへのリマインダーとして役立ちます。
関連論文リスト
- 2-Factor Retrieval for Improved Human-AI Decision Making in Radiology [41.2574078312095]
本研究では、従来使用されていたAI技術と「2要素探索(2FR)」と呼ばれる新たな手法を比較した。
2FRは、インタフェース設計と検索検索の組み合わせで、同様のラベル付きデータを、このデータを処理せずに返す。
胸部X線診断で検査すると, 2FRは, 臨床医が放射線科医である場合に, 臨床医の精度が向上することがわかった。
論文 参考訳(メタデータ) (2024-11-30T06:44:42Z) - Touchstone Benchmark: Are We on the Right Way for Evaluating AI Algorithms for Medical Segmentation? [90.30635552818875]
9種類の腹部臓器の大規模共同セグメント化ベンチマークであるTouchstoneを報告する。
このベンチマークは、世界中の76の病院から5,195回のCTスキャンと、11の病院から5,903回のCTスキャンに基づいています。
私たちは19のAIアルゴリズムの発明者14人を招待してアルゴリズムをトレーニングしましたが、私たちのチームは第三者として、3つのテストセットでこれらのアルゴリズムを独立して評価しました。
論文 参考訳(メタデータ) (2024-11-06T05:09:34Z) - AI in radiological imaging of soft-tissue and bone tumours: a systematic review evaluating against CLAIM and FUTURE-AI guidelines [1.5332408886895255]
軟部腫瘍と骨腫瘍 (STBT) は稀で, 診断に難渋する病変であり, 様々な臨床症状と治療のアプローチがある。
本稿では,これらの腫瘍の診断と予後のための放射線画像を用いた人工知能(AI)法の概要について概説する。
論文 参考訳(メタデータ) (2024-08-22T15:31:48Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z) - A survey of recent methods for addressing AI fairness and bias in
biomedicine [48.46929081146017]
人工知能システムは、人種や性別に基づくような社会的不平等を永続するか、偏見を示すことができる。
バイオメディカル自然言語処理 (NLP) やコンピュータビジョン (CV) の分野での様々な脱バイアス法に関する最近の論文を調査した。
我々は,2018年1月から2023年12月にかけて,複数のキーワードの組み合わせを用いて,PubMed,ACMデジタルライブラリ,IEEE Xploreに関する文献検索を行った。
バイオメディシンに応用可能な一般領域からの他の方法について検討し, バイアスに対処し, 公平性を向上する方法について検討した。
論文 参考訳(メタデータ) (2024-02-13T06:38:46Z) - Robust and Efficient Medical Imaging with Self-Supervision [80.62711706785834]
医用画像AIの堅牢性とデータ効率を向上させるための統一表現学習戦略であるREMEDISを提案する。
様々な医療画像タスクを研究し, 振り返りデータを用いて3つの現実的な応用シナリオをシミュレートする。
論文 参考訳(メタデータ) (2022-05-19T17:34:18Z) - Who Goes First? Influences of Human-AI Workflow on Decision Making in
Clinical Imaging [24.911186503082465]
本研究は, 放射線医学における診断セッション開始時と, 放射線科医の仮決定後のAI支援の効果について検討した。
その結果、AI推論をレビューする前に仮回答を登録するよう求められている参加者は、アドバイスが正確かどうかに関わらず、AIに同意する確率が低く、AIと意見の相違がある場合には、同僚の第二の意見を求める確率が低いことがわかった。
論文 参考訳(メタデータ) (2022-05-19T16:59:25Z) - An Integrated Optimization and Machine Learning Models to Predict the
Admission Status of Emergency Patients [1.0323063834827415]
T-XGB、T-ADAB、T-MLPの3つの機械学習アルゴリズムが提案されている。
提案フレームワークは,患者搭乗プロセスを積極的に計画することにより,混雑を緩和することができる。
その結果,新たに提案したアルゴリズムはAUCが高く,従来のアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2022-02-18T13:50:44Z) - BiteNet: Bidirectional Temporal Encoder Network to Predict Medical
Outcomes [53.163089893876645]
本稿では,患者の医療旅行におけるコンテキスト依存と時間的関係を捉える,新たな自己注意機構を提案する。
エンド・ツー・エンドの双方向時間エンコーダネットワーク(BiteNet)が患者の旅路の表現を学習する。
実世界のEHRデータセットを用いた2つの教師付き予測と2つの教師なしクラスタリングタスクにおける手法の有効性を評価した。
論文 参考訳(メタデータ) (2020-09-24T00:42:36Z) - Artificial Intelligence to Assist in Exclusion of Coronary
Atherosclerosis during CCTA Evaluation of Chest-Pain in the Emergency
Department: Preparing an Application for Real-World Use [6.9835031964130545]
冠状動脈硬化の欠如に対するCCTAスクリーニングにおける医師の解釈を支援するAIアルゴリズムとワークフローの開発について述べる。
このアルゴリズムは AUC-ROC = 0.96 で強い性能を示した。
このAIアプリケーションはCCTAの解釈を補助し、胸部ペーストによる動脈硬化を促進できる可能性がある。
論文 参考訳(メタデータ) (2020-08-10T16:07:04Z) - LRTD: Long-Range Temporal Dependency based Active Learning for Surgical
Workflow Recognition [67.86810761677403]
本稿では,費用対効果の高い手術ビデオ解析のための新しい能動的学習法を提案する。
具体的には,非局所的再帰的畳み込みネットワーク (NL-RCNet) を提案する。
手術ワークフロー認識タスクを実行することで,大規模な手術ビデオデータセット(Cholec80)に対するアプローチを検証する。
論文 参考訳(メタデータ) (2020-04-21T09:21:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。