論文の概要: Towards Accountable AI-Assisted Eye Disease Diagnosis: Workflow Design, External Validation, and Continual Learning
- arxiv url: http://arxiv.org/abs/2409.15087v1
- Date: Mon, 23 Sep 2024 15:01:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-26 14:33:51.637442
- Title: Towards Accountable AI-Assisted Eye Disease Diagnosis: Workflow Design, External Validation, and Continual Learning
- Title(参考訳): 説明責任AI支援眼科診断に向けて:ワークフローデザイン、外部検証、継続的な学習
- Authors: Qingyu Chen, Tiarnan D L Keenan, Elvira Agron, Alexis Allot, Emily Guan, Bryant Duong, Amr Elsawy, Benjamin Hou, Cancan Xue, Sanjeeb Bhandari, Geoffrey Broadhead, Chantal Cousineau-Krieger, Ellen Davis, William G Gensheimer, David Grasic, Seema Gupta, Luis Haddock, Eleni Konstantinou, Tania Lamba, Michele Maiberger, Dimosthenis Mantopoulos, Mitul C Mehta, Ayman G Nahri, Mutaz AL-Nawaflh, Arnold Oshinsky, Brittany E Powell, Boonkit Purt, Soo Shin, Hillary Stiefel, Alisa T Thavikulwat, Keith James Wroblewski, Tham Yih Chung, Chui Ming Gemmy Cheung, Ching-Yu Cheng, Emily Y Chew, Michelle R. Hribar, Michael F. Chiang, Zhiyong Lu,
- Abstract要約: AIは診断精度が保証されるが、臨床および多様な集団の検証が不十分なため、現実の応用問題に直面している。
本研究は、年齢関連黄斑変性(AMD)診断と分類重症度に関するケーススタディを通じて、医療用AIの下流アカウンタビリティのギャップに対処する。
- 参考スコア(独自算出の注目度): 5.940140611616894
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Timely disease diagnosis is challenging due to increasing disease burdens and limited clinician availability. AI shows promise in diagnosis accuracy but faces real-world application issues due to insufficient validation in clinical workflows and diverse populations. This study addresses gaps in medical AI downstream accountability through a case study on age-related macular degeneration (AMD) diagnosis and severity classification. We designed and implemented an AI-assisted diagnostic workflow for AMD, comparing diagnostic performance with and without AI assistance among 24 clinicians from 12 institutions with real patient data sampled from the Age-Related Eye Disease Study (AREDS). Additionally, we demonstrated continual enhancement of an existing AI model by incorporating approximately 40,000 additional medical images (named AREDS2 dataset). The improved model was then systematically evaluated using both AREDS and AREDS2 test sets, as well as an external test set from Singapore. AI assistance markedly enhanced diagnostic accuracy and classification for 23 out of 24 clinicians, with the average F1-score increasing by 20% from 37.71 (Manual) to 45.52 (Manual + AI) (P-value < 0.0001), achieving an improvement of over 50% in some cases. In terms of efficiency, AI assistance reduced diagnostic times for 17 out of the 19 clinicians tracked, with time savings of up to 40%. Furthermore, a model equipped with continual learning showed robust performance across three independent datasets, recording a 29% increase in accuracy, and elevating the F1-score from 42 to 54 in the Singapore population.
- Abstract(参考訳): タイムリーな疾患診断は、病気の負担が増加し、臨床医の可用性が制限されるため困難である。
AIは診断精度が保証されるが、臨床ワークフローや多様な集団の検証が不十分なため、現実のアプリケーション問題に直面している。
本研究は、年齢関連黄斑変性(AMD)診断と重症度分類のケーススタディを通じて、医療用AIの下流アカウンタビリティのギャップに対処する。
AREDS(Aage-Related Eye Disease Study)から採取した実患者データを用いて,12施設24名の臨床医を対象に,AI支援型診断ワークフローを設計,実装した。
さらに、約4万件の追加医療画像(AREDS2データセット)を組み込むことで、既存のAIモデルの継続的な拡張を実証した。
改良されたモデルは、シンガポールの外部テストセットと同様に、AREDSとAREDS2の両方のテストセットを使用して体系的に評価された。
AIアシストは24人の臨床医のうち23人の診断精度と分類を著しく向上させ、平均F1スコアは37.71 (マニュアル)から45.52 (マニュアル+AI) (P値 < 0.0001)まで20%上昇し、いくつかのケースでは50%以上の改善が達成された。
効率の面では、AI支援は追跡した19の臨床医のうち17人の診断時間を短縮し、最大40%の時間を節約した。
さらに、連続学習を用いたモデルでは、3つの独立したデータセット間で堅牢な性能を示し、精度は29%向上し、シンガポールの人口では42人から54人までF1スコアが上昇した。
関連論文リスト
- Unlocking Historical Clinical Trial Data with ALIGN: A Compositional Large Language Model System for Medical Coding [44.01429184037945]
自動ゼロショット医療符号化のための新しい合成LLMシステムであるALIGNを紹介する。
我々は、ALIGNを解剖学的治療化学(ATC)と医学史用語に調和させ、MedDRA(Medicical Dictionary for Regulatory Activity)コードに評価した。
論文 参考訳(メタデータ) (2024-11-20T09:59:12Z) - Methodology and Real-World Applications of Dynamic Uncertain Causality Graph for Clinical Diagnosis with Explainability and Invariance [41.373856519548404]
Dynamic Uncertain Causality Graph (DUCG)アプローチは、さまざまなアプリケーションシナリオで因果性駆動、説明可能、不変である。
54件の主訴を含む46件のDUCGモデルが製造された。
実際の診断は100万件以上行われており、誤診断は17例に過ぎなかった。
論文 参考訳(メタデータ) (2024-06-09T11:37:45Z) - A Survey of Artificial Intelligence in Gait-Based Neurodegenerative Disease Diagnosis [51.07114445705692]
神経変性疾患(神経変性疾患、ND)は、伝統的に医学的診断とモニタリングのために広範囲の医療資源と人的努力を必要とする。
重要な疾患関連運動症状として、ヒトの歩行を利用して異なるNDを特徴づけることができる。
人工知能(AI)モデルの現在の進歩は、NDの識別と分類のための自動歩行分析を可能にする。
論文 参考訳(メタデータ) (2024-05-21T06:44:40Z) - The Limits of Fair Medical Imaging AI In The Wild [43.97266228706059]
医療用AIが人口統計エンコーディングをどのように利用するかを検討する。
医療画像AIは、疾患分類において、人口動態のショートカットを利用することを確認した。
人口統計属性のエンコーディングが少ないモデルは、しばしば「グローバルに最適」であることがわかった。
論文 参考訳(メタデータ) (2023-12-11T18:59:50Z) - Towards Accurate Differential Diagnosis with Large Language Models [37.48155380562073]
LLM(Large Language Models)を利用した対話型インタフェースは、差分診断の側面をアシストし、自動化する新たな機会を提供する。
20人の臨床医が、ニューイングランド・ジャーナル・オブ・メディカル(New England Journal of Medicine)から入手した、302の挑戦的な現実世界の医療事例を評価した。
我々のLSMは,難治性症例の診断的推論と精度を向上させる可能性が示唆された。
論文 参考訳(メタデータ) (2023-11-30T19:55:51Z) - The Case Records of ChatGPT: Language Models and Complex Clinical
Questions [0.35157846138914034]
臨床診断における大規模言語AIモデル GPT4 と GPT3.5 の精度について検討した。
GPT4, GPT3.5は1回の試行で26%, 22%, 3回の検行で46%, 42%の精度で正しい診断を行った。
論文 参考訳(メタデータ) (2023-05-09T16:58:32Z) - Robustness of an Artificial Intelligence Solution for Diagnosis of
Normal Chest X-Rays [0.0]
正常胸部X線(CXR)の診断におけるAIソリューションの有用性について検討した。
合計4,060個のCXRがサンプリングされ、NHS患者とケア設定の多様なデータセットが表現された。
論文 参考訳(メタデータ) (2022-08-31T09:54:24Z) - Robust and Efficient Medical Imaging with Self-Supervision [80.62711706785834]
医用画像AIの堅牢性とデータ効率を向上させるための統一表現学習戦略であるREMEDISを提案する。
様々な医療画像タスクを研究し, 振り返りデータを用いて3つの現実的な応用シナリオをシミュレートする。
論文 参考訳(メタデータ) (2022-05-19T17:34:18Z) - Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in
Artificial Intelligence [79.038671794961]
我々はUCADI(Unified CT-COVID AI Diagnostic Initiative)を立ち上げ、各ホスト機関でAIモデルを分散的にトレーニングし、独立して実行することができる。
本研究は,中国とイギリスに所在する23の病院で採取した3,336例の胸部CT9,573例について検討した。
論文 参考訳(メタデータ) (2021-11-18T00:43:41Z) - A Prospective Observational Study to Investigate Performance of a Chest
X-ray Artificial Intelligence Diagnostic Support Tool Across 12 U.S.
Hospitals [5.089367493963538]
人工知能(AI)に基づく、胸部X線(CXR)所見から新型コロナウイルスの可能性を予測するモデルは、臨床的意思決定を加速するための重要な副産物となる。
我々は、時間的および外部的検証に高い性能を持つAIモデルを開発した。
論文 参考訳(メタデータ) (2021-06-03T20:22:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。