論文の概要: Tool and Tutor? Experimental evidence from AI deployment in cancer diagnosis
- arxiv url: http://arxiv.org/abs/2502.16411v4
- Date: Sun, 02 Nov 2025 03:16:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-04 16:14:21.890677
- Title: Tool and Tutor? Experimental evidence from AI deployment in cancer diagnosis
- Title(参考訳): ツールとテューター : がん診断におけるAI導入の実験的証拠
- Authors: Vivianna Fang He, Sihan Li, Phanish Puranam, Feng Lin,
- Abstract要約: 肺がん診断の文脈において,AIベースの診断ツールが,パフォーマンスの向上と学習に有効かどうかを検討する。
2つの実験では、576人の医学生が無作為に訓練中にAI入力を操作された。
術中は胸部CTで肺がんと診断し,その診断は根治的真偽に対して評価された。
- 参考スコア(独自算出の注目度): 3.490335032269295
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Numerous countries globally face shortages of medical experts, deepening inequalities in access to healthcare. Artificial Intelligence (AI)-based diagnostic tools hold considerable promise to tackle this challenge by enabling even novices to deliver expert-level medical services. However, reliance on AI for task completion may hinder the learning required for novices to develop expertise. We thus explore whether AI-based diagnostic tools can be used to enhance not only performance but also learning in the context of lung cancer diagnosis. We examine the distinct effects of AI input during training (i.e., learning how to diagnose) versus in practice (i.e., completing diagnostic tasks) on novice medical professionals' performance. In two field experiments, 576 medical students were randomly assigned across conditions, manipulating the access to AI input during their training, during a test of their diagnostic capabilities, or both. During practice, participants diagnosed potential lung cancer cases using chest CT scans, and their diagnoses were evaluated against the ground truth obtained through histopathological examinations. Study 1 (N = 336) revealed that AI input in training alone improved human diagnostic accuracy by 3.2 percentage points over the control, while AI input during practice alone increased human accuracy by 7.9 percentage points. Combined deployment in both training and practice yielded an improvement of 13.7 percentage points--significantly exceeding either approach alone. Study 2 (N = 240) showed that AI input in practice alone improved accuracy in subsequent practice, unaided by AI, by 9.9 percentage points over the control. Even minimally informative AI input in training improved diagnostic accuracy by 5.3 percentage points over the control. These results reveal AI's dual role: As a tool, it could rapidly improve novices' performance.
- Abstract(参考訳): 世界中の多くの国が医療専門家の不足に直面しており、医療へのアクセスの不平等が深まっている。
人工知能(AI)ベースの診断ツールは、初心者でも専門家レベルの医療サービスを提供できるようにすることで、この課題に取り組むことをかなり約束している。
しかし、タスク完了のためのAIへの依存は、初心者が専門知識を開発するために必要な学習を妨げる可能性がある。
そこで我々は,AIベースの診断ツールが,肺がん診断の文脈での性能向上だけでなく,学習にも有効かどうかを考察した。
訓練中のAI入力(診断の仕方を学ぶこと)と実際に行うこと(診断タスクを完了すること)が初級医療従事者のパフォーマンスに与える影響について検討する。
2つのフィールド実験では、576人の医学生が無作為に訓練中にAI入力を操作、診断能力のテスト、またはその両方にランダムに割り当てられた。
術中,胸部CT検査で肺がんと診断し,病理組織学的検討により根治的真偽と診断した。
研究1(N = 336)では、トレーニング中のAI入力は人間の診断精度を3.2%向上し、実践中のAI入力は7.9ポイント向上した。
訓練と実践の両面での展開により13.7%の改善が達成された。
研究2(N = 240)では、実際にはAI入力だけで、AIによって確認されたその後の実践で精度が9.9%向上した。
トレーニングにおけるAI入力の最小限は、診断精度をコントロールの5.3ポイント向上させた。
これらの結果は、AIの二重の役割を明らかにしている。 ツールとして、初心者のパフォーマンスを急速に改善する可能性がある。
関連論文リスト
- Explainable AI as a Double-Edged Sword in Dermatology: The Impact on Clinicians versus The Public [46.86429592892395]
説明可能なAI(XAI)は、AI意思決定の洞察を提供することによって、この問題に対処する。
フェアネスに基づく診断AIモデルと異なるXAI説明を組み合わせた2つの大規模実験の結果を報告する。
論文 参考訳(メタデータ) (2025-12-14T00:06:06Z) - Evolving Diagnostic Agents in a Virtual Clinical Environment [75.59389103511559]
本稿では,大規模言語モデル(LLM)を強化学習を用いた診断エージェントとして訓練するためのフレームワークを提案する。
本手法は対話型探索と結果に基づくフィードバックによって診断戦略を取得する。
DiagAgentはDeepSeek-v3やGPT-4oなど、最先端の10のLLMを著しく上回っている。
論文 参考訳(メタデータ) (2025-10-28T17:19:47Z) - Reverse Physician-AI Relationship: Full-process Clinical Diagnosis Driven by a Large Language Model [71.40113970879219]
医師とAIの関係を逆転させるパラダイムシフトを提案する。
DxDirector-7Bは先進的な深層思考能力を持つLLMであり,医師の関与を最小限に抑えたフルプロセス診断を可能にする。
DxDirector-7Bは診断精度が優れているだけでなく、医師の作業量を大幅に削減する。
論文 参考訳(メタデータ) (2025-08-14T09:51:20Z) - Towards Effective Human-in-the-Loop Assistive AI Agents [15.11527529177358]
本稿では,AI指導が手続き的タスクのパフォーマンスに与える影響を評価するための評価フレームワークと人間-AIインタラクションのデータセットを紹介する。
また、料理から戦場医療まで、現実世界のタスクにおけるインタラクティブなガイダンスを提供するAR搭載AIエージェントも開発しています。
論文 参考訳(メタデータ) (2025-07-24T12:50:46Z) - Explainable AI for Collaborative Assessment of 2D/3D Registration Quality [50.65650507103078]
本稿では,2D/3D登録品質検証に特化して訓練された最初の人工知能フレームワークを提案する。
我々の説明可能なAI(XAI)アプローチは、人間のオペレーターに対する情報意思決定を強化することを目的としている。
論文 参考訳(メタデータ) (2025-07-23T15:28:57Z) - Toward the Autonomous AI Doctor: Quantitative Benchmarking of an Autonomous Agentic AI Versus Board-Certified Clinicians in a Real World Setting [0.0]
2030年までには、世界中で1100万人の医療従事者が不足していると予測されている。
エンド・ツー・エンドの大規模言語モデル(LLM)ベースのAIシステムは、実際の臨床実践において厳格に評価されていない。
論文 参考訳(メタデータ) (2025-06-27T19:04:44Z) - Can Domain Experts Rely on AI Appropriately? A Case Study on AI-Assisted Prostate Cancer MRI Diagnosis [19.73932120146401]
MRI画像を用いた前立腺癌診断において,放射線科医と深く連携する。
インターフェースを開発し、AIアシストとパフォーマンスフィードバックがドメインエキスパートの意思決定をどのように形作るかを研究する2つの実験を行う。
論文 参考訳(メタデータ) (2025-02-03T18:59:38Z) - Human-AI Collaborative Game Testing with Vision Language Models [0.0]
本研究では,AI支援ワークフローの開発と実験により,AIがゲームテストを改善する方法について検討する。
我々は、AIサポートの有無、欠陥や設計資料の詳細な知識の有無の4つの条件下で、AIアシストの有効性を評価する。
その結果、特に詳細な知識と組み合わせた場合、AIアシストは欠陥識別性能を著しく改善することが示された。
論文 参考訳(メタデータ) (2025-01-20T23:14:23Z) - Leveraging AI for Automatic Classification of PCOS Using Ultrasound Imaging [0.0]
AUTO-PCOS分類チャレンジは、多嚢胞性卵巣症候群(PCOS)の同定における人工知能(AI)の診断能力の向上を目指す
本稿では,InceptionV3アーキテクチャを用いたトランスファーラーニングを利用した堅牢なAIパイプライン構築手法について概説する。
論文 参考訳(メタデータ) (2024-12-30T11:56:11Z) - AI-Enhanced Sensemaking: Exploring the Design of a Generative AI-Based Assistant to Support Genetic Professionals [38.54324092761751]
生成AIは、知識労働を変革する可能性があるが、生成AIの使用と相互作用を知識労働者がどのように想定するかを理解するためには、さらなる研究が必要である。
本研究は、ゲノム全配列(WGS)およびその他の臨床データを分析して稀な疾患診断を行う際に、遺伝専門家を支援するための生成AIアシスタントを設計することに焦点を当てた。
論文 参考訳(メタデータ) (2024-12-19T22:54:49Z) - How Performance Pressure Influences AI-Assisted Decision Making [57.53469908423318]
我々は、プレッシャーと説明可能なAI(XAI)技術がAIアドバイステイク行動とどのように相互作用するかを示す。
我々の結果は、圧力とXAIの異なる組み合わせで複雑な相互作用効果を示し、AIアドバイスの行動を改善するか、悪化させるかのどちらかを示す。
論文 参考訳(メタデータ) (2024-10-21T22:39:52Z) - AI Workflow, External Validation, and Development in Eye Disease Diagnosis [5.940140611616894]
AIは診断精度が保証されるが、臨床および多様な集団の検証が不十分なため、現実の応用問題に直面している。
本研究は、年齢関連黄斑変性(AMD)診断と分類重症度に関するケーススタディを通じて、医療用AIの下流アカウンタビリティのギャップに対処する。
論文 参考訳(メタデータ) (2024-09-23T15:01:09Z) - Explainable AI Enhances Glaucoma Referrals, Yet the Human-AI Team Still Falls Short of the AI Alone [6.740852152639975]
各種のAI説明は、提供者が即時または緊急の専門紹介を必要とする患者を区別するのにどのように役立つかを検討する。
我々は、高リスク患者を特定するためのプロキシとして、通常のアイケアデータから緑内障手術のニーズを予測するための説明可能なAIアルゴリズムを構築した。
本研究は,本質的・ポストホックな説明性を取り入れ,ヒト-AIチームのパフォーマンスを評価するために,眼科医とオンライン研究を行った。
論文 参考訳(メタデータ) (2024-05-24T03:01:20Z) - BO-Muse: A human expert and AI teaming framework for accelerated
experimental design [58.61002520273518]
我々のアルゴリズムは、人間の専門家が実験プロセスでリードすることを可能にする。
我々のアルゴリズムは、AIや人間よりも高速に、サブ線形に収束することを示す。
論文 参考訳(メタデータ) (2023-03-03T02:56:05Z) - Advancing Human-AI Complementarity: The Impact of User Expertise and
Algorithmic Tuning on Joint Decision Making [10.890854857970488]
ユーザのドメイン知識、AIシステムのメンタルモデル、レコメンデーションへの信頼など、多くの要因がヒューマンAIチームの成功に影響を与える可能性がある。
本研究は,非自明な血管ラベル作成作業において,血管が流れているか停止しているかを被験者に示すことを目的とした。
以上の結果から,AI-Assistantからの推薦はユーザの意思決定に役立つが,AIに対するユーザベースラインのパフォーマンスや,AIエラー型の相補的チューニングといった要因は,チーム全体のパフォーマンスに大きな影響を及ぼすことが示された。
論文 参考訳(メタデータ) (2022-08-16T21:39:58Z) - Robust and Efficient Medical Imaging with Self-Supervision [80.62711706785834]
医用画像AIの堅牢性とデータ効率を向上させるための統一表現学習戦略であるREMEDISを提案する。
様々な医療画像タスクを研究し, 振り返りデータを用いて3つの現実的な応用シナリオをシミュレートする。
論文 参考訳(メタデータ) (2022-05-19T17:34:18Z) - Who Goes First? Influences of Human-AI Workflow on Decision Making in
Clinical Imaging [24.911186503082465]
本研究は, 放射線医学における診断セッション開始時と, 放射線科医の仮決定後のAI支援の効果について検討した。
その結果、AI推論をレビューする前に仮回答を登録するよう求められている参加者は、アドバイスが正確かどうかに関わらず、AIに同意する確率が低く、AIと意見の相違がある場合には、同僚の第二の意見を求める確率が低いことがわかった。
論文 参考訳(メタデータ) (2022-05-19T16:59:25Z) - Cybertrust: From Explainable to Actionable and Interpretable AI (AI2) [58.981120701284816]
Actionable and Interpretable AI (AI2)は、AIレコメンデーションにユーザの信頼度を明確に定量化し視覚化する。
これにより、AIシステムの予測を調べてテストすることで、システムの意思決定に対する信頼の基盤を確立することができる。
論文 参考訳(メタデータ) (2022-01-26T18:53:09Z) - Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in
Artificial Intelligence [79.038671794961]
我々はUCADI(Unified CT-COVID AI Diagnostic Initiative)を立ち上げ、各ホスト機関でAIモデルを分散的にトレーニングし、独立して実行することができる。
本研究は,中国とイギリスに所在する23の病院で採取した3,336例の胸部CT9,573例について検討した。
論文 参考訳(メタデータ) (2021-11-18T00:43:41Z) - Learning to Complement Humans [67.38348247794949]
オープンワールドにおけるAIに対するビジョンの高まりは、知覚、診断、推論タスクのために人間を補完できるシステムの開発に焦点を当てている。
我々は,人間-機械チームの複合的なパフォーマンスを最適化するために,エンド・ツー・エンドの学習戦略をどのように活用できるかを実証する。
論文 参考訳(メタデータ) (2020-05-01T20:00:23Z) - Is the Most Accurate AI the Best Teammate? Optimizing AI for Teamwork [54.309495231017344]
AIシステムは人間中心の方法でトレーニングされ、チームのパフォーマンスに直接最適化されるべきである、と私たちは主張する。
我々は,AIレコメンデーションを受け入れるか,あるいはタスク自体を解決するかを選択する,特定のタイプのAIチームを提案する。
実世界の高精度データセット上での線形モデルと非線形モデルによる実験は、AIが最も正確であることは、最高のチームパフォーマンスに繋がらないことを示している。
論文 参考訳(メタデータ) (2020-04-27T19:06:28Z) - Effect of Confidence and Explanation on Accuracy and Trust Calibration
in AI-Assisted Decision Making [53.62514158534574]
ケース固有のモデル情報を明らかにする特徴が、信頼度を調整し、人間とAIのジョイントパフォーマンスを向上させることができるかどうかを検討する。
信頼スコアは、AIモデルに対する人々の信頼を校正するのに役立ちますが、信頼の校正だけでは、AI支援による意思決定を改善するには不十分です。
論文 参考訳(メタデータ) (2020-01-07T15:33:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。