論文の概要: Clinical Reasoning in the Age of AI: Longitudinal Cognition and Human-AI Collaboration
- arxiv url: http://arxiv.org/abs/2606.08442v1
- Date: Sun, 07 Jun 2026 03:51:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.107147
- Title: Clinical Reasoning in the Age of AI: Longitudinal Cognition and Human-AI Collaboration
- Title(参考訳): AI時代の臨床的推論--縦断的認知と人間-AI協調
- Authors: Irene Yi, Grace Brown, Sufian Aldogom, Nathan Roll, Eric J. Basile, Pamela M. Resnikoff, Bianca Sanchez, Chirag Lodha, Isaac Gutterman, Oscar Schiff, Keira Salata, Benjamin Mujkic, Ammar Ahmed,
- Abstract要約: 現実の環境での臨床的な問題を通じて医師が推論する方法を理解することは、効果的なAI推論システムの設計に不可欠である。
本研究は、臨床推論を文脈に敏感で時間的に拡張されたプロセスとして理解するための統一的な枠組みを提供する。
- 参考スコア(独自算出の注目度): 0.7588418803784354
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As physicians turn to AI-powered systems to help meet the dual demands of speed and care quality, they are met with hallucinations and sycophancy. Understanding how doctors reason through clinical problems in real-world settings is critical for design of effective AI reasoning systems. While recent advances in medical AI have emphasized performance benchmarks and diagnostic accuracy, comparatively little attention has been paid to the structure of clinicians' reasoning processes as they unfold over time, e.g., how they interact with electronic health records and operate under conditions of uncertainty and constraint. This study provides a comprehensive, empirically-grounded account of clinical reasoning and its relationship to current AI-mediated workflows through a mixed-methods design that combines qualitative interviews with structured survey data. Findings indicate that current AI systems are primarily deployed for encounter-level tasks such as documentation and summarization, and only partially align with physicians' underlying reasoning processes. In particular, AI-generated representations often omit temporal or interpretive structures central to clinical decision-making, while core aspects of reasoning, especially those spanning multiple encounters, remain largely implicit and physician-driven. By integrating fine-grained qualitative insights with broader quantitative patterns, this study offers a unified framework for understanding clinical reasoning as a context-sensitive, temporally extended process and identifies key mismatches between clinician cognition and current AI design. These results provide concrete directions for the development of AI systems that more effectively align with and augment real-world clinical reasoning.
- Abstract(参考訳): 医師は、スピードとケアの質という2つの要求を満たすために、AIを利用したシステムに目を向ける。
現実の環境での臨床的な問題を通じて医師が推論する方法を理解することは、効果的なAI推論システムの設計に不可欠である。
医療AIの最近の進歩は、パフォーマンスベンチマークと診断精度を強調しているが、専門医が時間をかけて展開する推論プロセスの構造、例えば、電子的な健康記録とどのように相互作用し、不確実性と制約の条件下で操作するかに、比較的注意が払われている。
本研究は、定性的な面接と構造化された調査データを組み合わせた混合メソッド設計により、臨床推論とその現在のAIによるワークフローとの関係について、包括的で実証的な説明を提供する。
発見は、現在のAIシステムが主にドキュメントや要約のような遭遇レベルなタスクにデプロイされ、医師の基本的な推論プロセスと部分的に一致していることを示している。
特に、AIによって生成された表現は、しばしば、臨床的意思決定の中心となる時間的または解釈的な構造を省略するが、推論の中核的な側面、特に複数の出会いにまたがるものは、主に暗黙的で医師主導のままである。
本研究は、詳細な定性的な洞察をより広い定量的パターンに統合することにより、文脈に敏感で時間的に拡張されたプロセスとして臨床推論を理解するための統一的な枠組みを提供し、臨床医の認知と現在のAI設計の主なミスマッチを識別する。
これらの結果は、現実の臨床的推論をより効果的に整合させ、拡張するAIシステムの開発のための具体的な方向を提供する。
関連論文リスト
- Medical Model Synthesis Architectures: A Case Study [72.46211022258122]
現在のAIシステムは、不確実性の下で調整された推論に苦労している。
我々は,不確実性の下で,現実的に有用だが公式に透過的な臨床予測を行うことができるAIシステムのためのフレームワークを提案する。
このフレームワークの最初の概念実証は、どのようにして差分診断に利用できるかを示す。
論文 参考訳(メタデータ) (2026-05-10T19:30:16Z) - Augmenting Clinical Decision-Making with an Interactive and Interpretable AI Copilot: A Real-World User Study with Clinicians in Nephrology and Obstetrics [36.981753143345664]
共同臨床意思決定のための対話型・解釈可能なAIコラボロであるAICareについて紹介する。
縦断的な電子健康記録を解析することにより、AICareは動的リスク予測を精査可能な可視化に基礎を置いている。
論文 参考訳(メタデータ) (2026-01-31T13:41:32Z) - MedConsultBench: A Full-Cycle, Fine-Grained, Process-Aware Benchmark for Medical Consultation Agents [10.109613967215447]
MedConsultBenchは,オンラインコンサルテーションサイクルの完全な評価を目的とした総合的なフレームワークである。
本手法では,臨床情報取得をサブターンレベルで追跡するために,AIU(Atomic Information Units)を導入している。
オンラインコンサルティングに固有の不明瞭さと曖昧さに対処することで、このベンチマークは不確実性を認識しながら簡潔な調査を評価する。
論文 参考訳(メタデータ) (2026-01-19T02:18:10Z) - Human-AI Co-design for Clinical Prediction Models [8.099095493749868]
我々は,AIエージェントを用いて,完全に解釈可能な臨床予測モデルの開発を加速する,反復的ヒューマン・イン・ザ・ループ・フレームワークであるHACHIを紹介する。
2つの現実的予測タスクにおいて、HACHIは既存のアプローチを上回り、新しい臨床関連概念を表面化し、臨床現場や期間にわたってモデルの一般化性を向上させる。
論文 参考訳(メタデータ) (2026-01-14T02:04:34Z) - Automated Construction of Medical Indicator Knowledge Graphs Using Retrieval Augmented Large Language Models [8.095858876360577]
本稿では,検索拡張生成(RAG)と大規模言語モデル(LLM)を組み合わせて医療指標知識グラフを構築する自動フレームワークを提案する。
得られた知識グラフは、インテリジェントな診断と質問応答システムに統合することができる。
論文 参考訳(メタデータ) (2025-11-17T16:00:42Z) - Simulating Viva Voce Examinations to Evaluate Clinical Reasoning in Large Language Models [51.91760712805404]
大規模言語モデル(LLM)におけるシーケンシャルな臨床推論を評価するためのベンチマークであるVivaBenchを紹介する。
本データセットは,医療訓練における(口頭)検査をシミュレートする対話的シナリオとして構成された1762名の医師による臨床ヴィグネットから構成される。
本分析では,臨床における認知的誤りを反映するいくつかの障害モードを同定した。
論文 参考訳(メタデータ) (2025-10-11T16:24:35Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Towards Next-Generation Medical Agent: How o1 is Reshaping Decision-Making in Medical Scenarios [46.729092855387165]
本稿では,医療用AIエージェントのバックボーンLSMの選択について検討する。
我々の研究結果は、o1の診断精度と一貫性を高める能力を示し、よりスマートでより応答性の高いAIツールへの道を開いた。
論文 参考訳(メタデータ) (2024-11-16T18:19:53Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。