論文の概要: From Clinical Intent to Clinical Model: An Autonomous Coding-Agent Framework for Clinician-driven AI Development
- arxiv url: http://arxiv.org/abs/2604.17110v1
- Date: Sat, 18 Apr 2026 18:56:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.337649
- Title: From Clinical Intent to Clinical Model: An Autonomous Coding-Agent Framework for Clinician-driven AI Development
- Title(参考訳): 臨床インテントから臨床モデルへ:臨床駆動型AI開発のための自律的コーディング・エージェント・フレームワーク
- Authors: Zihao Zhao, Frederik Hauke, Juliana De Castilhos, Jakob Nikolas Kather, Sven Nebelung, Daniel Truhn,
- Abstract要約: 臨床駆動型臨床AI開発のための自律型プロトタイプを提案する。
腹腔鏡下病変分類,メラノーマ・ヴァース・ネヴス・トリアージ,手首骨折検出の5つの臨床的課題について検討した。
胸部X線写真における嫌気性気胸分類タスクでは、ショートカット学習の軽減に成功し、胸部ドレインへの依存度をほぼ半減した。
- 参考スコア(独自算出の注目度): 3.2594208950928647
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical AI development has traditionally followed a collaborative paradigm that depends on close interaction between clinicians and specialized AI teams. This paradigm imposes a practical challenge: clinicians must repeatedly communicate and refine their requirements with AI developers before those requirements can be translated into executable model development. This iterative process is time-consuming, and even after repeated discussion, misalignment may still exist because the two sides do not fully share each other's expertise. However, autonomous coding agents may change this paradigm, raising the possibility that clinicians could develop clinical AI models independently through natural-language interaction alone. In this study, we present such an autonomous prototype for clinician-driven clinical AI development. We evaluated the system on five clinical tasks spanning dermoscopic lesion classification, melanoma-versus-nevus triage, wrist-fracture detection (including a weakly supervised variant with only 5% bounding-box annotations), and debiased pneumothorax classification on chest radiographs. Across these settings, the system consistently developed models from clinician requests and achieved promising performance. Notably, in a debiased pneumothorax classification task on chest radiographs, where chest drains can act as a major confounder, the system successfully mitigated shortcut learning and nearly halved the model's reliance on chest drains. These findings provide proof of concept that autonomous coding agents may help shift clinical AI development toward a more clinician-driven paradigm, reducing the communication overhead and dependence on specialized AI developers. Although further validation and robustness assessment are needed, this study suggests a promising path toward making clinical AI development more accessible.
- Abstract(参考訳): 臨床AI開発は伝統的に、臨床医と専門のAIチームとの密接な相互作用に依存する共同パラダイムに従ってきた。
臨床医は、それらの要件が実行可能なモデル開発に変換される前に、AI開発者と繰り返し通信し、要求を洗練しなければなりません。
この反復的なプロセスは時間がかかり、繰り返し議論された後も、両者が互いの専門知識を完全に共有していないため、いまだに不一致が存在する可能性がある。
しかし、自律的なコーディングエージェントはこのパラダイムを変え、臨床医が自然言語の相互作用だけで臨床AIモデルを独立して開発できる可能性を高めている。
本研究では,臨床駆動型臨床AI開発のための自律型プロトタイプを提案する。
胸部X線写真では, 皮膚内視鏡的病変分類, メラノーマ・ヴァース・ネヴス・トリアージ, 手首断裂検出(境界ボックスのアノテーションを5%に限定した弱い教師付き変種を含む), 気胸分類の5つの臨床的課題について検討した。
これらの設定の中で、システムは一貫して臨床医の要求からモデルを開発し、有望なパフォーマンスを実現した。
特に、胸部ドレナージが主要な共同創設者として機能する胸部ドレナージの嫌気性気胸分類タスクにおいて、システムはショートカット学習の軽減に成功し、胸部ドレナードへの依存をほぼ半減した。
これらの発見は、自律的なコーディングエージェントが臨床AI開発をよりクリニック駆動のパラダイムへとシフトさせ、コミュニケーションのオーバーヘッドを減らし、専門のAI開発者への依存を減らすことができるという概念の証明を提供する。
さらなる検証とロバストネス評価が必要であるが、この研究は臨床AI開発をよりアクセスしやすいものにするための有望な道のりを示唆している。
関連論文リスト
- ClinicalAgents: Multi-Agent Orchestration for Clinical Decision Making with Dual-Memory [17.805771452487612]
専門医の認知ワークフローをシミュレートする新しいマルチエージェントフレームワークであるCrysicalAgentsを紹介する。
厳密なシーケンシャルチェーンとは異なり、CricerAgentsはモンテカルロ木探索(MCTS)プロセスとしてモデル化された動的オーケストレーション機構を採用している。
これにより、Orchestratorは仮説を反復的に生成し、証拠を積極的に検証し、重要な情報が欠落した時にバックトラッキングをトリガーすることができる。
論文 参考訳(メタデータ) (2026-03-27T08:52:19Z) - Emulating Clinician Cognition via Self-Evolving Deep Clinical Research [104.66211772795747]
このギャップを橋渡しする自己進化型診断剤DxEvolveを,インタラクティブな深層臨床研究ワークフローを通じて開発しました。
MIMIC-CDMベンチマークでは、DxEvolveは平均オーバーボーンモデルで診断精度を11.2%改善した。
DxEvolveは、経験を管理可能な学習資産に変えることによって、臨床AIの継続的な進化のための説明可能な経路をサポートする。
論文 参考訳(メタデータ) (2026-03-11T11:41:51Z) - MedSAM-Agent: Empowering Interactive Medical Image Segmentation with Multi-turn Agentic Reinforcement Learning [53.37068897861388]
MedSAM-Agentは、対話的なセグメンテーションを多段階の自律的な意思決定プロセスとして再構築するフレームワークである。
マルチターン・エンド・ツー・エンドの成果検証を統合した2段階のトレーニングパイプラインを開発した。
6つの医療モダリティと21のデータセットにわたる実験は、MedSAM-Agentが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-02-03T09:47:49Z) - Human-AI Co-design for Clinical Prediction Models [8.099095493749868]
我々は,AIエージェントを用いて,完全に解釈可能な臨床予測モデルの開発を加速する,反復的ヒューマン・イン・ザ・ループ・フレームワークであるHACHIを紹介する。
2つの現実的予測タスクにおいて、HACHIは既存のアプローチを上回り、新しい臨床関連概念を表面化し、臨床現場や期間にわたってモデルの一般化性を向上させる。
論文 参考訳(メタデータ) (2026-01-14T02:04:34Z) - RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - Interpretable Clinical Classification with Kolgomorov-Arnold Networks [70.72819760172744]
Kolmogorov-Arnold Networks (KAN) は、透明で象徴的な表現を通じて固有の解釈能力を提供する。
Kansは、組み込みの患者レベルの洞察、直感的な可視化、最寄りの患者の検索をサポートする。
これらの結果は、カンを、臨床医が理解し、監査し、行動できる信頼できるAIへの有望なステップと位置づけている。
論文 参考訳(メタデータ) (2025-09-20T17:21:58Z) - CardAIc-Agents: A Multimodal Framework with Hierarchical Adaptation for Cardiac Care Support [37.20545002349272]
CardAIc-Agentsは、AIモデルを外部ツールで拡張し、多様な心臓タスクを適応的にサポートするフレームワークである。
カルディアックRAGのエージェントは、心の知識から一般的な計画を作成し、チーフエージェントはこれらの計画を自律的に実行し、決定を下すためのツールを統合した。
3つのデータセットを対象とした実験では、主流のVision-Language Models (VLM)、最先端のエージェントシステム、微調整されたVLMと比較して、CardAIc-Agentsの有効性が示された。
論文 参考訳(メタデータ) (2025-08-18T16:17:12Z) - Medchain: Bridging the Gap Between LLM Agents and Clinical Practice with Interactive Sequence [68.05876437208505]
臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。
フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文 参考訳(メタデータ) (2024-12-02T15:25:02Z) - Establishing Rigorous and Cost-effective Clinical Trials for Artificial Intelligence Models [18.240773244542474]
人工知能(AI)と医学における臨床実践の間には大きなギャップが残っている。
最先端および最先端のAIモデル評価は、医療データセットの研究室研究や、患者中心または患者中心のコントロールを持たない直接臨床試験に限られる。
臨床実習におけるAIモデルの厳格かつ費用対効果評価手法の重要性を初めて強調する。
論文 参考訳(メタデータ) (2024-07-11T14:37:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。