論文の概要: Human-AI Co-design for Clinical Prediction Models
- arxiv url: http://arxiv.org/abs/2601.09072v1
- Date: Wed, 14 Jan 2026 02:04:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-15 18:59:20.219357
- Title: Human-AI Co-design for Clinical Prediction Models
- Title(参考訳): 臨床予測モデルのための人間-AI共同設計
- Authors: Jean Feng, Avni Kothari, Patrick Vossler, Andrew Bishara, Lucas Zier, Newton Addo, Aaron Kornblith, Yan Shuo Tan, Chandan Singh,
- Abstract要約: 我々は,AIエージェントを用いて,完全に解釈可能な臨床予測モデルの開発を加速する,反復的ヒューマン・イン・ザ・ループ・フレームワークであるHACHIを紹介する。
2つの現実的予測タスクにおいて、HACHIは既存のアプローチを上回り、新しい臨床関連概念を表面化し、臨床現場や期間にわたってモデルの一般化性を向上させる。
- 参考スコア(独自算出の注目度): 8.099095493749868
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing safe, effective, and practically useful clinical prediction models (CPMs) traditionally requires iterative collaboration between clinical experts, data scientists, and informaticists. This process refines the often small but critical details of the model building process, such as which features/patients to include and how clinical categories should be defined. However, this traditional collaboration process is extremely time- and resource-intensive, resulting in only a small fraction of CPMs reaching clinical practice. This challenge intensifies when teams attempt to incorporate unstructured clinical notes, which can contain an enormous number of concepts. To address this challenge, we introduce HACHI, an iterative human-in-the-loop framework that uses AI agents to accelerate the development of fully interpretable CPMs by enabling the exploration of concepts in clinical notes. HACHI alternates between (i) an AI agent rapidly exploring and evaluating candidate concepts in clinical notes and (ii) clinical and domain experts providing feedback to improve the CPM learning process. HACHI defines concepts as simple yes-no questions that are used in linear models, allowing the clinical AI team to transparently review, refine, and validate the CPM learned in each round. In two real-world prediction tasks (acute kidney injury and traumatic brain injury), HACHI outperforms existing approaches, surfaces new clinically relevant concepts not included in commonly-used CPMs, and improves model generalizability across clinical sites and time periods. Furthermore, HACHI reveals the critical role of the clinical AI team, such as directing the AI agent to explore concepts that it had not previously considered, adjusting the granularity of concepts it considers, changing the objective function to better align with the clinical objectives, and identifying issues of data bias and leakage.
- Abstract(参考訳): 安全で効果的で実用的な臨床予測モデル(CPM)の開発には、伝統的に臨床専門家、データサイエンティスト、情報科学者の反復的な協力が必要である。
このプロセスは、どの特徴/患者を含めるべきか、臨床カテゴリをどのように定義すべきかなど、モデル構築プロセスの小さなが重要な詳細を洗練します。
しかし、この伝統的なコラボレーションプロセスは非常に時間と資源集約であり、結果として臨床実践に到達したCPMはごくわずかである。
この課題は、チームが膨大な数のコンセプトを含む、構造化されていない臨床ノートを組み込もうとするとき、さらに強まります。
この課題に対処するために,臨床ノートにおける概念の探索を可能にすることで,AIエージェントを用いて完全に解釈可能なCPMの開発を加速する,反復的ヒューマン・イン・ザ・ループ・フレームワークであるHACHIを導入する。
はちは交互に
一 臨床ノートにおける候補概念を急速に探求し、評価するAIエージェント
(II) CPM学習プロセスを改善するためのフィードバックを提供する臨床・領域の専門家。
HACHIは概念を、線形モデルで使用される単純なイエスノー質問として定義し、臨床AIチームが各ラウンドで学んだCPMを透過的にレビューし、精査し、検証できるようにする。
2つの現実的な予測タスク(急性腎臓損傷と外傷性脳損傷)において、HACHIは既存のアプローチを上回り、一般的に使用されるCPMに含まれない新しい臨床関連概念を表面化し、臨床現場や期間にわたってモデルの一般化性を向上させる。
さらに、HACHIは、AIエージェントに対して、これまで考慮していなかった概念を探求するよう指示すること、考慮した概念の粒度を調整すること、臨床目的との整合性を高めるために目的関数を変更すること、データバイアスと漏洩の問題を特定することなど、臨床AIチームの重要な役割を明らかにしている。
関連論文リスト
- Benchmarking Egocentric Clinical Intent Understanding Capability for Medical Multimodal Large Language Models [48.95516224614331]
MedGaze-Benchは、臨床医の視線を認知的カーソルとして活用し、手術、緊急シミュレーション、診断解釈における意図的理解を評価する最初のベンチマークである。
本ベンチマークでは,解剖学的構造の視覚的均一性,臨床における時間・因果依存性の厳格化,安全プロトコルへの暗黙の順守という3つの基本的な課題に対処する。
論文 参考訳(メタデータ) (2026-01-11T02:20:40Z) - Interpretable Clinical Classification with Kolgomorov-Arnold Networks [70.72819760172744]
Kolmogorov-Arnold Networks (KAN) は、透明で象徴的な表現を通じて固有の解釈能力を提供する。
Kansは、組み込みの患者レベルの洞察、直感的な可視化、最寄りの患者の検索をサポートする。
これらの結果は、カンを、臨床医が理解し、監査し、行動できる信頼できるAIへの有望なステップと位置づけている。
論文 参考訳(メタデータ) (2025-09-20T17:21:58Z) - Automated Clinical Problem Detection from SOAP Notes using a Collaborative Multi-Agent LLM Architecture [8.072932739333309]
我々は,このギャップに対処するために,臨床相談チームをモデル化する共同マルチエージェントシステム(MAS)を導入する。
このシステムは、SOAPノートの主観的(S)および目的的(O)セクションのみを分析することによって、臨床上の問題を特定する。
マネージャエージェントは、階層的で反復的な議論に従事し、合意に達するために、動的に割り当てられた専門家エージェントのチームを編成する。
論文 参考訳(メタデータ) (2025-08-29T17:31:24Z) - Improving ARDS Diagnosis Through Context-Aware Concept Bottleneck Models [2.3802351706765017]
病気を理解するための新しいリソースとして、大規模で一般公開された臨床データセットが登場した。
これらのデータセットは、もともと研究目的で収集されていないデータから派生しており、その結果、しばしば不完全であり、重要なラベルが欠落している。
多くのAIツールは、疾患分類を実行するなど、これらのデータセットを振り返ってラベル付けするために開発されている。
従来の研究は、高レベルな臨床概念にマッピングする解釈可能な概念を学ぶConcept Bottleneck Models (CBMs)を用いて、予測を説明しようと試みてきた。
我々は,急性呼吸障害症候群(ARDS)の診断を,臨床ノートからコンテキスト情報を取り入れて改善することの価値を実証するために,挑戦的なテストケースとして用いている。
論文 参考訳(メタデータ) (2025-08-13T11:19:30Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Doctor-in-the-Loop: An Explainable, Multi-View Deep Learning Framework for Predicting Pathological Response in Non-Small Cell Lung Cancer [0.6800826356148091]
非小細胞肺癌(NSCLC)はいまだに世界的な健康上の課題である。
専門家主導のドメイン知識と説明可能な人工知能技術を統合する新しいフレームワークであるDoctor-in-the-Loopを提案する。
アプローチでは段階的なマルチビュー戦略を採用し,より広いコンテキスト特徴からより微細で病変特異的な詳細まで,モデルの焦点を段階的に洗練する。
論文 参考訳(メタデータ) (2025-02-21T16:35:30Z) - Advancing clinical trial outcomes using deep learning and predictive modelling: bridging precision medicine and patient-centered care [0.0]
深層学習と予測モデリングは、臨床試験設計、患者採用、リアルタイムモニタリングを最適化するための変換ツールとして登場した。
本研究では、畳み込みニューラルネットワーク(CNN)やトランスフォーマーモデルなどの深層学習技術の患者層化への応用について検討する。
生存分析や時系列予測を含む予測モデリング手法は、試行結果の予測、効率の向上、試行失敗率の低減に用いられている。
論文 参考訳(メタデータ) (2024-12-09T23:20:08Z) - Medchain: Bridging the Gap Between LLM Agents and Clinical Practice with Interactive Sequence [68.05876437208505]
臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。
フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文 参考訳(メタデータ) (2024-12-02T15:25:02Z) - TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [54.98321887435557]
本稿では, マルチモーダル入力特徴と臨床治験設計における8つの重要な予測課題を網羅した, 精巧にキュレートされた23個のAI対応データセットについて述べる。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - Natural Language Programming in Medicine: Administering Evidence Based Clinical Workflows with Autonomous Agents Powered by Generative Large Language Models [29.05425041393475]
ジェネレーティブ・大型言語モデル(LLM)は医療において大きな可能性を秘めている。
本研究は, シミュレーション3次医療センターにおいて, 自律型エージェントとして機能するLSMの可能性を評価した。
論文 参考訳(メタデータ) (2024-01-05T15:09:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。