論文の概要: RiskAgent: Autonomous Medical AI Copilot for Generalist Risk Prediction
- arxiv url: http://arxiv.org/abs/2503.03802v1
- Date: Wed, 05 Mar 2025 18:46:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 16:00:41.017042
- Title: RiskAgent: Autonomous Medical AI Copilot for Generalist Risk Prediction
- Title(参考訳): RiskAgent: リスク予測のための自律的な医療AIパイロット
- Authors: Fenglin Liu, Jinge Wu, Hongjian Zhou, Xiao Gu, Soheila Molaei, Anshul Thakur, Lei Clifton, Honghan Wu, David A. Clifton,
- Abstract要約: 本稿では,幅広い医療リスク予測を行うためのリスクエージェントシステムを提案する。
RiskAgentは、心臓血管疾患や癌など、様々な複雑な疾患の387以上のリスクシナリオをカバーしている。
我々は、リスク予測に特化した最初のベンチマークMedRiskを構築した。その中には、154の疾患、86の症状、50の専門性、24の臓器システムを含む12,352の質問が含まれている。
- 参考スコア(独自算出の注目度): 27.520717720270415
- License:
- Abstract: The application of Large Language Models (LLMs) to various clinical applications has attracted growing research attention. However, real-world clinical decision-making differs significantly from the standardized, exam-style scenarios commonly used in current efforts. In this paper, we present the RiskAgent system to perform a broad range of medical risk predictions, covering over 387 risk scenarios across diverse complex diseases, e.g., cardiovascular disease and cancer. RiskAgent is designed to collaborate with hundreds of clinical decision tools, i.e., risk calculators and scoring systems that are supported by evidence-based medicine. To evaluate our method, we have built the first benchmark MedRisk specialized for risk prediction, including 12,352 questions spanning 154 diseases, 86 symptoms, 50 specialties, and 24 organ systems. The results show that our RiskAgent, with 8 billion model parameters, achieves 76.33% accuracy, outperforming the most recent commercial LLMs, o1, o3-mini, and GPT-4.5, and doubling the 38.39% accuracy of GPT-4o. On rare diseases, e.g., Idiopathic Pulmonary Fibrosis (IPF), RiskAgent outperforms o1 and GPT-4.5 by 27.27% and 45.46% accuracy, respectively. Finally, we further conduct a generalization evaluation on an external evidence-based diagnosis benchmark and show that our RiskAgent achieves the best results. These encouraging results demonstrate the great potential of our solution for diverse diagnosis domains. To improve the adaptability of our model in different scenarios, we have built and open-sourced a family of models ranging from 1 billion to 70 billion parameters. Our code, data, and models are all available at https://github.com/AI-in-Health/RiskAgent.
- Abstract(参考訳): 大規模言語モデル(LLM)の様々な臨床応用への応用は研究の注目を集めている。
しかし、現実の臨床的意思決定は、現在の取り組みで一般的に使用される標準化されたテストスタイルのシナリオと大きく異なる。
本稿では, 様々な複雑な疾患(例えば, 心血管疾患, 癌)の387以上のリスクシナリオをカバーし, 幅広い医療リスク予測を行うためのリスクエージェントシステムを提案する。
RiskAgentは、何百もの臨床診断ツール、すなわちリスク電卓や、エビデンスベースの医療で支えられているスコアシステムと連携して設計されている。
本手法を評価するため,リスク予測に特化している最初のベンチマークMedRiskを構築した。
その結果、リスクエージェントは80億のモデルパラメータを持ち、76.33%の精度を達成し、最新の商用LCM、o1、o3-mini、GPT-4.5を上回り、GPT-4oの38.39%の精度を2倍にした。
稀な疾患、例えば特発性肺線維症(IPF)では、リスクAgentはo1とGPT-4.5をそれぞれ27.27%、正確性45.46%で上回っている。
最後に、外部エビデンスに基づく診断ベンチマークの一般化評価を行い、リスクAgentが最良の結果を得ることを示す。
これらの奨励的な結果は、多様な診断領域に対する我々のソリューションの大きな可能性を示している。
異なるシナリオにおけるモデルの適応性を改善するため、我々は10億から700億のパラメータからなるモデルのファミリーを構築し、オープンソース化しました。
私たちのコード、データ、モデルは、すべてhttps://github.com/AI-in-Health/RiskAgent.comで利用可能です。
関連論文リスト
- Survey and Improvement Strategies for Gene Prioritization with Large Language Models [61.24568051916653]
大規模言語モデル (LLM) は, 医学検査において良好に機能しているが, 希少な遺伝疾患の診断における有効性は評価されていない。
表現型と可溶性レベルに基づいて, マルチエージェントとヒトフェノタイプオントロジー(HPO)を分類した。
ベースラインでは、GPT-4は他のLLMよりも優れており、因果遺伝子を正しくランク付けする際の精度は30%近く向上した。
論文 参考訳(メタデータ) (2025-01-30T23:03:03Z) - Detecting Bias and Enhancing Diagnostic Accuracy in Large Language Models for Healthcare [0.2302001830524133]
バイアスドAIによる医療アドバイスと誤診は患者の安全を脅かす可能性がある。
本研究では、医療における倫理的かつ正確なAIを促進するために設計された新しいリソースを紹介する。
論文 参考訳(メタデータ) (2024-10-09T06:00:05Z) - Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework [77.45983464131977]
我々は、RAGモデルの予測が誤りであり、現実のアプリケーションにおいて制御不能なリスクをもたらす可能性がどの程度あるかに焦点を当てる。
本研究は,RAGの予測に影響を及ぼす2つの重要な潜伏要因を明らかにする。
我々は,これらの要因をモデルに誘導し,その応答に与える影響を解析する,反実的プロンプトフレームワークを開発した。
論文 参考訳(メタデータ) (2024-09-24T14:52:14Z) - Diagnosis Uncertain Models For Medical Risk Prediction [80.07192791931533]
本研究は, 患者の診断にはアクセスできない, バイタルサイン, 検査値, 既往歴にアクセス可能な患者リスクモデルについて考察する。
このようなすべての原因のリスクモデルが、診断全体にわたって良い一般化を持つが、予測可能な障害モードを持つことが示される。
患者診断の不確実性から生じるリスク予測の不確実性を明示的にモデル化し,この問題に対する対策を提案する。
論文 参考訳(メタデータ) (2023-06-29T23:36:04Z) - Federated Learning Enables Big Data for Rare Cancer Boundary Detection [98.5549882883963]
6大陸にわたる71の医療機関のデータを含む,これまでで最大のフェデレーテッドML研究の結果を報告する。
グリオ芽腫の稀な疾患に対する腫瘍境界自動検出装置を作製した。
当科では, 外科的に標的とした腫瘍の悪性度を高めるために, 33%の改善率を示し, 腫瘍全体に対する23%の改善率を示した。
論文 参考訳(メタデータ) (2022-04-22T17:27:00Z) - Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in
Artificial Intelligence [79.038671794961]
我々はUCADI(Unified CT-COVID AI Diagnostic Initiative)を立ち上げ、各ホスト機関でAIモデルを分散的にトレーニングし、独立して実行することができる。
本研究は,中国とイギリスに所在する23の病院で採取した3,336例の胸部CT9,573例について検討した。
論文 参考訳(メタデータ) (2021-11-18T00:43:41Z) - Development of a dynamic type 2 diabetes risk prediction tool: a UK
Biobank study [0.8620335948752806]
英国バイオバンクデータセットの301機能を用いて10年間の2型糖尿病リスクスコアを算出した。
Cox比例ハザードモデルは、同じ特徴を使ってトレーニングされたDeepSurvモデルをわずかに上回った。
このツールは、2型糖尿病のリスクのある患者の臨床スクリーニングや患者のエンパワーメントの促進に使用できる。
論文 参考訳(メタデータ) (2021-04-20T16:37:26Z) - A scalable approach for developing clinical risk prediction applications
in different hospitals [2.3837093461599634]
機械学習アルゴリズムは現在、臨床応用のための急性事象の予測に広く使われている。
臨床リスク予測モデルの開発プロセスを複数の疾患に拡張するためのスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2021-01-21T21:22:32Z) - Clinical prediction system of complications among COVID-19 patients: a
development and validation retrospective multicentre study [0.3569980414613667]
2020年4月1日から4月30日までにUAEのアブダビ(AD)で18施設に入院した3,352人の患者から収集したデータを用いた。
最初の24時間に収集されたデータを用いて、機械学習ベースの予後システムは、入院中に7つの合併症を発生させるリスクを予測する。
このシステムは、すべての合併症と両方の領域にわたって良好な精度を達成する。
論文 参考訳(メタデータ) (2020-11-28T18:16:23Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Deep Learning-based Computational Pathology Predicts Origins for Cancers
of Unknown Primary [2.645435564532842]
原発不明癌 (CUP) は腫瘍由来の原発性解剖学的部位を特定できない診断群である。
最近の研究は、腫瘍原点の同定にゲノム学と転写学を使うことに重点を置いている。
深層学習に基づくCUPの差分診断が可能な計算病理アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-24T17:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。