論文の概要: Small Agent Group is the Future of Digital Health
- arxiv url: http://arxiv.org/abs/2602.08013v1
- Date: Sun, 08 Feb 2026 15:27:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.928479
- Title: Small Agent Group is the Future of Digital Health
- Title(参考訳): デジタルヘルスの未来はスモールエージェントグループ
- Authors: Yuqiao Meng, Luoxi Tang, Dazheng Zhang, Rafael Brens, Elvys J. Romero, Nancy Guo, Safa Elkefi, Zhaohan Xi,
- Abstract要約: スモールエージェントグループ(SAG)は、共同検討プロセスを通じてより良い臨床推論を支援する。
SAGは単一巨大モデルに比べて優れた性能を発揮する。
全体として、SAGは、より良い効率性、信頼性、デプロイメント効率のバランスをとる、デジタルヘルスに対するスケーラブルなソリューションを提供する。
- 参考スコア(独自算出の注目度): 3.3427934422803
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid adoption of large language models (LLMs) in digital health has been driven by a "scaling-first" philosophy, i.e., the assumption that clinical intelligence increases with model size and data. However, real-world clinical needs include not only effectiveness, but also reliability and reasonable deployment cost. Since clinical decision-making is inherently collaborative, we challenge the monolithic scaling paradigm and ask whether a Small Agent Group (SAG) can support better clinical reasoning. SAG shifts from single-model intelligence to collective expertise by distributing reasoning, evidence-based analysis, and critical audit through a collaborative deliberation process. To assess the clinical utility of SAG, we conduct extensive evaluations using diverse clinical metrics spanning effectiveness, reliability, and deployment cost. Our results show that SAG achieves superior performance compared to a single giant model, both with and without additional optimization or retrieval-augmented generation. These findings suggest that the synergistic reasoning represented by SAG can substitute for model parameter growth in clinical settings. Overall, SAG offers a scalable solution to digital health that better balances effectiveness, reliability, and deployment efficiency.
- Abstract(参考訳): デジタルヘルスにおける大規模言語モデル(LLM)の急速な採用は、「スケーリングファースト」哲学、すなわち、モデルのサイズとデータによって臨床知能が増加するという仮定によって推進されている。
しかし、実際の臨床ニーズには、有効性だけでなく、信頼性と適切なデプロイメントコストも含まれている。
臨床意思決定は本質的に協調的であるため,モノリシックなスケーリングパラダイムに挑戦し,SAG(Small Agent Group)がより良い臨床推論を支援するかどうかを問う。
SAGは、単一モデルインテリジェンスから、推論、エビデンスに基づく分析、および批判的な監査を共同検討プロセスを通じて分散することで、総合的な専門知識へとシフトする。
SAGの臨床的有用性を評価するために, 有効性, 信頼性, 展開コストにまたがる多様な臨床指標を用いて, 広範囲な評価を行った。
以上の結果から,SAGは1つの巨大モデルと比較して,最適化や検索拡張生成を伴わず,優れた性能を達成できることが示唆された。
これらのことから,SAGで表される相乗的推論は,臨床条件下でのモデルパラメータ成長に取って代わる可能性が示唆された。
全体として、SAGは、効率性、信頼性、デプロイメント効率のバランスを良くする、デジタルヘルスに対するスケーラブルなソリューションを提供する。
関連論文リスト
- Intervention Efficiency and Perturbation Validation Framework: Capacity-Aware and Robust Clinical Model Selection under the Rashomon Effect [8.16102315566872]
同等のパフォーマンスを持つ複数のモデルの共存は、信頼できるデプロイメントと評価に根本的な課題をもたらします。
我々は,頑健なモデルアセスメントと選択のための2つの補完的ツールを提案する: 介入効率(IE)と摂動検証フレームワーク(PVF)。
IEはキャパシティを意識したメトリクスであり、限られた介入しか実現できない場合、モデルが実行可能な真の正をいかに効率的に識別するかを定量化する。
PVFは、データ摂動下でのモデルの安定性を評価するための構造化されたアプローチを導入し、ノイズやシフトした検証セット間で性能が最も不変なモデルを特定する。
論文 参考訳(メタデータ) (2025-11-18T10:21:07Z) - PSO-XAI: A PSO-Enhanced Explainable AI Framework for Reliable Breast Cancer Detection [2.5631347250059577]
本研究では、機能選択のためのカスタマイズされたParticle Swarm Optimization (PSO)を組み込んだ統合フレームワークを提案する。
提案手法は、精度と精度を含む全てのパフォーマンス指標において99.1%の優れたスコアを得た。
結果は,Swarmインテリジェンスと説明可能なMLを組み合わせることで,堅牢で信頼性が高く,臨床的に有意義な乳癌診断の可能性を強調した。
論文 参考訳(メタデータ) (2025-10-23T14:42:50Z) - Baichuan-M2: Scaling Medical Capability with Large Verifier System [40.86227022086866]
静的解答検証を超越した,新しい動的検証フレームワークを提案する。
多段階強化学習戦略によって訓練された医療強化推論モデルBaichuan-M2を開発した。
HealthBenchでの評価では、Baichuan-M2は、他のすべてのオープンソースモデルや、最も高度なクローズドソースモデルよりも優れています。
論文 参考訳(メタデータ) (2025-09-02T11:23:35Z) - RadFabric: Agentic AI System with Reasoning Capability for Radiology [61.25593938175618]
RadFabricは、総合的なCXR解釈のための視覚的およびテキスト分析を統合するマルチエージェント、マルチモーダル推論フレームワークである。
システムは、病理診断に特殊なCXRエージェント、正確な解剖学的構造に視覚所見をマッピングする解剖学的解釈エージェント、および視覚的、解剖学的、臨床データを透明かつ証拠に基づく診断に合成する大規模なマルチモーダル推論モデルを利用した推論エージェントを使用する。
論文 参考訳(メタデータ) (2025-06-17T03:10:33Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Clinical Evaluation of Medical Image Synthesis: A Case Study in Wireless Capsule Endoscopy [63.39037092484374]
人工知能(AI)に基づく合成データ生成は、臨床医学の届け方を変えることができる。
本研究は,無線カプセル内視鏡(WCE)画像を用いた炎症性腸疾患(IBD)の診断における概念実証による医療用SDGの臨床評価に焦点を当てた。
その結果、TIDE-IIは、最先端の生成モデルと比較して品質が向上し、臨床的に可塑性で、非常に現実的なWCE画像を生成することがわかった。
論文 参考訳(メタデータ) (2024-10-31T19:48:50Z) - ClinicalAgent: Clinical Trial Multi-Agent System with Large Language Model-based Reasoning [16.04933261211837]
大規模言語モデル(LLM)とマルチエージェントシステムは、自然言語処理において顕著な能力を示しているが、臨床試験では課題に直面している。
臨床用マルチエージェントシステムである臨床エージェントシステム(ClinicalAgent)について紹介する。
論文 参考訳(メタデータ) (2024-04-23T06:30:53Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Automatic diagnosis of knee osteoarthritis severity using Swin
transformer [55.01037422579516]
変形性膝関節症 (KOA) は膝関節の慢性的な痛みと硬直を引き起こす疾患である。
我々は,Swin Transformer を用いて KOA の重大度を予測する自動手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T09:49:30Z) - Large Language Models for Healthcare Data Augmentation: An Example on
Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。
本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文 参考訳(メタデータ) (2023-03-24T03:14:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。