論文の概要: A Multi-Agent Framework for Interpreting Multivariate Physiological Time Series
- arxiv url: http://arxiv.org/abs/2603.04142v1
- Date: Wed, 04 Mar 2026 14:55:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 21:29:15.359848
- Title: A Multi-Agent Framework for Interpreting Multivariate Physiological Time Series
- Title(参考訳): 多変量生理時系列の解釈のためのマルチエージェントフレームワーク
- Authors: Davide Gabrielli, Paola Velardi, Stefano Faralli, Bardh Prenkaj,
- Abstract要約: 本稿では,多変量生理的時系列を記述した役割構造型マルチエージェントシステムであるVivaldiを紹介する。
実験の結果,エージェントパイプラインは,非思考的,医学的に微調整されたモデルに極めて有用であることがわかった。
一方、痛みスコアや滞在時間といった主観的対象は、限定的あるいは矛盾的な変化を示す。
- 参考スコア(独自算出の注目度): 9.72130666902599
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Continuous physiological monitoring is central to emergency care, yet deploying trustworthy AI is challenging. While LLMs can translate complex physiological signals into clinical narratives, it is unclear how agentic systems perform relative to zero-shot inference. To address these questions, we present Vivaldi, a role-structured multi-agent system that explains multivariate physiological time series. Due to regulatory constraints that preclude live deployment, we instantiate Vivaldi in a controlled, clinical pilot to a small, highly qualified cohort of emergency medicine experts, whose evaluations reveal a context-dependent picture that contrasts with prevailing assumptions that agentic reasoning uniformly improves performance. Our experiments show that agentic pipelines substantially benefit non-thinking and medically fine-tuned models, improving expert-rated explanation justification and relevance by +6.9 and +9.7 points, respectively. Contrarily, for thinking models, agentic orchestration often degrades explanation quality, including a 14-point drop in relevance, while improving diagnostic precision (ESI F1 +3.6). We also find that explicit tool-based computation is decisive for codifiable clinical metrics, whereas subjective targets, such as pain scores and length of stay, show limited or inconsistent changes. Expert evaluation further indicates that gains in clinical utility depend on visualization conventions, with medically specialized models achieving the most favorable trade-offs between utility and clarity. Together, these findings show that the value of agentic AI lies in the selective externalization of computation and structure rather than in maximal reasoning complexity, and highlight concrete design trade-offs and learned lessons, broadly applicable to explainable AI in safety-critical healthcare settings.
- Abstract(参考訳): 継続的な生理的モニタリングは緊急ケアの中心であるが、信頼できるAIをデプロイすることは難しい。
LLMは複雑な生理的信号を臨床物語に変換することができるが、エージェントシステムがゼロショット推論と比較してどのように機能するかは明らかではない。
これらの問題に対処するため,多変量生理時系列を記述した役割構造型マルチエージェントシステムであるVivaldiを提案する。
生体配備を阻害する規制上の制約により、我々は、Vivaldiを制御された臨床パイロットを、エージェント推論がパフォーマンスを均一に改善するという一般的な仮定とは対照的に、文脈に依存した画像を示す、小規模で高度な資格を持つ救急医療専門家のコホートにインスタンス化する。
実験の結果, エージェントパイプラインは, 非思考モデルと医学的な微調整モデルに大きく寄与し, 専門家による説明の正当性や妥当性を+6.9点, +9.7点で改善した。
対照的に、思考モデルの場合、エージェントオーケストレーションは、診断精度(ESI F1 + 3.6)を改善しながら、14ポイントの関連性の低下を含む説明品質を劣化させることが多い。
また,痛みスコアや滞在時間といった主観的目標が限定的あるいは矛盾的な変化を示すのに対して,明示的なツールベースの計算が有意な臨床指標を決定することも見いだした。
専門的な評価は、臨床ユーティリティの利得が視覚化の慣行に依存していることを示し、医療専門のモデルが実用性と明快さの最も好ましいトレードオフを達成していることを示している。
これらの結果は、エージェントAIの価値が、計算と構造の選択的な外部化にかかっていることを示し、具体的な設計のトレードオフと学習の教訓を強調し、安全クリティカルな医療環境における説明可能なAIに広く適用できることを示唆している。
関連論文リスト
- Can Agents Distinguish Visually Hard-to-Separate Diseases in a Zero-Shot Setting? A Pilot Study [2.0401008936258527]
ゼロショット設定で視覚的に分離し難い疾患を区別し,臨床的に重要な設定について検討した。
我々は,(1)黒色腫と非定型ネバス,(2)肺浮腫と肺炎の2つの画像専用プロキシ診断タスクについて,代表薬をベンチマークした。
実験結果より, 診断成績は改善し(皮膚内視鏡検査データでは11ポイントの精度向上) , 定性的検体では支持率の低下が認められたが, 総合的な検査成績は, 臨床展開には不十分であった。
論文 参考訳(メタデータ) (2026-02-26T12:53:50Z) - AgentsEval: Clinically Faithful Evaluation of Medical Imaging Reports via Multi-Agent Reasoning [73.50200033931148]
本稿では,放射線科医の協調診断ワークフローをエミュレートしたマルチエージェントストリーム推論フレームワークであるAgensEvalを紹介する。
評価プロセスを基準定義、エビデンス抽出、アライメント、一貫性スコアなどの解釈可能なステップに分割することで、AgensEvalは明確な推論トレースと構造化された臨床フィードバックを提供する。
実験結果から,AgensEvalは,言い換え,意味的,スタイリスティックな摂動の下でも頑健な臨床的整合性,意味的忠実性,解釈可能な評価を提供することが示された。
論文 参考訳(メタデータ) (2026-01-23T11:59:13Z) - MMedExpert-R1: Strengthening Multimodal Medical Reasoning via Domain-Specific Adaptation and Clinical Guideline Reinforcement [63.82954136824963]
医療ビジョンランゲージモデルでは、現実世界のシナリオで必要とされる複雑な臨床推論を伴う知覚タスクが優れている。
本稿ではドメイン固有の適応とガイドライン強化を通じてこれらの課題に対処する新しい推論MedVLMを提案する。
論文 参考訳(メタデータ) (2026-01-16T02:32:07Z) - Benchmarking Egocentric Clinical Intent Understanding Capability for Medical Multimodal Large Language Models [48.95516224614331]
MedGaze-Benchは、臨床医の視線を認知的カーソルとして活用し、手術、緊急シミュレーション、診断解釈における意図的理解を評価する最初のベンチマークである。
本ベンチマークでは,解剖学的構造の視覚的均一性,臨床における時間・因果依存性の厳格化,安全プロトコルへの暗黙の順守という3つの基本的な課題に対処する。
論文 参考訳(メタデータ) (2026-01-11T02:20:40Z) - FT-ARM: Fine-Tuned Agentic Reflection Multimodal Language Model for Pressure Ulcer Severity Classification with Reasoning [2.4095540924689405]
圧力潰瘍(PUs)は重篤かつ一般的な医療上の問題である。
PU重症度(Stages I-IV)の正確な分類は適切な治療に不可欠である。
PU重度分類のためのエージェント自己回帰機構を備えた細調整多モード大言語モデル(MLLM)であるFT-ARMを提案する。
論文 参考訳(メタデータ) (2025-10-28T21:23:32Z) - MedAlign: A Synergistic Framework of Multimodal Preference Optimization and Federated Meta-Cognitive Reasoning [52.064286116035134]
我々はMed-VQA(Med-VQA)のための視覚的LVLM応答を保証するフレームワークであるMedAlignを開発した。
まず、優先学習を視覚的コンテキストに合わせるために、マルチモーダルな直接選好最適化(mDPO)の目的を提案する。
次に、画像とテキストの類似性を生かし、クエリを専門的でコンテキスト拡張されたLVLMにルーティングする検索型混合処理(RA-MoE)アーキテクチャを設計する。
論文 参考訳(メタデータ) (2025-10-24T02:11:05Z) - Automated Clinical Problem Detection from SOAP Notes using a Collaborative Multi-Agent LLM Architecture [8.072932739333309]
我々は,このギャップに対処するために,臨床相談チームをモデル化する共同マルチエージェントシステム(MAS)を導入する。
このシステムは、SOAPノートの主観的(S)および目的的(O)セクションのみを分析することによって、臨床上の問題を特定する。
マネージャエージェントは、階層的で反復的な議論に従事し、合意に達するために、動的に割り当てられた専門家エージェントのチームを編成する。
論文 参考訳(メタデータ) (2025-08-29T17:31:24Z) - Revisiting Rule-Based Stuttering Detection: A Comprehensive Analysis of Interpretable Models for Clinical Applications [5.692357910541593]
本稿では,ルールに基づく散乱検出システムについて包括的な解析を行う。
本稿では,発話速度正規化,マルチレベル音響特徴分析,階層的決定構造を組み込んだルールベースフレームワークを提案する。
規則に基づくシステムは特に延長検出(97~99%の精度)に優れ、様々な発話速度で安定した性能を提供することを示した。
論文 参考訳(メタデータ) (2025-08-21T15:01:05Z) - Uncertainty-Driven Expert Control: Enhancing the Reliability of Medical Vision-Language Models [52.2001050216955]
既存の方法は、モデル構造を調整したり、高品質なデータで微調整したり、好みの微調整によって、医療ビジョン言語モデル(MedVLM)の性能を向上させることを目的としている。
我々は,MedVLMと臨床専門知識の連携を図るために,Expert-Controlled-Free Guidance (Expert-CFG) という,ループ内のエキスパート・イン・ザ・ループフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-12T09:03:30Z) - Silence is Not Consensus: Disrupting Agreement Bias in Multi-Agent LLMs via Catfish Agent for Clinical Decision Making [80.94208848596215]
提案する概念は「Catfish Agent」である。これは、構造的不満を注入し、無声な合意に反するように設計された役割特化LDMである。
組織心理学において「ナマズ・エフェクト」にインスパイアされたカマズ・エージェントは、より深い推論を促進するために、新たなコンセンサスに挑戦するように設計されている。
論文 参考訳(メタデータ) (2025-05-27T17:59:50Z) - Towards Next-Generation Medical Agent: How o1 is Reshaping Decision-Making in Medical Scenarios [46.729092855387165]
本稿では,医療用AIエージェントのバックボーンLSMの選択について検討する。
我々の研究結果は、o1の診断精度と一貫性を高める能力を示し、よりスマートでより応答性の高いAIツールへの道を開いた。
論文 参考訳(メタデータ) (2024-11-16T18:19:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。