論文の概要: Echo-CoPilot: A Multi-View, Multi-Task Agent for Echocardiography Interpretation and Reporting
- arxiv url: http://arxiv.org/abs/2512.09944v1
- Date: Sat, 06 Dec 2025 23:27:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:41.979381
- Title: Echo-CoPilot: A Multi-View, Multi-Task Agent for Echocardiography Interpretation and Reporting
- Title(参考訳): Echo-CoPilot: 心エコー図読影・報告のためのマルチビューマルチタスクエージェント
- Authors: Moein Heidari, Mohammad Amin Roohi, Armin Khosravi, Ilker Hacihaliloglu,
- Abstract要約: 本稿では,多視点マルチタスクエージェントであるEcho-CoPilotを紹介する。
ReActスタイルのループ内で、エージェントは臨床クエリを分解し、ビュー認識、心臓構造セグメンテーション、測定と疾患予測、およびレポート合成のためのツールを起動する。
公開MIMIC-EchoQAベンチマークでEcho-CoPilotを評価し、50.8%の精度で、汎用的およびバイオメディカルなビデオビジョン言語モデルよりも優れています。
- 参考スコア(独自算出の注目度): 8.162197738994479
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Echocardiography is central to contemporary cardiovascular care, but full-study interpretation remains a cognitively demanding, multi-view task that is still performed manually. While recent foundation models for echocardiography can achieve strong performance on individual perceptual subtasks such as view classification, segmentation, or disease prediction, they typically operate in isolation and do not provide a unified, clinically coherent assessment. In this work, we introduce Echo-CoPilot, a multi-view, multi-task agent that uses a large language model to orchestrate a suite of specialized echocardiography tools. Within a ReAct-style loop, the agent decomposes clinician queries, invokes tools for view recognition, cardiac structure segmentation, measurement and disease prediction, and report synthesis, and integrates their outputs into guideline-aware answers and narrative summaries. We evaluate Echo-CoPilot on the public MIMIC-EchoQA benchmark, where it achieves an accuracy of 50.8\%, outperforming both general-purpose and biomedical video vision-language models. Qualitative analyses further show that the agent leverages quantitative measurements and physiologic context to resolve challenging cases near clinical decision thresholds, such as borderline left ventricular hypertrophy or pericardial effusion severity. The code will be released upon acceptance of the paper.
- Abstract(参考訳): エコー心エコー法は、現代の心臓血管ケアの中心であるが、フルスタディな解釈は、まだ手作業で行われている認知的に要求されるマルチビューの課題である。
近年の心エコー法の基礎モデルは、ビュー分類、セグメンテーション、または疾患予測などの個々の知覚サブタスクにおいて高いパフォーマンスを達成することができるが、通常は単独で動作し、統一的で臨床的に一貫性のある評価を提供しない。
本研究では,多視点マルチタスクエージェントであるEcho-CoPilotを紹介する。
ReActスタイルのループ内で、エージェントは臨床クエリを分解し、ビュー認識、心臓構造セグメンテーション、測定と疾患予測、レポート合成のためのツールを起動し、アウトプットをガイドライン対応の回答と物語要約に統合する。
一般のMIMIC-EchoQAベンチマークでEcho-CoPilotを評価し,その精度は50.8\%であり,汎用的およびバイオメディカルなビデオビジョン言語モデルよりも優れていた。
定性的分析により, 境界心室肥大や心膜灌流重症度などの臨床的決定しきい値付近の課題を解決するために, 定量的な測定値と生理的文脈を利用することが明らかとなった。
コードは論文の受理時に公開される。
関連論文リスト
- CardioBench: Do Echocardiography Foundation Models Generalize Beyond the Lab? [4.445909648625997]
ファンデーションモデル(FM)は医療画像の再構成を行っているが、そのエコー心エコー法への応用は限られている。
心エコー検査のための総合的ベンチマークであるCardioBenchを紹介する。
CardioBenchは8つの公開データセットを4つの回帰と5つの分類タスクにまたがる標準化されたスイートに統合する。
論文 参考訳(メタデータ) (2025-10-01T05:09:48Z) - Heartcare Suite: Multi-dimensional Understanding of ECG with Raw Multi-lead Signal Modeling [50.58126509704037]
医療スイート(Heartcare Suite)は、微細心電図(ECG)の理解のためのフレームワークである。
Heartcare-220Kは高品質で構造化され、包括的なマルチモーダルECGデータセットである。
Heartcare-Benchは、ECGシナリオにおける医療マルチモーダル大言語モデル(Med-MLLM)の最適化を導くためのベンチマークである。
論文 参考訳(メタデータ) (2025-06-06T07:56:41Z) - EchoApex: A General-Purpose Vision Foundation Model for Echocardiography [9.202542805578432]
本稿では,初の汎用視覚基礎モデルであるEchoApexを紹介し,様々な臨床応用について紹介する。
自己教師付き学習を活用して、EchoApexは11の臨床センターから2000万以上のエコー画像に事前訓練されている。
最先端のタスク固有のモデルと比較すると、EchoApexは統一されたイメージエンコーディングアーキテクチャでパフォーマンスが改善されている。
論文 参考訳(メタデータ) (2024-10-14T21:10:56Z) - Improving Out-of-Distribution Detection in Echocardiographic View
Classication through Enhancing Semantic Features [1.9892308483583199]
心エコー画像における意味的特徴表現を強化するために,ラベルスムーシングを用いた新しい手法を提案する。
ラベルの平滑化とMDベースのOOD検出を組み合わせることで,心エコーによるOOD検出の精度向上のための新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2023-08-31T06:44:42Z) - Factored Attention and Embedding for Unstructured-view Topic-related
Ultrasound Report Generation [70.7778938191405]
本研究では,非構造的トピック関連超音波レポート生成のための新しい因子的注意・埋め込みモデル(FAE-Gen)を提案する。
提案したFAE-Genは主に2つのモジュール、すなわちビュー誘導因子の注意とトピック指向因子の埋め込みから構成されており、異なるビューで均質および不均一な形態的特徴を捉えている。
論文 参考訳(メタデータ) (2022-03-12T15:24:03Z) - MyoPS: A Benchmark of Myocardial Pathology Segmentation Combining
Three-Sequence Cardiac Magnetic Resonance Images [84.02849948202116]
本研究は,MyoPS(MyoPS)の医療画像解析における新たな課題を定義するものである。
myoPSは、MICCAI 2020とともにMyoPSチャレンジで最初に提案された3シーケンスの心臓磁気共鳴(CMR)画像を組み合わせている。
この課題は45対のCMR画像と予め整列されたCMR画像を提供し、アルゴリズムは3つのCMRシーケンスから補完的な情報を結合して病理領域を分割することを可能にする。
論文 参考訳(メタデータ) (2022-01-10T06:37:23Z) - Generalized Organ Segmentation by Imitating One-shot Reasoning using
Anatomical Correlation [55.1248480381153]
そこで我々は,アノテーション付きオルガンクラスから一般化されたオルガン概念を学習し,その概念を未知のクラスに転送するOrganNetを提案する。
そこで,OrganNetは臓器形態の幅広い変化に効果的に抵抗でき,一発分節タスクで最先端の結果が得られることを示す。
論文 参考訳(メタデータ) (2021-03-30T13:41:12Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。