論文の概要: Unified Ultrasound Intelligence Toward an End-to-End Agentic System
- arxiv url: http://arxiv.org/abs/2604.16914v2
- Date: Wed, 22 Apr 2026 12:38:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.34564
- Title: Unified Ultrasound Intelligence Toward an End-to-End Agentic System
- Title(参考訳): エンドツーエンドエージェントシステムに向けた統一超音波インテリジェンス
- Authors: Chen Ma, Yunshu Li, Junhu Fu, Shuyu Liang, Yuanyuan Wang, Yi Guo,
- Abstract要約: USTriは、マルチオーガナイズド・マルチタスク分析のための三段階超音波インテリジェンスパイプラインである。
ステージ1は、異なるドメインで普遍的なジェネラリストUSGenを訓練し、広く、転送可能な事前学習を行う。
Stage IIはUSpecをビルドし、USGenを凍結し、微調整する。
ステージIIIでは、多段階の推論と構造化レポートのために臨床専門家を模倣するUSAgentが導入されている。
- 参考スコア(独自算出の注目度): 8.884663182013282
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clinical ultrasound analysis demands models that generalize across heterogeneous organs, views, and devices, while supporting interpretable workflow-level analysis. Existing methods often rely on task-wise adaptation, and joint learning may be unstable due to cross-task interference, making it hard to deliver workflow-level outputs in practice. To address these challenges, we present USTri, a tri-stage ultrasound intelligence pipeline for unified multi-organ, multi-task analysis. Stage I trains a universal generalist USGen on different domains to learn broad, transferable priors that are robust to device and protocol variability. To better handle domain shifts and reach task-aligned performance while preserving ultrasound shared knowledge, Stage II builds USpec by keeping USGen frozen and finetuning dataset-specific heads. Stage III introduces USAgent, which mimics clinician workflows by orchestrating USpec specialists for multi-step inference and deterministic structured reports. On the FMC\_UIA validation set, our model achieves the best overall performance across 4 task types and 27 datasets, outperforming state-of-the-art methods. Moreover, qualitative results show that USAgent produces clinically structured reports with high accuracy and interpretability. Our study suggests a scalable path to ultrasound intelligence that generalizes across heterogeneous ultrasound tasks and supports consistent end-to-end clinical workflows. The code is publicly available at: https://github.com/MacDunno/USTri.
- Abstract(参考訳): 臨床超音波分析は、解釈可能なワークフローレベル分析をサポートしながら、異種臓器、ビュー、デバイスにまたがって一般化するモデルを要求する。
既存の手法はしばしばタスクワイズ適応に依存しており、タスク間の干渉によって共同学習が不安定になり、実際にワークフローレベルのアウトプットを提供するのが難しくなる。
これらの課題に対処するため、USTriは、マルチオーガナイズド・マルチタスク分析のための三段階超音波インテリジェンスパイプラインである。
Stage Iは、さまざまなドメインで普遍的なジェネラリストUSGenをトレーニングし、デバイスやプロトコルの可変性に対して堅牢な、広く転送可能な事前学習を行う。
超音波を共有した知識を保存しながら、ドメインシフトの処理を改善し、タスク整合性に到達するために、Stage IIは、USGenを凍結し、データセット固有のヘッドを微調整することで、USpecを構築する。
ステージIIIでは、多段階推論と決定論的構造化レポートのためにUSpecスペシャリストを編成することで、臨床ワークフローを模倣するUSAgentを紹介している。
FMC\_UIA検証セットでは、4つのタスクタイプと27のデータセットで最高の全体的なパフォーマンスを実現し、最先端の手法よりも優れています。
さらに質的な結果から,USAgentは高い精度と解釈性で臨床的に構造化された報告を産み出すことが明らかとなった。
本研究は、異種超音波タスクをまたいで一般化し、一貫したエンドツーエンドの臨床ワークフローをサポートする、超音波インテリジェンスへのスケーラブルな経路を提案する。
コードは、https://github.com/MacDunno/USTri.comで公開されている。
関連論文リスト
- Agentic Large Language Models for Training-Free Neuro-Radiological Image Analysis [19.715805184063168]
Agentic AIは新しいソリューションを提供し、本質的な3D処理を必要としない。
自動脳MRI解析のための無トレーニングエージェントパイプラインを提案する。
この結果から,エージェントAIは,訓練や微調整を必要とせず,ツール使用による高次神経・放射線画像解析の課題を解決できることが示唆された。
論文 参考訳(メタデータ) (2026-04-17T22:04:16Z) - FetalAgents: A Multi-Agent System for Fetal Ultrasound Image and Video Analysis [25.102840990979985]
包括的胎児US分析のための最初のマルチエージェントシステムであるFetalAgentsを提案する。
軽量でエージェント的な調整フレームワークを通じて、FetalAgentsは専門の視覚専門家を動的に編成し、診断、測定、セグメンテーションのパフォーマンスを最大化する。
さらに、FetalAgentsは、エンドツーエンドのビデオストリームの要約をサポートすることで、静的画像解析を超えて前進する。
論文 参考訳(メタデータ) (2026-03-10T14:37:28Z) - Towards Better Ultrasound Video Segmentation Foundation Model: An Empirical study on SAM2 Finetuning from Data Perspective [0.7629717457706325]
超音波ビデオセグメンテーションにおけるSAM2適応について,データ中心による検討を行った。
トレーニングセットのサイズ、ビデオの長さ、拡張スキームが適応性能にどのように影響するかを分析する。
論文 参考訳(メタデータ) (2025-11-07T21:45:18Z) - A Fully Open and Generalizable Foundation Model for Ultrasound Clinical Applications [77.3888788549565]
一般臨床用超音波基礎モデルであるEchoCareについて紹介する。
我々は、キュレートされた、一般公開された大規模なデータセットであるEchoCareData上で、自己教師付き学習を通じてEchoCareを開発した。
最小限のトレーニングで、EchoCareは10の代表的なベンチマークで最先端の比較モデルを上回っている。
論文 参考訳(メタデータ) (2025-09-15T10:05:31Z) - MedSeqFT: Sequential Fine-tuning Foundation Models for 3D Medical Image Segmentation [55.37355146924576]
MedSeqFTは、医用画像解析のためのシーケンシャルな微調整フレームワークである。
事前訓練されたモデルを新しいタスクに適応させ、表現能力を改善する。
最先端の微調整戦略を一貫して上回ります。
論文 参考訳(メタデータ) (2025-09-07T15:22:53Z) - The Efficacy of Semantics-Preserving Transformations in Self-Supervised Learning for Medical Ultrasound [60.80780313225093]
本研究は, 肺超音波の自己教師あり学習におけるデータ拡張と前処理方略の影響を系統的に検討した。
画像領域に共通して使用されるベースラインパイプライン、超音波用に設計された新しいセマンティック保存パイプライン、両方のパイプラインから最も効果的な変換の蒸留セットの3つのデータ拡張パイプラインが評価された。
論文 参考訳(メタデータ) (2025-04-10T16:26:47Z) - Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである*
Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。
Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文 参考訳(メタデータ) (2023-10-28T12:08:03Z) - Learning Autonomous Ultrasound via Latent Task Representation and
Robotic Skills Adaptation [2.3830437836694185]
本稿では,自律型超音波の潜在タスク表現とロボットスキル適応を提案する。
オフラインの段階では、マルチモーダル超音波技術が統合され、低次元確率モデルにカプセル化される。
オンライン段階では、確率モデルは最適な予測を選択して評価する。
論文 参考訳(メタデータ) (2023-07-25T08:32:36Z) - Factored Attention and Embedding for Unstructured-view Topic-related
Ultrasound Report Generation [70.7778938191405]
本研究では,非構造的トピック関連超音波レポート生成のための新しい因子的注意・埋め込みモデル(FAE-Gen)を提案する。
提案したFAE-Genは主に2つのモジュール、すなわちビュー誘導因子の注意とトピック指向因子の埋め込みから構成されており、異なるビューで均質および不均一な形態的特徴を捉えている。
論文 参考訳(メタデータ) (2022-03-12T15:24:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。