論文の概要: CT-Flow: Orchestrating CT Interpretation Workflow with Model Context Protocol Servers
- arxiv url: http://arxiv.org/abs/2603.00123v1
- Date: Mon, 23 Feb 2026 07:19:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.036349
- Title: CT-Flow: Orchestrating CT Interpretation Workflow with Model Context Protocol Servers
- Title(参考訳): CT-Flow: モデルコンテキストプロトコルサーバによるCT解釈ワークフローのオーケストレーション
- Authors: Yannian Gu, Xizhuo Zhang, Linjie Mu, Yongrui Yu, Zhongzhen Huang, Shaoting Zhang, Xiaofan Zhang,
- Abstract要約: 既存の3次元CT解析のアプローチのほとんどは、静的なシングルパス推論に大きく依存している。
Model Context Protocol (MCP)を活用することで、CT-Flowはクローズドボックス推論からオープンなツール認識パラダイムへとシフトする。
これに基づいてCT-Flowは、複雑な自然言語クエリを自動ツール使用シーケンスに分解できる臨床オーケストレータとして機能する。
- 参考スコア(独自算出の注目度): 14.499713300688555
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in Large Vision-Language Models (LVLMs) have shown strong potential for multi-modal radiological reasoning, particularly in tasks like diagnostic visual question answering (VQA) and radiology report generation. However, most existing approaches for 3D CT analysis largely rely on static, single-pass inference. In practice, clinical interpretation is a dynamic, tool-mediated workflow where radiologists iteratively review slices and use measurement, radiomics, and segmentation tools to refine findings. To bridge this gap, we propose CT-Flow, an agentic framework designed for interoperable volumetric interpretation. By leveraging the Model Context Protocol (MCP), CT-Flow shifts from closed-box inference to an open, tool-aware paradigm. We curate CT-FlowBench, the first large-scale instruction-tuning benchmark tailored for 3D CT tool-use and multi-step reasoning. Built upon this, CT-Flow functions as a clinical orchestrator capable of decomposing complex natural language queries into automated tool-use sequences. Experimental evaluations on CT-FlowBench and standard 3D VQA datasets demonstrate that CT-Flow achieves state-of-the-art performance, surpassing baseline models by 41% in diagnostic accuracy and achieving a 95% success rate in autonomous tool invocation. This work provides a scalable foundation for integrating autonomous, agentic intelligence into real-world clinical radiology.
- Abstract(参考訳): LVLM(Large Vision-Language Models)の最近の進歩は、特に診断的視覚質問応答(VQA)や放射線学レポート生成といったタスクにおいて、マルチモーダルな放射線学的推論に強い可能性を示している。
しかし、既存の3次元CT解析のアプローチのほとんどは、静的なシングルパス推論に大きく依存している。
実際には、臨床解釈は、放射線学者がスライスを反復的にレビューし、測定、放射線学、およびセグメンテーションツールを使用して発見を洗練させる、動的でツールを介するワークフローである。
このギャップを埋めるために,相互運用可能なボリューム解釈のためのエージェントフレームワークであるCT-Flowを提案する。
Model Context Protocol (MCP)を活用することで、CT-Flowはクローズドボックス推論からオープンなツール認識パラダイムへとシフトする。
CT-FlowBenchは3次元CTツールの使用と多段階推論に適した,最初の大規模インストラクションチューニングベンチマークである。
これに基づいてCT-Flowは、複雑な自然言語クエリを自動ツール使用シーケンスに分解できる臨床オーケストレータとして機能する。
CT-FlowBenchと標準3D VQAデータセットの実験的評価は、CT-Flowが最先端のパフォーマンスを達成し、診断精度が41%以上、自律ツールの実行で95%の成功率を達成したことを示している。
この研究は、自律的なエージェントインテリジェンスを実際の臨床放射線学に統合するためのスケーラブルな基盤を提供する。
関連論文リスト
- 3DMedAgent: Unified Perception-to-Understanding for 3D Medical Analysis [42.29123264398027]
3DMedAgentは、2D MLLMが3D特有の微調整なしで一般的な3DCT分析を行うことを可能にする統合エージェントである。
40以上のタスクにわたる実験では、3DMedAgentは一般、医療、および3D固有のMLLMよりも一貫して優れていた。
論文 参考訳(メタデータ) (2026-02-20T08:31:26Z) - ProtoFlow: Interpretable and Robust Surgical Workflow Modeling with Learned Dynamic Scene Graph Prototypes [42.15644075070622]
ProtoFlowは、複雑な手術イベントをモデル化するための動的グラフプロトタイプを学ぶ新しいフレームワークである。
詳細なCAT-SGデータセットに対する我々のアプローチを評価する。
論文 参考訳(メタデータ) (2025-12-16T04:59:58Z) - CTFlow: Video-Inspired Latent Flow Matching for 3D CT Synthesis [7.57931364659531]
臨床報告に条件付き潜時流整合変圧器モデルであるCTFlowを紹介する。
FLUXのA-VAEを用いて潜伏空間を定義し,CT-Clipテキストエンコーダを用いて臨床報告を符号化する。
我々は,現状のCTモデルと比較し,時間的コヒーレンス,画像の多様性,テキスト画像のアライメントの観点から,我々のアプローチの優位性を実証した。
論文 参考訳(メタデータ) (2025-08-18T12:58:21Z) - Imitating Radiological Scrolling: A Global-Local Attention Model for 3D Chest CT Volumes Multi-Label Anomaly Classification [0.0]
3次元CTスキャンのマルチラベル分類は、データの体積特性と検出すべき異常の多様性のために難しい課題である。
畳み込みニューラルネットワーク(CNN)に基づく既存のディープラーニング手法は、長距離依存を効果的に捉えるのに苦労する。
我々は,3次元CTスキャン解析において,放射線技師のスクロール挙動をエミュレートする新しいグローバルアテンションモデルCT-Scrollを提案する。
論文 参考訳(メタデータ) (2025-03-26T15:47:50Z) - Interpretable Auto Window Setting for Deep-Learning-Based CT Analysis [0.9285295512807729]
CT (Computed Tomography) におけるウィンドウ設定は, 常にCT解析プロセスにおいて欠かせない部分であった。
本稿では,Tanhアクティベーション関数から派生したプラグイン・アンド・プレイモジュールを提案する。
提案手法の有効性を複数のオープンソースデータセットで検証し,ハードセグメントの目標に対して10%200%のDice改善を実現した。
論文 参考訳(メタデータ) (2025-01-07T08:15:03Z) - MvKeTR: Chest CT Report Generation with Multi-View Perception and Knowledge Enhancement [1.6355783973385114]
多視点認識知識強化型TansfoRmer(MvKeTR)
複数の解剖学的ビューから診断情報を効果的に合成するために、ビューアウェアのMVPAを提案する。
クエリボリュームに基づいて、最も類似したレポートを取得するために、Cross-Modal Knowledge Enhancer (CMKE) が考案されている。
論文 参考訳(メタデータ) (2024-11-27T12:58:23Z) - 3D-CT-GPT: Generating 3D Radiology Reports through Integration of Large Vision-Language Models [51.855377054763345]
本稿では,VQAに基づく医用視覚言語モデルである3D-CT-GPTについて紹介する。
パブリックデータセットとプライベートデータセットの両方の実験により、3D-CT-GPTはレポートの正確さと品質という点で既存の手法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2024-09-28T12:31:07Z) - Enhancing Weakly Supervised 3D Medical Image Segmentation through Probabilistic-aware Learning [47.700298779672366]
3次元医用画像のセグメンテーションは、疾患の診断と治療計画に重要な意味を持つ課題である。
近年の深層学習の進歩は、完全に教師付き医療画像のセグメンテーションを著しく強化している。
本稿では,3次元医用画像に特化して設計された,確率的適応型弱教師付き学習パイプラインを提案する。
論文 参考訳(メタデータ) (2024-03-05T00:46:53Z) - AutoCT: Automated CT registration, segmentation, and quantification [0.5461938536945721]
本稿では, エンドツーエンドの自動前処理, 登録, セグメンテーション, 3次元CTスキャンの定量的解析を統合した包括的パイプラインを提案する。
エンジニアリングされたパイプラインは、アトラスベースのCTセグメンテーションと定量化を可能にする。
軽量でポータブルなソフトウェアプラットフォーム上で、AutoCTは、人工知能駆動アプリケーションのデプロイを支えるために、CTイメージングコミュニティのための新しいツールキットを提供する。
論文 参考訳(メタデータ) (2023-10-26T21:09:47Z) - Hepatic vessel segmentation based on 3Dswin-transformer with inductive
biased multi-head self-attention [46.46365941681487]
Indu BIased Multi-Head Attention Vessel Net という,堅牢なエンドツーエンドのコンテナセグメンテーションネットワークを提案する。
正確な肝血管のボクセルを見つけるために,パッチワイド埋め込みよりもボクセルワイド埋め込みを導入する。
一方,絶対位置埋め込みから帰納的バイアス付き相対的位置埋め込みを学習する帰納的バイアス付きマルチヘッド自己アテンションを提案する。
論文 参考訳(メタデータ) (2021-11-05T10:17:08Z) - Fed-Sim: Federated Simulation for Medical Imaging [131.56325440976207]
本稿では、2つの学習可能なニューラルモジュールからなる物理駆動型生成手法を提案する。
データ合成フレームワークは、複数のデータセットの下流セグメンテーション性能を改善する。
論文 参考訳(メタデータ) (2020-09-01T19:17:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。