論文の概要: Refining 3D Medical Segmentation with Verbal Instruction
- arxiv url: http://arxiv.org/abs/2603.14496v1
- Date: Sun, 15 Mar 2026 17:25:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.850432
- Title: Refining 3D Medical Segmentation with Verbal Instruction
- Title(参考訳): 言語指導による3次元医用セグメンテーションの精製
- Authors: Kangxian Xie, Jiancheng Yang, Nandor Pinter, Chao Wu, Behzad Bozorgtabar, Mingchen Gao,
- Abstract要約: 本稿では, 3次元形状をベクトル集合として表現し, 対象形状を段階的に更新する反復改良モデルを提案する。
実験結果から,提案手法は劣化した入力と競合するベースラインに対して,大幅な改善を達成できることが示唆された。
- 参考スコア(独自算出の注目度): 17.789951952699685
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Accurate 3D anatomical segmentation is essential for clinical diagnosis and surgical planning. However, automated models frequently generate suboptimal shape predictions due to factors such as limited and imbalanced training data, inadequate labeling quality, and distribution shifts between training and deployment settings. A natural solution is to iteratively refine the predicted shape based on the radiologists' verbal instructions. However, this is hindered by the scarcity of paired data that explicitly links erroneous shapes to corresponding corrective instructions. As an initial step toward addressing this limitation, we introduce CoWTalk, a benchmark comprising 3D arterial anatomies with controllable synthesized anatomical errors and their corresponding repairing instructions. Building on this benchmark, we further propose an iterative refinement model that represents 3D shapes as vector sets and interacts with textual instructions to progressively update the target shape. Experimental results demonstrate that our method achieves significant improvements over corrupted inputs and competitive baselines, highlighting the feasibility of language-driven clinician-in-the-loop refinement for 3D medical shapes modeling.
- Abstract(参考訳): 臨床診断と手術計画には正確な3D解剖学的区分が不可欠である。
しかしながら、自動モデルでは、制限されたトレーニングデータや不均衡なトレーニングデータ、ラベル付け品質の不十分、トレーニングとデプロイメント設定間の分散シフトなどの要因により、最適な形状予測を頻繁に生成する。
自然の解決策は、放射線学者の言葉による指示に基づいて予測された形状を反復的に洗練することである。
しかし、これは、誤った形状と対応する修正命令を明示的にリンクするペアデータの不足によって妨げられている。
この限界に対処するための最初のステップとして,制御可能な合成解剖学的エラーとそれに対応する修復手順を備えた3次元動脈解剖のベンチマークであるCoWTalkを紹介する。
このベンチマークに基づいて、3次元形状をベクトル集合として表現し、テキスト命令と相互作用して対象形状を段階的に更新する反復的改良モデルを提案する。
提案手法は, 3次元医用形状モデリングにおける言語駆動型クリニック・イン・ザ・ループリファインメントの実現可能性を強調し, 劣化した入力と競合するベースラインに対して, 大幅な改善を達成できることを実験的に示す。
関連論文リスト
- MedPruner: Training-Free Hierarchical Token Pruning for Efficient 3D Medical Image Understanding in Vision-Language Models [59.180043227905294]
MedPrunerは、3次元医用画像の効率的な理解のためのトレーニング不要でモデルに依存しない階層的トークンプレーニングフレームワークである。
我々は、MedPrunerによって、MedGemmaのようなモデルが元の性能を維持したり、超えたりすることが可能であり、ビジュアルトークンの5%以下を維持していることを示す。
論文 参考訳(メタデータ) (2026-03-12T07:37:00Z) - ClipGS: Clippable Gaussian Splatting for Interactive Cinematic Visualization of Volumetric Medical Data [51.095474325541794]
医用データのインタラクティブなシネマティック可視化のためのクリッピングプレーンを備えた革新的なガウススプレイティングフレームワークであるClipGSを紹介した。
本手法を5つのボリューム医療データで検証し,平均36.635 PSNRレンダリング品質を156 FPS,16.1MBモデルサイズで達成した。
論文 参考訳(メタデータ) (2025-07-09T08:24:28Z) - ReshapeIT: Reliable Shape Interaction with Implicit Template for Anatomical Structure Reconstruction [59.971808117043366]
ReShapeITは、同じカテゴリ内で共有される暗黙のテンプレートフィールドを持つ解剖学的構造を表す。
これにより、インスタンス形状とテンプレート形状との対応性の制約を強化することにより、暗黙テンプレートフィールドが有効なテンプレートを生成する。
テンプレートインタラクションモジュールは、有効なテンプレートシェイプとインスタンスワイドの潜在コードとを相互作用することで、目に見えないシェイプを再構築するために導入される。
論文 参考訳(メタデータ) (2023-12-11T07:09:32Z) - From Sparse to Precise: A Practical Editing Approach for Intracardiac
Echocardiography Segmentation [2.6910401398827117]
本研究では,2次元フレーム上にスクリブルを描画することでセグメンテーション出力を編集できるインタラクティブな編集フレームワークを提案する。
我々のフレームワークは、以前の編集を損なうことなく、逐次的にセグメント化出力に複数の編集を適用できる。
論文 参考訳(メタデータ) (2023-03-20T11:47:02Z) - 3D Vessel Segmentation with Limited Guidance of 2D Structure-agnostic
Vessel Annotations [3.6314292723682784]
教師付き深層学習は、自動3次元血管分割において優れた能力を示している。
高価な3Dマニュアルアノテーションへの依存とアノテーションの再利用能力の制限は、教師付きモデルの臨床応用を妨げる。
本稿では,公共の2次元血管アノテーションによる限られた誘導の下での3次元血管分割のための新しい3次元形状誘導型局所識別モデルを提案する。
論文 参考訳(メタデータ) (2023-02-07T07:26:00Z) - A Self-Supervised Deep Framework for Reference Bony Shape Estimation in
Orthognathic Surgical Planning [55.30223654196882]
仮想的な矯正手術計画では、3次元顔面骨形状モデルにおける顎変形の外科的修正をシミュレートする。
正常な解剖を表現した基準顔骨形状モデルは、計画精度を向上させるための客観的ガイダンスを提供することができる。
本稿では,顔面骨の形状モデルを自動的に推定する自己教師型ディープフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-11T05:24:40Z) - Self Context and Shape Prior for Sensorless Freehand 3D Ultrasound
Reconstruction [61.62191904755521]
3DフリーハンドUSは、幅広い範囲とフリーフォームスキャンを提供することで、この問題に対処することを約束している。
既存のディープラーニングベースの手法は、スキルシーケンスの基本ケースのみに焦点を当てている。
複雑なスキルシーケンスを考慮したセンサレスフリーハンドUS再構成手法を提案する。
論文 参考訳(メタデータ) (2021-07-31T16:06:50Z) - Interactive Radiotherapy Target Delineation with 3D-Fused Context
Propagation [28.97228589610255]
畳み込みニューラルネットワーク(CNN)は、自動3D医療セグメンテーションタスクで支配されています。
編集したスライスを3Dボリューム全体に伝搬する3D融合コンテキスト伝搬を提案する。
論文 参考訳(メタデータ) (2020-12-12T17:46:20Z) - Weakly-supervised Learning For Catheter Segmentation in 3D Frustum
Ultrasound [74.22397862400177]
超音波を用いた新しいカテーテルセグメンテーション法を提案する。
提案手法は,1ボリュームあたり0.25秒の効率で最先端の性能を実現した。
論文 参考訳(メタデータ) (2020-10-19T13:56:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。