論文の概要: SpinalSAM-R1: A Vision-Language Multimodal Interactive System for Spine CT Segmentation
- arxiv url: http://arxiv.org/abs/2511.00095v1
- Date: Thu, 30 Oct 2025 10:14:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.582908
- Title: SpinalSAM-R1: A Vision-Language Multimodal Interactive System for Spine CT Segmentation
- Title(参考訳): SpinalSAM-R1: 脊椎CT分割のためのビジョンランゲージ多モード対話システム
- Authors: Jiaming Liu, Dingwei Fan, Junyong Zhao, Chunlin Li, Haipeng Si, Liang Sun,
- Abstract要約: 我々は、細調整されたSAMとDeepSeek-R1を統合した視覚言語対話システムSpinalSAM-R1を提案する。
具体的には,SpinalSAM-R1は解剖誘導型アテンション機構を導入し,スピンセグメンテーション性能を向上する。
このシステムは、94.3%のパース精度と800ms以下の応答時間を持つ11の臨床手術をサポートする。
- 参考スコア(独自算出の注目度): 14.699926241003395
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The anatomical structure segmentation of the spine and adjacent structures from computed tomography (CT) images is a key step for spinal disease diagnosis and treatment. However, the segmentation of CT images is impeded by low contrast and complex vertebral boundaries. Although advanced models such as the Segment Anything Model (SAM) have shown promise in various segmentation tasks, their performance in spinal CT imaging is limited by high annotation requirements and poor domain adaptability. To address these limitations, we propose SpinalSAM-R1, a multimodal vision-language interactive system that integrates a fine-tuned SAM with DeepSeek-R1, for spine CT image segmentation. Specifically, our SpinalSAM-R1 introduces an anatomy-guided attention mechanism to improve spine segmentation performance, and a semantics-driven interaction protocol powered by DeepSeek-R1, enabling natural language-guided refinement. The SpinalSAM-R1 is fine-tuned using Low-Rank Adaptation (LoRA) for efficient adaptation. We validate our SpinalSAM-R1 on the spine anatomical structure with CT images. Experimental results suggest that our method achieves superior segmentation performance. Meanwhile, we develop a PyQt5-based interactive software, which supports point, box, and text-based prompts. The system supports 11 clinical operations with 94.3\% parsing accuracy and sub-800 ms response times. The software is released on https://github.com/6jm233333/spinalsam-r1.
- Abstract(参考訳): 脊椎疾患の診断・治療において,CT画像からの脊椎と隣接構造の解剖学的構造区分が重要なステップである。
しかしCT画像のセグメンテーションは、低コントラストと複雑な脊椎の境界によって妨げられている。
SAM(Segment Anything Model)のような先進的なモデルは様々なセグメンテーションタスクにおいて有望であるが、脊椎CT画像におけるそれらの性能は高いアノテーション要求とドメイン適応性によって制限されている。
これらの制約に対処するため, スピンCT画像分割のための細調整SAMとDeepSeek-R1を統合したマルチモーダル視覚言語対話システムSpinalSAM-R1を提案する。
具体的には、スピン化セグメンテーション性能を改善するための解剖誘導アテンション機構と、DeepSeek-R1を利用したセマンティクス駆動インタラクションプロトコルを導入し、自然言語誘導の洗練を実現した。
SpinalSAM-R1はLow-Rank Adaptation (LoRA) を用いて精密に調整された。
CT画像による脊椎解剖学的構造に対するSpinalSAM-R1の有用性について検討した。
実験結果から,提案手法はより優れたセグメンテーション性能を実現することが示唆された。
一方、PyQt5ベースの対話型ソフトウェアを開発し、ポイント、ボックス、テキストベースのプロンプトをサポートする。
このシステムは、94.3\%のパース精度と800ms以下の応答時間を持つ11の臨床手術をサポートする。
このソフトウェアはhttps://github.com/6jm233333/spinalsam-r1でリリースされている。
関連論文リスト
- TotalSegmentator MRI: Robust Sequence-independent Segmentation of Multiple Anatomic Structures in MRI [59.86827659781022]
nnU-Netモデル(TotalSegmentator)をMRIおよび80原子構造で訓練した。
予測されたセグメンテーションと専門家基準セグメンテーションとの間には,ディススコアが算出され,モデル性能が評価された。
オープンソースで使いやすいモデルは、80構造の自動的で堅牢なセグメンテーションを可能にする。
論文 参考訳(メタデータ) (2024-05-29T20:15:54Z) - SymTC: A Symbiotic Transformer-CNN Net for Instance Segmentation of Lumbar Spine MRI [1.4249943098958722]
椎間板疾患 (intervertebral disc disease) は、しばしば間欠的または持続的な腰痛を引き起こす。
ディープニューラルネットワーク(DNN)モデルは、個々のインスタンスのより効率的なイメージセグメンテーションで臨床医を支援する。
本稿では,Transformer と CNN の強みを組み合わせた,革新的な腰椎MR画像分割モデルである SymTC を提案する。
論文 参考訳(メタデータ) (2024-01-17T22:34:20Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - MA-SAM: Modality-agnostic SAM Adaptation for 3D Medical Image
Segmentation [58.53672866662472]
我々はMA-SAMと命名されたモダリティに依存しないSAM適応フレームワークを提案する。
本手法は,重量増加のごく一部だけを更新するためのパラメータ効率の高い微調整戦略に根ざしている。
画像エンコーダのトランスバータブロックに一連の3Dアダプタを注入することにより,事前学習した2Dバックボーンが入力データから3次元情報を抽出することができる。
論文 参考訳(メタデータ) (2023-09-16T02:41:53Z) - 3DSAM-adapter: Holistic adaptation of SAM from 2D to 3D for promptable tumor segmentation [52.699139151447945]
医用画像の領域分割を行うために, SAMを2次元から3次元に変換する新しい適応法を提案する。
本モデルでは, 腎腫瘍, 膵腫瘍, 大腸癌の3つのタスクのうち8.25%, 29.87%, 10.11%の3つのタスクにおいて, ドメイン・オブ・ザ・アーティヴ・メディカル・イメージ・セグメンテーション・モデルより優れ, 肝腫瘍セグメンテーションでも同様の性能が得られる。
論文 参考訳(メタデータ) (2023-06-23T12:09:52Z) - Enabling Augmented Segmentation and Registration in Ultrasound-Guided
Spinal Surgery via Realistic Ultrasound Synthesis from Diagnostic CT Volume [19.177141722698188]
術中臨床USデータの不足は、ニューラルネットワークのトレーニングにおいて、克服不可能なボトルネックとなっている。
In silico bone US simulation framework that really US image from diagnosis CT volume。
脊椎超音波検査のための骨分割を高精度かつオンザフライで実現できる軽量な視覚変換器モデルを訓練する。
論文 参考訳(メタデータ) (2023-01-05T07:28:06Z) - Context-Aware Transformers For Spinal Cancer Detection and Radiological
Grading [70.04389979779195]
本稿では,脊椎分析に関わる医療画像問題に対するトランスフォーマーを用いた新しいモデルアーキテクチャを提案する。
MR画像におけるそのようなモデルの2つの応用について考察する: (a)脊椎転移の検出と脊椎骨折の関連状況と転移性脊髄圧迫。
画像中の脊椎のコンテキストを考慮することで,SCTは以前に公表したモデルと比較して,いくつかのグレーディングの精度を向上することを示す。
論文 参考訳(メタデータ) (2022-06-27T10:31:03Z) - SpineOne: A One-Stage Detection Framework for Degenerative Discs and
Vertebrae [54.751251046196494]
SpineOneと呼ばれる一段階検出フレームワークを提案し、MRIスライスから変性椎骨と椎骨を同時に局在化・分類する。
1)キーポイントの局所化と分類を促進するためのキーポイント・ヒートマップの新しい設計、2)ディスクと脊椎の表現をよりよく区別するためのアテンション・モジュールの使用、3)後期訓練段階における複数の学習目標を関連付けるための新しい勾配誘導客観的アソシエーション機構。
論文 参考訳(メタデータ) (2021-10-28T12:59:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。