論文の概要: A Lightweight Multi-Scale Attention Framework for Real-Time Spinal Endoscopic Instance Segmentation
- arxiv url: http://arxiv.org/abs/2512.21984v1
- Date: Fri, 26 Dec 2025 11:07:06 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-29 11:59:51.738266
- Title: A Lightweight Multi-Scale Attention Framework for Real-Time Spinal Endoscopic Instance Segmentation
- Title(参考訳): リアルタイム脊柱管内腔分割のための軽量マルチスケール注意フレームワーク
- Authors: Qi Lai, JunYan Li, Qiang Cai, Lei Wang, Tao Yan, XiaoKun Liang,
- Abstract要約: 脊椎内視鏡のリアルタイム・インスタンス・セグメンテーションは,術中における重要な解剖の同定と保護に重要である。
展開は限られた外科的ハードウェアによって制限されるため、モデルは精度と速度のバランスをとる必要がある。
本稿では,バックボーン,ネック,ヘッドにまたがる軽量マルチスケールアテンションフレームワークLMSF-Aを提案する。
- 参考スコア(独自算出の注目度): 12.339584352306025
- License:
- Abstract: Real-time instance segmentation for spinal endoscopy is important for identifying and protecting critical anatomy during surgery, but it is difficult because of the narrow field of view, specular highlights, smoke/bleeding, unclear boundaries, and large scale changes. Deployment is also constrained by limited surgical hardware, so the model must balance accuracy and speed and remain stable under small-batch (even batch-1) training. We propose LMSF-A, a lightweight multi-scale attention framework co-designed across backbone, neck, and head. The backbone uses a C2f-Pro module that combines RepViT-style re-parameterized convolution (RVB) with efficient multi-scale attention (EMA), enabling multi-branch training while collapsing into a single fast path for inference. The neck improves cross-scale consistency and boundary detail using Scale-Sequence Feature Fusion (SSFF) and Triple Feature Encoding (TFE), which strengthens high-resolution features. The head adopts a Lightweight Multi-task Shared Head (LMSH) with shared convolutions and GroupNorm to reduce parameters and support batch-1 stability. We also release the clinically reviewed PELD dataset (61 patients, 610 images) with instance masks for adipose tissue, bone, ligamentum flavum, and nerve. Experiments show that LMSF-A is highly competitive (or even better than) in all evaluation metrics and much lighter than most instance segmentation methods requiring only 1.8M parameters and 8.8 GFLOPs, and it generalizes well to a public teeth benchmark. Code and dataset: https://github.com/hhwmortal/PELD-Instance-segmentation.
- Abstract(参考訳): 脊椎内視鏡のリアルタイム・インスタンス・セグメンテーションは、手術中の重要な解剖学の特定と保護に重要であるが、視野の狭さ、特異なハイライト、喫煙・出血、境界の曖昧さ、大規模な変化のために困難である。
展開は限られた外科的ハードウェアによって制限されるため、モデルは精度と速度のバランスを保ち、小さなバッチ(バッチ1でも)のトレーニングで安定しなければなりません。
本稿では,バックボーン,ネック,ヘッドにまたがる軽量マルチスケールアテンションフレームワークLMSF-Aを提案する。
バックボーンは、RepViTスタイルの再パラメータ化畳み込み(RVB)と効率的なマルチスケールアテンション(EMA)を組み合わせたC2f-Proモジュールを使用し、推論のために単一の高速パスに折り畳みながらマルチブランチトレーニングを可能にする。
このネックは、スケールシーケンス・フィーチャー・フュージョン(SSFF)とトリプル・フィーチャー・エンコーディング(TFE)を使用して、高解像度機能を強化して、スケールの一貫性とバウンダリの詳細を改善する。
ヘッドは、共有畳み込みを備えた軽量マルチタスク共有ヘッド(LMSH)を採用し、GroupNormはパラメータを削減し、バッチ1の安定性をサポートする。
また, 臨床検査を行ったPELDデータセット(61例, 610画像)を, 脂肪組織, 骨, 靭帯, 神経に対するマスクとしてリリースした。
実験の結果、LMSF-Aはすべての評価指標において非常に競争力があり、1.8Mパラメータと8.8GFLOPしか必要としないほとんどの例よりもはるかに軽いことが示され、公的な歯のベンチマークによく当てはまる。
コードとデータセット: https://github.com/hhwmortal/PELD-Instance-segmentation
関連論文リスト
- VesSAM: Efficient Multi-Prompting for Segmenting Complex Vessel [68.24765319399286]
本稿では,2次元血管セグメンテーションに適した,強力で効率的なフレームワークであるVesSAMを提案する。
VesSAMは、(1)局所的なテクスチャ機能を強化する畳み込みアダプタ、(2)解剖学的プロンプトを融合するマルチプロンプトエンコーダ、(3)ジャグアーティファクトを減らす軽量マスクデコーダを統合する。
VesSAMは、最先端のPEFTベースのSAMを10%以上のDiceと13%のIoUで一貫して上回っている。
論文 参考訳(メタデータ) (2025-11-02T15:47:05Z) - BALR-SAM: Boundary-Aware Low-Rank Adaptation of SAM for Resource-Efficient Medical Image Segmentation [11.634558989215392]
Segment Anything Model (SAM)のようなビジョン基盤モデルは、ドメイン固有の適応が欠如しているため、しばしば医療画像のセグメンテーションに苦労する。
医療画像のSAMを強化する境界対応低ランク適応フレームワークであるBALR-SAMを提案する。
2) SAMのVision Transformerブロックに組み込まれた低ランクのアダプタは、医学的コンテキストにおける特徴表現と注意を最適化し、同時にパラメータ空間を著しく削減する。
論文 参考訳(メタデータ) (2025-09-29T02:36:09Z) - Revisiting Data Challenges of Computational Pathology: A Pack-based Multiple Instance Learning Framework [47.035885218675126]
コンピュータ病理学(CPath)は、病理スライドを全スライド画像(WSI)にデジタル化する
WSIは、非常に長いシーケンス長(最大200K)、相当な長さのバリエーション(200Kから200K)、限られた監督を持っている。
これらの課題に対処するためのパックベースのMILフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-25T09:05:40Z) - Simple is what you need for efficient and accurate medical image segmentation [7.2109224546543675]
本稿では,スケーラブルな超軽量医用画像分割モデルSimpleUNetを提案する。
記録破りの16KBパラメータ設定により、SimpleUNetはLBUNetや他の軽量ベンチマークを上回っている。
0.67MBの派生型は、より優れた効率(8.60 GFLOPs)と精度を実現し、マルチセンターの乳房病変のデータセットの平均DSC/IoUは85.76%/75.60%に達した。
論文 参考訳(メタデータ) (2025-06-16T12:31:48Z) - ASPS: Augmented Segment Anything Model for Polyp Segmentation [77.25557224490075]
SAM(Segment Anything Model)は、ポリープセグメンテーションに先例のないポテンシャルを導入している。
SAMのTransformerベースの構造は、グローバルおよび低周波情報を優先する。
CFAはトレーニング可能なCNNエンコーダブランチと凍結したViTエンコーダを統合し、ドメイン固有の知識の統合を可能にする。
論文 参考訳(メタデータ) (2024-06-30T14:55:32Z) - PMFSNet: Polarized Multi-scale Feature Self-attention Network For
Lightweight Medical Image Segmentation [6.134314911212846]
現在の最先端の医用画像分割法は精度を優先するが、計算要求の増大とより大きなモデルサイズを犠牲にすることも多い。
計算冗長性を避けつつグローバルな局所特徴処理のバランスをとる新しい医用画像分割モデルPMFSNetを提案する。
長期依存関係をキャプチャするために,アテンション機構に基づいたマルチスケール機能拡張モジュールであるPMFSブロックをプラグインとして組み込んでいる。
論文 参考訳(メタデータ) (2024-01-15T10:26:47Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - MS Lesion Segmentation: Revisiting Weighting Mechanisms for Federated
Learning [92.91544082745196]
フェデレートラーニング(FL)は医用画像解析に広く用いられている。
FLのパフォーマンスは、多発性硬化症(MS)病変セグメンテーションタスクに制限される。
2つの効果的な再重み付け機構によるFLMS病変分割フレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-03T14:06:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。