論文の概要: MD-RWKV-UNet: Scale-Aware Anatomical Encoding with Cross-Stage Fusion for Multi-Organ Segmentation
- arxiv url: http://arxiv.org/abs/2603.27261v1
- Date: Sat, 28 Mar 2026 12:53:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.872419
- Title: MD-RWKV-UNet: Scale-Aware Anatomical Encoding with Cross-Stage Fusion for Multi-Organ Segmentation
- Title(参考訳): MD-RWKV-UNet:マルチオーガンセグメンテーションのためのクロスステージ融合によるスケールアウェアな解剖学的符号化
- Authors: Zhuoyi Fang,
- Abstract要約: MD-RWKV-UNetは,スケールアウェア表現と空間適応型コンテキストモデリングを実現する動的エンコーダネットワークである。
MD-RWKVブロックは、変形可能な空間シフトとReceptance Weighted Key Valueメカニズムを統合するデュアルパスモジュールである。
並行して、クロスステージなデュアルアテンション・フュージョン戦略はエンコーダ全体の多レベル特徴を集約し、セマンティック一貫性を保ちながら低レベル構造を保存する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-organ segmentation in medical imaging remains challenging due to large anatomical variability, complex inter-organ dependencies, and diverse organ scales and shapes. Conventional encoder-decoder architectures often struggle to capture both fine-grained local details and long-range context, which are crucial for accurate delineation - especially for small or deformable organs. To address these limitations, we propose MD-RWKV-UNet, a dynamic encoder network that enables scale-aware representation and spatially adaptive context modeling. At its core is the MD-RWKV block, a dual-path module that integrates deformable spatial shifts with the Receptance Weighted Key Value mechanism, allowing the receptive field to adapt dynamically to local structural cues. We further incorporate Selective Kernel Attention to enable adaptive selection of convolutional kernels with varying receptive fields, enhancing multi-scale interaction and improving robustness to organ size and shape variation. In parallel, a cross-stage dual-attention fusion strategy aggregates multi-level features across the encoder, preserving low-level structure while enhancing semantic consistency. Unlike methods that stack static convolutions or rely heavily on global attention, our approach provides a lightweight yet expressive solution for dynamic organ modeling. Experiments on Synapse and ACDC demonstrate state-of-the-art performance, particularly in boundary precision and small-organ segmentation.
- Abstract(参考訳): 医用画像における多臓器分割は、大きな解剖学的変動、複雑な組織間依存関係、多様な臓器のスケールと形状により、依然として困難である。
従来のエンコーダ・デコーダアーキテクチャは、細粒度の局所的な詳細と長距離のコンテキストの両方を捉えるのに苦労することが多い。
これらの制約に対処するため,MD-RWKV-UNetを提案する。
MD-RWKVブロック(MD-RWKV block)は、変形可能な空間シフトとReceptance Weighted Key Valueメカニズムを統合するデュアルパスモジュールである。
さらにSelective Kernel Attentionを導入し、様々な受容場を持つ畳み込みカーネルの適応的選択を可能にし、マルチスケールの相互作用を強化し、臓器の大きさや形状の変化に対する堅牢性を向上させる。
並行して、クロスステージなデュアルアテンション融合戦略がエンコーダ全体にわたって多レベル機能を集約し、セマンティック一貫性を保ちながら低レベル構造を保存する。
静的畳み込みを積み重ねたり、グローバルな注目に大きく依存する手法とは異なり、我々のアプローチは動的臓器モデリングのための軽量で表現力豊かなソリューションを提供する。
SynapseとACDCの実験は、特に境界精度と小組織セグメンテーションにおいて最先端の性能を示す。
関連論文リスト
- RDNet: Region Proportion-Aware Dynamic Adaptive Salient Object Detection Network in Optical Remote Sensing Images [78.19052099452695]
地域分布を考慮した動的適応型オブジェクト検出ネットワーク(RDNet)を提案する。
RDNetはグローバルコンテキストモデリングのためにCNNのバックボーンをSwinTransformerに置き換える。
スケールの変動や正確なローカライゼーションに対して堅牢性を実現し、最先端の手法と比較して優れた検出性能を提供する。
論文 参考訳(メタデータ) (2026-03-12T17:34:29Z) - GCA-ResUNet: Medical Image Segmentation Using Grouped Coordinate Attention [3.6679095759171645]
GCA-ResUNetは、軽量でプラグ&プレイのGrouped Coordinate Attention (GCA)モジュールを備えた効率的な医用画像セグメンテーションフレームワークである。
Synapse と ACDC の2つの広く使われているベンチマークによる大規模な実験では、それぞれ GCA-ResUNet が 86.11% と 92.64% のDice のスコアを達成している。
論文 参考訳(メタデータ) (2025-12-30T05:13:20Z) - TGC-Net: A Structure-Aware and Semantically-Aligned Framework for Text-Guided Medical Image Segmentation [56.09179939570486]
本稿では,パラメータ効率,タスク固有適応に着目したCLIPベースのフレームワークであるTGC-Netを提案する。
TGC-Netは、挑戦的なベンチマークで顕著なDiceゲインを含む、トレーニング可能なパラメータをかなり少なくして、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-12-24T12:06:26Z) - Decoding with Structured Awareness: Integrating Directional, Frequency-Spatial, and Structural Attention for Medical Image Segmentation [6.82200201381917]
本稿では,3つのコアモジュールからなる医用画像セグメンテーション用に設計された新しいデコーダフレームワークを提案する。
まず,アダプティブクロスフュージョン・アテンション(ACFA)モジュールは,チャネル機能強化と空間的アテンション機構を統合し,キー領域や構造方向に対する応答性を高める。
第2に、三重特徴融合注意(TFFA)モジュールは、空間、フーリエ、ウェーブレットの各領域の特徴を融合させ、エッジやテクスチャなどのローカル情報を保存しながら、結合周波数空間表現を実現する。
第3に、マルチスケールコンテキストと構造sを利用して、エンコーダとデコーダのスキップ接続を最適化する構造対応マルチスケールマスキングモジュール(SMMM)
論文 参考訳(メタデータ) (2025-12-05T07:39:14Z) - Unleashing Vision Foundation Models for Coronary Artery Segmentation: Parallel ViT-CNN Encoding and Variational Fusion [12.839049648094893]
冠動脈セグメンテーションは冠動脈疾患(CAD)のコンピュータ診断に重要である
並列符号化アーキテクチャを用いて,視覚基盤モデル(VFM)のパワーを利用する新しいフレームワークを提案する。
提案手法は, 精度の高い冠動脈セグメンテーションにおいて, 最先端の手法よりも優れ, 優れた性能を発揮する。
論文 参考訳(メタデータ) (2025-07-17T09:25:00Z) - MARL-MambaContour: Unleashing Multi-Agent Deep Reinforcement Learning for Active Contour Optimization in Medical Image Segmentation [5.389510984268956]
MARL(Multi-Agent Reinforcement Learning)に基づく最初の輪郭型医用画像分割フレームワークであるMARL-MambaContourを紹介する。
提案手法は,位相的に一貫したオブジェクトレベルの輪郭を生成することに焦点を当てたマルチエージェント協調タスクとしてセグメンテーションを再構成する。
5つの多様な医用画像データセットの実験は、MARL-MambaContourの最先端性能を示している。
論文 参考訳(メタデータ) (2025-06-23T14:22:49Z) - RWKV-UNet: Improving UNet with Long-Range Cooperation for Effective Medical Image Segmentation [70.79072961974141]
本稿では,RWKV構造をU-Netアーキテクチャに統合する新しいモデルであるRWKV-UNetを提案する。
この統合により、長い範囲の依存関係をキャプチャし、コンテキスト理解を改善するモデルの能力が向上する。
11のベンチマークデータセットの実験により、RWKV-UNetは様々なタイプの医用画像セグメンテーションタスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2025-01-14T22:03:00Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。