論文の概要: RWKV-UNet: Improving UNet with Long-Range Cooperation for Effective Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2501.08458v3
- Date: Mon, 27 Oct 2025 16:55:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:14.289672
- Title: RWKV-UNet: Improving UNet with Long-Range Cooperation for Effective Medical Image Segmentation
- Title(参考訳): RWKV-UNet:効果的な医用画像分割のための長距離協調によるUNetの改善
- Authors: Juntao Jiang, Jiangning Zhang, Weixuan Liu, Muxuan Gao, Xiaobin Hu, Zhucun Xue, Yong Liu, Shuicheng Yan,
- Abstract要約: 本稿では,RWKV構造をU-Netアーキテクチャに統合する新しいモデルであるRWKV-UNetを提案する。
この統合により、長い範囲の依存関係をキャプチャし、コンテキスト理解を改善するモデルの能力が向上する。
11のベンチマークデータセットの実験により、RWKV-UNetは様々なタイプの医用画像セグメンテーションタスクで最先端のパフォーマンスを達成することが示された。
- 参考スコア(独自算出の注目度): 70.79072961974141
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In recent years, significant advancements have been made in deep learning for medical image segmentation, particularly with convolutional neural networks (CNNs) and transformer models. However, CNNs face limitations in capturing long-range dependencies, while transformers suffer from high computational complexity. To address this, we propose RWKV-UNet, a novel model that integrates the RWKV (Receptance Weighted Key Value) structure into the U-Net architecture. This integration enhances the model's ability to capture long-range dependencies and to improve contextual understanding, which is crucial for accurate medical image segmentation. We build a strong encoder with developed Global-Local Spatial Perception (GLSP) blocks combining CNNs and RWKVs. We also propose a Cross-Channel Mix (CCM) module to improve skip connections with multi-scale feature fusion, achieving global channel information integration. Experiments on 11 benchmark datasets show that the RWKV-UNet achieves state-of-the-art performance on various types of medical image segmentation tasks. Additionally, smaller variants, RWKV-UNet-S and RWKV-UNet-T, balance accuracy and computational efficiency, making them suitable for broader clinical applications.
- Abstract(参考訳): 近年、医用画像分割のためのディープラーニング、特に畳み込みニューラルネットワーク(CNN)やトランスフォーマーモデルにおいて、大きな進歩がなされている。
しかし、CNNは長距離依存関係をキャプチャする際の制限に直面し、トランスフォーマーは高い計算複雑性に悩まされる。
そこで本研究では,RWKV(Receptance Weighted Key Value)構造をU-Netアーキテクチャに統合した新しいモデルであるRWKV-UNetを提案する。
この統合により、長い範囲の依存関係をキャプチャし、正確な医用画像のセグメンテーションに欠かせないコンテキスト理解を改善することができる。
我々は、CNNとRWKVを組み合わせたGLSP(Global-Local Spatial Perception)ブロックを用いた強力なエンコーダを構築する。
また,マルチスケール機能融合によるスキップ接続を改善し,グローバルチャネル情報統合を実現するために,クロスチャネルミックス(CCM)モジュールを提案する。
11のベンチマークデータセットの実験により、RWKV-UNetは様々なタイプの医用画像セグメンテーションタスクで最先端のパフォーマンスを達成することが示された。
さらに、より小型のRWKV-UNet-SとRWKV-UNet-Tでは、バランスの正確さと計算効率が向上し、より広範な臨床応用に適している。
関連論文リスト
- U-RWKV: Lightweight medical image segmentation with direction-adaptive RWKV [13.528706926224114]
我々は,O(N)計算コストで効率的な長距離モデリングを行うための新しいフレームワークであるU-RWKVを提案する。
このフレームワークには、Direction-Adaptive RWKV ModuleとStage-Adaptive Squeeze-and-Excitation Moduleという2つの重要なイノベーションが導入されている。
U-RWKVは高い計算効率で最先端のセグメンテーション性能を実現する。
論文 参考訳(メタデータ) (2025-07-15T15:40:17Z) - Med-URWKV: Pure RWKV With ImageNet Pre-training For Medical Image Segmentation [0.0]
医用画像のセグメンテーションは、コンピュータ支援診断と治療における基礎的かつ重要な技術である。
本稿では,U-Netフレームワーク上に構築された純粋なRWKVベースのアーキテクチャであるMed-URWKVを提案する。
Med-URWKVは、スクラッチから訓練された他の慎重に最適化されたRWKVモデルと比較して、同等またはそれ以上のセグメンテーション性能が得られることを示す。
論文 参考訳(メタデータ) (2025-06-12T16:19:18Z) - Exploring Real&Synthetic Dataset and Linear Attention in Image Restoration [47.26304397935705]
画像復元は、劣化した入力から高品質な画像を復元することを目的としている。
既存のメソッドにはイテレーションと設定のための統一的なトレーニングベンチマークがない。
本稿では,画像複雑性に基づいた新しい画像フィルタリング手法であるReSynという大規模IRデータセットを提案する。
論文 参考訳(メタデータ) (2024-12-05T02:11:51Z) - TBConvL-Net: A Hybrid Deep Learning Architecture for Robust Medical Image Segmentation [6.013821375459473]
医用画像セグメンテーションのための新しいディープラーニングアーキテクチャを提案する。
提案モデルでは,10の公開データセット上でのテクニックの現状に対して,一貫した改善が示されている。
論文 参考訳(メタデータ) (2024-09-05T09:14:03Z) - CSWin-UNet: Transformer UNet with Cross-Shaped Windows for Medical Image Segmentation [22.645013853519]
CSWin-UNetは,CSWinの自己保持機構をUNetに組み込んだ,U字型のセグメンテーション手法である。
シナプス多臓器CT, 心臓MRI, 皮膚病変など多種多様なデータセットに対する経験的評価は, CSWin-UNetは高いセグメンテーション精度を達成しつつ, 低モデルの複雑さを維持していることを示している。
論文 参考訳(メタデータ) (2024-07-25T14:25:17Z) - Restore-RWKV: Efficient and Effective Medical Image Restoration with RWKV [15.585071228529731]
医用画像修復のための最初のRWKVモデルであるRestore-RWKVを提案する。
本稿では,線形計算複雑性を伴う大域的依存関係を捕捉する再帰的WKV(Re-WKV)アテンション機構を提案する。
実験の結果,Restore-RWKV は様々な医療画像復元作業において SOTA の性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-07-14T12:22:05Z) - Vision-RWKV: Efficient and Scalable Visual Perception with RWKV-Like
Architectures [99.20299078655376]
本稿では、NLPフィールドで使用されるRWKVモデルから適応したVision-RWKVを紹介する。
我々のモデルは、スパース入力を効率的に処理し、ロバストなグローバル処理能力を実証するために設計されている。
評価の結果,VRWKVは画像分類におけるViTの性能を超え,高速化とメモリ使用量の削減を図っている。
論文 参考訳(メタデータ) (2024-03-04T18:46:20Z) - Transformer-CNN Fused Architecture for Enhanced Skin Lesion Segmentation [0.0]
畳み込みニューラルネットワーク(CNN)は、非常に高度な医療画像セグメンテーションを持つ。
CNNは、長距離依存関係の学習とグローバルコンテキストの取得に苦労している。
我々は、トランスフォーマーがグローバルな依存関係をキャプチャする能力と、CNNが低レベル空間の詳細をキャプチャする能力を組み合わせたハイブリッドアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-01-10T18:36:14Z) - BRAU-Net++: U-Shaped Hybrid CNN-Transformer Network for Medical Image Segmentation [11.986549780782724]
医用画像の正確な分割作業のために,BRAU-Net++ というハイブリッドで効果的な CNN-Transformer ネットワークを提案する。
具体的には、BRAU-Net++は、U字型エンコーダデコーダ構造を設計するために、コアビルディングブロックとしてバイレベルルーティングアテンションを使用する。
提案手法は,そのベースラインであるBRAU-Netを含む,最先端の手法を超越した手法である。
論文 参考訳(メタデータ) (2024-01-01T10:49:09Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image
Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。
本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T13:34:22Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。