論文の概要: Med-URWKV: Pure RWKV With ImageNet Pre-training For Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2506.10858v1
- Date: Thu, 12 Jun 2025 16:19:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 15:37:22.833167
- Title: Med-URWKV: Pure RWKV With ImageNet Pre-training For Medical Image Segmentation
- Title(参考訳): Med-URWKV: 医用画像セグメンテーションのためのImageNetプレトレーニング付き純RWKV
- Authors: Zhenhuan Zhou,
- Abstract要約: 医用画像のセグメンテーションは、コンピュータ支援診断と治療における基礎的かつ重要な技術である。
本稿では,U-Netフレームワーク上に構築された純粋なRWKVベースのアーキテクチャであるMed-URWKVを提案する。
Med-URWKVは、スクラッチから訓練された他の慎重に最適化されたRWKVモデルと比較して、同等またはそれ以上のセグメンテーション性能が得られることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Medical image segmentation is a fundamental and key technology in computer-aided diagnosis and treatment. Previous methods can be broadly classified into three categories: convolutional neural network (CNN) based, Transformer based, and hybrid architectures that combine both. However, each of them has its own limitations, such as restricted receptive fields in CNNs or the computational overhead caused by the quadratic complexity of Transformers. Recently, the Receptance Weighted Key Value (RWKV) model has emerged as a promising alternative for various vision tasks, offering strong long-range modeling capabilities with linear computational complexity. Some studies have also adapted RWKV to medical image segmentation tasks, achieving competitive performance. However, most of these studies focus on modifications to the Vision-RWKV (VRWKV) mechanism and train models from scratch, without exploring the potential advantages of leveraging pre-trained VRWKV models for medical image segmentation tasks. In this paper, we propose Med-URWKV, a pure RWKV-based architecture built upon the U-Net framework, which incorporates ImageNet-based pretraining to further explore the potential of RWKV in medical image segmentation tasks. To the best of our knowledge, Med-URWKV is the first pure RWKV segmentation model in the medical field that can directly reuse a large-scale pre-trained VRWKV encoder. Experimental results on seven datasets demonstrate that Med-URWKV achieves comparable or even superior segmentation performance compared to other carefully optimized RWKV models trained from scratch. This validates the effectiveness of using a pretrained VRWKV encoder in enhancing model performance. The codes will be released.
- Abstract(参考訳): 医用画像のセグメンテーションは、コンピュータ支援診断と治療における基礎的かつ重要な技術である。
従来の手法は、畳み込みニューラルネットワーク(CNN)ベース、トランスフォーマーベース、両方を組み合わせたハイブリッドアーキテクチャの3つのカテゴリに分類される。
しかし、CNNの制限された受容場やトランスフォーマーの二次的複雑さに起因する計算オーバーヘッドなど、それぞれ独自の制限がある。
近年、Receptance Weighted Key Value (RWKV) モデルが様々な視覚タスクの代替として登場し、線形計算複雑性を持つ強力な長距離モデリング機能を提供している。
一部の研究では、RWKVを医用画像分割タスクに適用し、競争性能を実現している。
しかし,これらの研究の大部分は,VRWKV(Vision-RWKV)機構とトレーニングモデルをスクラッチから修正することに焦点を当てている。
本稿では、医用画像分割タスクにおけるRWKVの可能性を探るため、ImageNetベースの事前トレーニングを組み込んだ純粋なRWKVベースのアーキテクチャであるMed-URWKVを提案する。
我々の知る限り、Med-URWKVは医療分野における最初の純粋なRWKVセグメンテーションモデルであり、大規模なトレーニング済みVRWKVエンコーダを直接再利用することができる。
7つのデータセットの実験結果から、Med-URWKVは、スクラッチからトレーニングされた他の慎重に最適化されたRWKVモデルと比較して、同等またはそれ以上のセグメンテーション性能を達成することが示された。
これにより,事前訓練したVRWKVエンコーダを用いたモデル性能向上の有効性が検証された。
コードはリリースされます。
関連論文リスト
- RWKV-UNet: Improving UNet with Long-Range Cooperation for Effective Medical Image Segmentation [39.11918061481855]
本稿では,RWKV構造をU-Netアーキテクチャに統合する新しいモデルであるRWKV-UNetを提案する。
この統合により、長い範囲の依存関係をキャプチャし、コンテキスト理解を改善するモデルの能力が向上する。
RWKV-UNetは,様々な種類の医用画像のセグメンテーションにおいて最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-01-14T22:03:00Z) - Efficient MedSAMs: Segment Anything in Medical Images on Laptop [69.28565867103542]
我々は,迅速な医用画像のセグメンテーションに特化した初の国際コンペを組織した。
トップチームは軽量なセグメンテーション基盤モデルを開発し、効率的な推論パイプラインを実装した。
最高のパフォーマンスのアルゴリズムは、臨床導入を促進するために、ユーザフレンドリーなインターフェースを備えたオープンソースソフトウェアに組み込まれている。
論文 参考訳(メタデータ) (2024-12-20T17:33:35Z) - Embeddings are all you need! Achieving High Performance Medical Image Classification through Training-Free Embedding Analysis [0.0]
医療画像のための人工知能(AI)と機械学習(ML)モデルの開発は通常、大規模なデータセットに対する広範なトレーニングとテストを含む。
従来の訓練手順を埋め込み型アプローチで置き換える可能性について検討した。
論文 参考訳(メタデータ) (2024-12-12T16:59:37Z) - Evaluating Pre-trained Convolutional Neural Networks and Foundation Models as Feature Extractors for Content-based Medical Image Retrieval [0.37478492878307323]
コンテンツベースの医用画像検索(CBMIR)は、画像の特徴に依存し、自動または半自動で抽出できる。
本研究では、よく知られた学習済み畳み込みニューラルネットワーク(CNN)と事前学習済み基礎モデルから、事前学習済み特徴抽出器を複数使用した。
以上の結果から,2次元データセットでは,基礎モデルの方がCNNよりも優れた性能が得られることがわかった。
画像サイズが大きくなると(特に2次元データセットの場合)性能が若干向上する一方、より小さい画像でも競争力のあるCBMIR性能が達成できることを確認した。
論文 参考訳(メタデータ) (2024-09-14T13:07:30Z) - Restore-RWKV: Efficient and Effective Medical Image Restoration with RWKV [15.585071228529731]
医用画像修復のための最初のRWKVモデルであるRestore-RWKVを提案する。
本稿では,線形計算複雑性を伴う大域的依存関係を捕捉する再帰的WKV(Re-WKV)アテンション機構を提案する。
実験の結果,Restore-RWKV は様々な医療画像復元作業において SOTA の性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-07-14T12:22:05Z) - Vision-RWKV: Efficient and Scalable Visual Perception with RWKV-Like Architectures [96.00848293994463]
本稿では、NLPフィールドで使用されるRWKVモデルから適応したVision-RWKVを紹介する。
我々のモデルは、スパース入力を効率的に処理し、ロバストなグローバル処理能力を実証するために設計されている。
評価の結果,VRWKVは画像分類におけるViTの性能を超え,高速化とメモリ使用量の削減を図っている。
論文 参考訳(メタデータ) (2024-03-04T18:46:20Z) - Disruptive Autoencoders: Leveraging Low-level features for 3D Medical
Image Pre-training [51.16994853817024]
本研究は、3Dラジオグラフィ画像のための効果的な事前学習フレームワークの設計に焦点をあてる。
ローカルマスキングと低レベルの摂動の組み合わせによって生成された破壊から、オリジナルのイメージを再構築しようとする事前トレーニングフレームワークであるDisruptive Autoencodersを紹介する。
提案する事前トレーニングフレームワークは、複数のダウンストリームタスクでテストされ、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-07-31T17:59:42Z) - Pick the Best Pre-trained Model: Towards Transferability Estimation for
Medical Image Segmentation [20.03177073703528]
転送学習は、難しい医用画像分割タスクのために、ディープニューラルネットワークをトレーニングする上で重要なテクニックである。
医用画像セグメンテーションのための新しい転送可能性推定法を提案する。
医用画像のセグメンテーションにおける転送可能性推定のアルゴリズムを網羅した手法を提案する。
論文 参考訳(メタデータ) (2023-07-22T01:58:18Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - MedSegDiff-V2: Diffusion based Medical Image Segmentation with
Transformer [53.575573940055335]
我々は、MedSegDiff-V2と呼ばれるトランスフォーマーベースの拡散フレームワークを提案する。
画像の異なる20種類の画像分割作業において,その有効性を検証する。
論文 参考訳(メタデータ) (2023-01-19T03:42:36Z) - Attentive Symmetric Autoencoder for Brain MRI Segmentation [56.02577247523737]
視覚変換器(ViT)をベースとした3次元脳MRIセグメンテーションタスクのための新しいアテンテーティブシンメトリオートエンコーダを提案する。
事前学習の段階では、提案するオートエンコーダがより注意を払って、勾配測定値に従って情報パッチを再構築する。
実験の結果,提案手法は最先端の自己教師付き学習法や医用画像分割モデルよりも優れていた。
論文 参考訳(メタデータ) (2022-09-19T09:43:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。