論文の概要: FuseUNet: A Multi-Scale Feature Fusion Method for U-like Networks
- arxiv url: http://arxiv.org/abs/2506.05821v1
- Date: Fri, 06 Jun 2025 07:34:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.363193
- Title: FuseUNet: A Multi-Scale Feature Fusion Method for U-like Networks
- Title(参考訳): FuseUNet:Uライクネットワークのためのマルチスケール機能融合手法
- Authors: Quansong He, Xiangde Min, Kaishen Wang, Tao He,
- Abstract要約: 本稿では,UNet復号処理を初期値問題として再定義する,新しいマルチスケール機能融合法を提案する。
ACDC、KiTS2023、MSD脳腫瘍、ISIC皮膚病変セグメンテーションデータセットの実験は、機能利用の改善、ネットワークパラメータの削減、高性能の維持を実証した。
- 参考スコア(独自算出の注目度): 6.076351456098043
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical image segmentation is a critical task in computer vision, with UNet serving as a milestone architecture. The typical component of UNet family is the skip connection, however, their skip connections face two significant limitations: (1) they lack effective interaction between features at different scales, and (2) they rely on simple concatenation or addition operations, which constrain efficient information integration. While recent improvements to UNet have focused on enhancing encoder and decoder capabilities, these limitations remain overlooked. To overcome these challenges, we propose a novel multi-scale feature fusion method that reimagines the UNet decoding process as solving an initial value problem (IVP), treating skip connections as discrete nodes. By leveraging principles from the linear multistep method, we propose an adaptive ordinary differential equation method to enable effective multi-scale feature fusion. Our approach is independent of the encoder and decoder architectures, making it adaptable to various U-Net-like networks. Experiments on ACDC, KiTS2023, MSD brain tumor, and ISIC2017/2018 skin lesion segmentation datasets demonstrate improved feature utilization, reduced network parameters, and maintained high performance. The code is available at https://github.com/nayutayuki/FuseUNet.
- Abstract(参考訳): 医用画像のセグメンテーションはコンピュータビジョンにおいて重要な課題であり、UNetはマイルストーンアーキテクチャとして機能している。
UNetファミリの典型的なコンポーネントはスキップ接続であるが、スキップ接続には2つの重要な制限がある。
UNetの最近の改善はエンコーダとデコーダの機能の向上に重点を置いているが、これらの制限は見落としている。
これらの課題を克服するために,UNet復号処理を初期値問題(IVP)として再定義し,スキップ接続を離散ノードとして扱う,新しいマルチスケール機能融合法を提案する。
線形多段法から原理を生かした適応型常微分方程式法を提案する。
我々のアプローチはエンコーダとデコーダアーキテクチャとは独立であり、様々なU-Netライクなネットワークに適応できる。
ACDC、KiTS2023、MSD脳腫瘍、ISIC2017/2018皮膚病変セグメンテーションデータセットの実験は、機能利用の改善、ネットワークパラメータの削減、ハイパフォーマンスの維持を実証した。
コードはhttps://github.com/nayutayuki/FuseUNetで入手できる。
関連論文リスト
- QTSeg: A Query Token-Based Dual-Mix Attention Framework with Multi-Level Feature Distribution for Medical Image Segmentation [13.359001333361272]
医用画像のセグメンテーションは、正確な診断と自動診断プロセスの実現を医療専門家に支援する上で重要な役割を担っている。
従来の畳み込みニューラルネットワーク(CNN)は、長い範囲の依存関係をキャプチャするのに苦労することが多い。
近年の取り組みはCNNとトランスフォーマーを組み合わせて性能と効率のバランスをとることに重点を置いているが、既存の手法は計算コストを低く抑えながら高いセグメンテーション精度を達成するという課題に直面している。
ローカルおよびグローバルな情報を効果的に統合する医療画像セグメンテーションのための新しいアーキテクチャであるQTSegを提案する。
論文 参考訳(メタデータ) (2024-12-23T03:22:44Z) - A Lightweight U-like Network Utilizing Neural Memory Ordinary Differential Equations for Slimming the Decoder [13.123714410130912]
ニューラルメモリの正規微分方程式(nmODE)の異なる離散化手法を用いた3つのプラグアンドプレイデコーダを提案する。
これらのデコーダは、スキップ接続から情報を処理し、上向きの経路で数値演算を行うことにより、様々な抽象化レベルで機能を統合する。
要約すると、提案した離散化されたnmデコーダは、パラメータ数を約20%減らし、FLOPを最大74%減らし、U型ネットワークに適応する可能性を秘めている。
論文 参考訳(メタデータ) (2024-12-09T07:21:27Z) - Edge-Enhanced Dilated Residual Attention Network for Multimodal Medical Image Fusion [13.029564509505676]
マルチモーダル・メディカル・イメージ・フュージョン(Multimodal Medical Image fusion)は、様々な画像モダリティからの相補的な情報を統一的な表現に結合する重要なタスクである。
深層学習手法は融合性能が著しく向上しているが、既存のCNNベースの手法では、微細なマルチスケールとエッジの特徴を捉えるには不十分である。
マルチスケール機能抽出のためのDilated Residual Attention Network Moduleを導入することで,これらの制約に対処する新しいCNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-11-18T18:11:53Z) - Heterogenous Memory Augmented Neural Networks [84.29338268789684]
ニューラルネットワークのための新しいヘテロジニアスメモリ拡張手法を提案する。
学習可能なメモリトークンをアテンション機構付きで導入することにより、膨大な計算オーバーヘッドを伴わずに性能を効果的に向上させることができる。
In-distriion (ID) と Out-of-distriion (OOD) の両方の条件下での様々な画像およびグラフベースのタスクに対するアプローチを示す。
論文 参考訳(メタデータ) (2023-10-17T01:05:28Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - MaxViT-UNet: Multi-Axis Attention for Medical Image Segmentation [0.46040036610482665]
MaxViT-UNetは医療画像セグメンテーションのためのハイブリッドビジョントランス (CNN-Transformer) である。
提案するハイブリッドデコーダは,各復号段階における畳み込み機構と自己保持機構の両方のパワーを利用するように設計されている。
復号器の各段階における多軸自己アテンションの包含は、対象領域と背景領域の識別能力を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-15T07:23:54Z) - CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for
Multi-Modality Image Fusion [138.40422469153145]
本稿では,CDDFuse(Relationed-Driven Feature Decomposition Fusion)ネットワークを提案する。
近赤外可視画像融合や医用画像融合など,複数の融合タスクにおいてCDDFuseが有望な結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-11-26T02:40:28Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。