論文の概要: Rethinking Decoder Design: Improving Biomarker Segmentation Using Depth-to-Space Restoration and Residual Linear Attention
- arxiv url: http://arxiv.org/abs/2506.18335v1
- Date: Mon, 23 Jun 2025 06:32:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.88554
- Title: Rethinking Decoder Design: Improving Biomarker Segmentation Using Depth-to-Space Restoration and Residual Linear Attention
- Title(参考訳): デコーダ設計の再考:奥行き復元と残留線形注意によるバイオマーカーセグメンテーションの改善
- Authors: Saad Wazir, Daeyoung Kim,
- Abstract要約: マルチスケールのローカル・グローバル・コンテクスト情報と新しいデコーダ設計を実現するアーキテクチャを提案する。
本手法は,MoNuSegが2.76%,DSBが3.12%,Electron Microscopyが2.87%,TNBCが4.03%という絶対的な性能向上を達成した。
- 参考スコア(独自算出の注目度): 2.0799865428691393
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Segmenting biomarkers in medical images is crucial for various biotech applications. Despite advances, Transformer and CNN based methods often struggle with variations in staining and morphology, limiting feature extraction. In medical image segmentation, where datasets often have limited sample availability, recent state-of-the-art (SOTA) methods achieve higher accuracy by leveraging pre-trained encoders, whereas end-to-end methods tend to underperform. This is due to challenges in effectively transferring rich multiscale features from encoders to decoders, as well as limitations in decoder efficiency. To address these issues, we propose an architecture that captures multi-scale local and global contextual information and a novel decoder design, which effectively integrates features from the encoder, emphasizes important channels and regions, and reconstructs spatial dimensions to enhance segmentation accuracy. Our method, compatible with various encoders, outperforms SOTA methods, as demonstrated by experiments on four datasets and ablation studies. Specifically, our method achieves absolute performance gains of 2.76% on MoNuSeg, 3.12% on DSB, 2.87% on Electron Microscopy, and 4.03% on TNBC datasets compared to existing SOTA methods. Code: https://github.com/saadwazir/MCADS-Decoder
- Abstract(参考訳): 医用画像におけるバイオマーカーのセグメンテーションは様々なバイオテクノロジー応用に不可欠である。
進歩にもかかわらず、TransformerとCNNベースの手法は、しばしば染色と形態のバリエーションに悩まされ、特徴抽出を制限する。
データセットがサンプルの可用性に制限がある医療画像セグメンテーションでは、最近の最先端のSOTA(State-of-the-art)手法は、事前訓練されたエンコーダを利用することで高い精度を達成する一方、エンドツーエンドの手法は性能が低下する傾向にある。
これは、エンコーダからデコーダへリッチなマルチスケール機能を効果的に転送する上での課題と、デコーダ効率の制限によるものである。
これらの問題に対処するために,マルチスケールの局所的・グローバルな文脈情報をキャプチャするアーキテクチャと,エンコーダの特徴を効果的に統合し,重要なチャネルや領域を強調し,空間次元を再構築してセグメント化精度を高める新しいデコーダ設計を提案する。
提案手法は, 各種エンコーダと互換性があり, 4つのデータセット実験およびアブレーション実験により, SOTA法より優れていた。
具体的には,MoNuSegが2.76%,DSBが3.12%,Electron Microscopyが2.87%,TNBCデータセットが4.03%であった。
コード:https://github.com/saadwazir/MCADS-Decoder
関連論文リスト
- Magnifier: A Multi-grained Neural Network-based Architecture for Burned Area Delineation [4.833815605196964]
危機管理とリモートセンシングでは、イメージセグメンテーションが重要な役割を担い、災害対応や緊急計画といったタスクを可能にする。
同社の開発における問題は、データ不足と広範なベンチマークデータセットの欠如であり、大規模なニューラルネットワークモデルをトレーニングする能力を制限している。
本稿では,データ可用性を制限したセグメンテーション性能向上のための新しい手法,Magnifierを提案する。
論文 参考訳(メタデータ) (2025-04-28T08:51:54Z) - Rethinking the Nested U-Net Approach: Enhancing Biomarker Segmentation with Attention Mechanisms and Multiscale Feature Fusion [2.0799865428691393]
マルチスケール・フィーチャー・フュージョンとアテンション・メカニズムを通じて、ローカルとグローバルの両方のコンテキストをキャプチャするネストされたUNetアーキテクチャを導入する。
この設計では、エンコーダからの機能統合を改善し、キーチャネルとリージョンを強調し、空間の詳細を復元してセグメンテーション性能を向上させる。
論文 参考訳(メタデータ) (2025-04-08T15:53:46Z) - Extreme Encoder Output Frame Rate Reduction: Improving Computational
Latencies of Large End-to-End Models [59.57732929473519]
エンコーダに複数のフレーム削減層を適用し,少数の出力フレームにエンコーダ出力を圧縮する。
入力音声の2.56秒毎に1つのエンコーダ出力フレームを生成できることを示す。
論文 参考訳(メタデータ) (2024-02-27T03:40:44Z) - ParaTransCNN: Parallelized TransCNN Encoder for Medical Image
Segmentation [7.955518153976858]
本稿では,畳み込みニューラルネットワークとトランスフォーマーアーキテクチャを組み合わせた2次元特徴抽出手法を提案する。
特に小臓器では, セグメンテーションの精度が向上した。
論文 参考訳(メタデータ) (2024-01-27T05:58:36Z) - Triple-View Knowledge Distillation for Semi-Supervised Semantic
Segmentation [54.23510028456082]
半教師付きセマンティックセグメンテーションのためのトリプルビュー知識蒸留フレームワークTriKDを提案する。
このフレームワークは、トリプルビューエンコーダとデュアル周波数デコーダを含む。
論文 参考訳(メタデータ) (2023-09-22T01:02:21Z) - MaxViT-UNet: Multi-Axis Attention for Medical Image Segmentation [0.46040036610482665]
MaxViT-UNetは医療画像セグメンテーションのためのハイブリッドビジョントランス (CNN-Transformer) である。
提案するハイブリッドデコーダは,各復号段階における畳み込み機構と自己保持機構の両方のパワーを利用するように設計されている。
復号器の各段階における多軸自己アテンションの包含は、対象領域と背景領域の識別能力を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-15T07:23:54Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - Dynamic Neural Representational Decoders for High-Resolution Semantic
Segmentation [98.05643473345474]
動的ニューラル表現デコーダ(NRD)と呼ばれる新しいデコーダを提案する。
エンコーダの出力上の各位置がセマンティックラベルの局所的なパッチに対応するので、この研究では、これらの局所的なパッチをコンパクトなニューラルネットワークで表現する。
このニューラル表現により、意味ラベル空間に先行する滑らかさを活用することができ、デコーダをより効率的にすることができる。
論文 参考訳(メタデータ) (2021-07-30T04:50:56Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z) - Atrous Residual Interconnected Encoder to Attention Decoder Framework
for Vertebrae Segmentation via 3D Volumetric CT Images [1.8146155083014204]
本稿では,3次元容積CT画像を用いた新しい椎骨分割法を提案する。
提案モデルは,ミニバッチトレーニング性能の最適化にレイヤ正規化を用いた,エンコーダからデコーダへの構造に基づく。
実験の結果,本モデルは他の医学的意味セグメンテーション法と比較して競争力が得られた。
論文 参考訳(メタデータ) (2021-04-08T12:09:16Z) - Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation [82.61182037130406]
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。
我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
論文 参考訳(メタデータ) (2021-04-02T02:07:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。