論文の概要: Redefining the Down-Sampling Scheme of U-Net for Precision Biomedical Image Segmentation
- arxiv url: http://arxiv.org/abs/2602.19412v1
- Date: Mon, 23 Feb 2026 01:10:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.631432
- Title: Redefining the Down-Sampling Scheme of U-Net for Precision Biomedical Image Segmentation
- Title(参考訳): 精密バイオメディカル画像分割のためのU-Netのダウンサンプリング方式の再定義
- Authors: Mingjie Li, Yizheng Chen, Md Tauhidul Islam, Lei Xing,
- Abstract要約: U-Netsはバイオメディカルイメージセグメンテーション(BIS)の進展に役立っている
1つの理由は、情報保持を犠牲にして計算効率を優先する従来のダウンサンプリング技術である。
本稿では, 簡易かつ効果的な戦略として, ダウンサンプリングのペースを緩やかにし, 情報損失を低減するステアプール方式を提案する。
- 参考スコア(独自算出の注目度): 14.794177610936046
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: U-Net architectures have been instrumental in advancing biomedical image segmentation (BIS) but often struggle with capturing long-range information. One reason is the conventional down-sampling techniques that prioritize computational efficiency at the expense of information retention. This paper introduces a simple but effective strategy, we call it Stair Pooling, which moderates the pace of down-sampling and reduces information loss by leveraging a sequence of concatenated small and narrow pooling operations in varied orientations. Specifically, our method modifies the reduction in dimensionality within each 2D pooling step from $\frac{1}{4}$ to $\frac{1}{2}$. This approach can also be adapted for 3D pooling to preserve even more information. Such preservation aids the U-Net in more effectively reconstructing spatial details during the up-sampling phase, thereby enhancing its ability to capture long-range information and improving segmentation accuracy. Extensive experiments on three BIS benchmarks demonstrate that the proposed Stair Pooling can increase both 2D and 3D U-Net performance by an average of 3.8\% in Dice scores. Moreover, we leverage the transfer entropy to select the optimal down-sampling paths and quantitatively show how the proposed Stair Pooling reduces the information loss.
- Abstract(参考訳): U-Netアーキテクチャはバイオメディカルイメージセグメンテーション(BIS)の進展に役立っているが、しばしば長距離情報の取得に苦労している。
1つの理由は、情報保持を犠牲にして計算効率を優先する従来のダウンサンプリング技術である。
本稿では, 簡易かつ効果的な手法としてステアプール(Stair Pooling)を導入し, ダウンサンプリングのペースを緩やかにし, 情報損失を低減する。
具体的には、各2次元プーリングステップにおける次元の減少を$\frac{1}{4}$から$\frac{1}{2}$に変更する。
このアプローチは、さらに多くの情報を保持するために、3Dプーリングにも適用することができる。
このような保存により、アップサンプリングフェーズの間、U-Netはより効果的に空間的詳細を再構築し、長距離情報をキャプチャし、セグメンテーション精度を向上させることができる。
3つのBISベンチマークの大規模な実験により、提案されたステアプールは2Dと3D U-Netの両方のパフォーマンスをDiceスコアの平均3.8\%向上させることができることが示された。
さらに、転送エントロピーを利用して最適なダウンサンプリングパスを選択し、提案したステアプールが情報損失を減らす方法を示す。
関連論文リスト
- FLARES: Fast and Accurate LiDAR Multi-Range Semantic Segmentation [52.89847760590189]
3Dシーンの理解は、自動運転における重要な課題である。
近年の手法では、レンジビュー表現を利用して処理効率を向上している。
範囲ビューに基づくLiDARセマンティックセマンティックセグメンテーションのためのワークフローを再設計する。
論文 参考訳(メタデータ) (2025-02-13T12:39:26Z) - SwIPE: Efficient and Robust Medical Image Segmentation with Implicit Patch Embeddings [12.79344668998054]
正確な局所境界線とグローバルな形状コヒーレンスを実現するために,SwIPE(Segmentation with Implicit Patch Embeddings)を提案する。
その結果,最近の暗黙的アプローチよりもSwIPEは大幅に改善され,パラメータが10倍以上の最先端の離散手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-23T20:55:11Z) - Non-pooling Network for medical image segmentation [11.956054700035326]
本稿では,非プールネットワーク(NPNet)を提案する。
NPNetのセマンティックセマンティックセグメンテーションモデルを,w i t h多重状態(SOTA)モデルと比較した3つのベンチマークデータセットで評価した。
論文 参考訳(メタデータ) (2023-02-21T02:49:16Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z) - Dense U-net for super-resolution with shuffle pooling layer [4.397981844057195]
最近の研究は、単一画像超解像(SISR)において大きな進歩を遂げている。
この方法では、高分解能入力画像は、特徴抽出の前に単一のフィルタ、通常最大プーリングを用いて、低分解能空間にダウンスケールされる。
これは準最適であり、情報損失を引き起こすことを実証する。
本研究では,シャッフルプールを用いたDense U-netという最先端の畳み込みニューラルネットワーク手法を提案する。
論文 参考訳(メタデータ) (2020-11-11T00:59:43Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Spatial-Spectral Residual Network for Hyperspectral Image
Super-Resolution [82.1739023587565]
ハイパースペクトル画像超解像のための新しいスペクトル空間残差ネットワーク(SSRNet)を提案する。
提案手法は,2次元畳み込みではなく3次元畳み込みを用いて空間スペクトル情報の探索を効果的に行うことができる。
各ユニットでは空間的・時間的分離可能な3次元畳み込みを用いて空間的・スペクトル的な情報を抽出する。
論文 参考訳(メタデータ) (2020-01-14T03:34:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。