論文の概要: Leveraging Image Complexity in Macro-Level Neural Network Design for
Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2112.11065v1
- Date: Tue, 21 Dec 2021 09:49:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-22 21:03:36.075710
- Title: Leveraging Image Complexity in Macro-Level Neural Network Design for
Medical Image Segmentation
- Title(参考訳): 医用画像分割のためのマクロレベルニューラルネットワーク設計における画像複雑さの活用
- Authors: Tariq M. Khan, Syed S. Naqvi, Erik Meijering
- Abstract要約: 画像の複雑さは、与えられたデータセットに最適なものを選択するためのガイドラインとして利用できることを示す。
高複雑性データセットの場合、元のイメージ上で実行される浅いネットワークは、ダウンサンプリングされたイメージ上で実行されるディープネットワークよりもセグメンテーション結果が優れている可能性がある。
- 参考スコア(独自算出の注目度): 3.974175960216864
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent progress in encoder-decoder neural network architecture design has led
to significant performance improvements in a wide range of medical image
segmentation tasks. However, state-of-the-art networks for a given task may be
too computationally demanding to run on affordable hardware, and thus users
often resort to practical workarounds by modifying various macro-level design
aspects. Two common examples are downsampling of the input images and reducing
the network depth to meet computer memory constraints. In this paper we
investigate the effects of these changes on segmentation performance and show
that image complexity can be used as a guideline in choosing what is best for a
given dataset. We consider four statistical measures to quantify image
complexity and evaluate their suitability on ten different public datasets. For
the purpose of our experiments we also propose two new encoder-decoder
architectures representing shallow and deep networks that are more memory
efficient than currently popular networks. Our results suggest that median
frequency is the best complexity measure in deciding about an acceptable input
downsampling factor and network depth. For high-complexity datasets, a shallow
network running on the original images may yield better segmentation results
than a deep network running on downsampled images, whereas the opposite may be
the case for low-complexity images.
- Abstract(参考訳): エンコーダ-デコーダニューラルネットワークアーキテクチャ設計の最近の進歩は、幅広い医療画像セグメンテーションタスクにおいて、大幅なパフォーマンス向上をもたらした。
しかし、与えられたタスクに対する最先端のネットワークは、手頃なハードウェア上での実行を計算的に要求しすぎるため、ユーザーは様々なマクロレベルの設計の側面を変更することで、実用的な回避策を使うことが多い。
2つの一般的な例は、入力画像のダウンサンプリングと、コンピュータメモリの制約を満たすためのネットワーク深さの削減である。
本稿では,これらの変化がセグメンテーション性能に与える影響について検討し,与えられたデータセットに最適なものを選択する際のガイドラインとして,画像の複雑さが利用できることを示す。
我々は,画像の複雑さを定量化し,その適合性を10種類の公開データセットで評価する4つの統計的尺度を検討する。
実験のために,現在普及しているネットワークよりもメモリ効率が高い浅層および深層ネットワークを表す2つの新しいエンコーダデコーダアーキテクチャを提案する。
以上の結果から,中央周波数は入力ダウンサンプリング係数とネットワーク深度を決定するのに最適な複雑性尺度であることが示唆された。
高複雑さのデータセットでは、元のイメージ上で実行される浅いネットワークは、ダウンサンプリングされたイメージ上で実行されるディープネットワークよりもセグメンテーション結果が優れている。
関連論文リスト
- Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - HistoSeg : Quick attention with multi-loss function for multi-structure
segmentation in digital histology images [0.696194614504832]
医療画像のセグメンテーションは、コンピュータ支援による診断、手術、治療を支援する。
一般化デコーダネットワーク,クイックアテンションモジュール,マルチロス関数を提案する。
医用画像セグメンテーション用データセットであるMoNuSegとGlaSにおいて,提案するネットワークの有効性を評価する。
論文 参考訳(メタデータ) (2022-09-01T21:10:00Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Restormer: Efficient Transformer for High-Resolution Image Restoration [118.9617735769827]
畳み込みニューラルネットワーク(CNN)は、大規模データから一般化可能な画像の事前学習をうまく行う。
トランスフォーマーは、自然言語とハイレベルな視覚タスクにおいて、顕著なパフォーマンス向上を示している。
我々のモデルであるRecovery Transformer (Restormer) は、いくつかの画像復元タスクにおいて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-18T18:59:10Z) - SDWNet: A Straight Dilated Network with Wavelet Transformation for Image
Deblurring [23.86692375792203]
画像劣化は、ぼやけた画像から鋭い画像を復元することを目的としたコンピュータビジョンの問題である。
我々のモデルは拡張畳み込みを用いて空間分解能の高い大きな受容場を得ることができる。
本稿では,ウェーブレット変換を用いた新しいモジュールを提案する。
論文 参考訳(メタデータ) (2021-10-12T07:58:10Z) - Image Complexity Guided Network Compression for Biomedical Image
Segmentation [5.926887379656135]
生体画像セグメント化のための画像複雑化誘導型ネットワーク圧縮手法を提案する。
データセットの複雑さを、圧縮によるターゲットネットワークの精度劣化にマップする。
このマッピングは、圧縮ネットワークを生成するための畳み込み層ワイド乗算因子を決定するために用いられる。
論文 参考訳(メタデータ) (2021-07-06T22:28:10Z) - Scalable Visual Transformers with Hierarchical Pooling [61.05787583247392]
本稿では,視覚的トークンを徐々にプールしてシーケンス長を縮小する階層的ビジュアルトランスフォーマ(hvt)を提案する。
計算の複雑さを増すことなく、深さ/幅/解像度/パッチサイズの寸法をスケールすることで、大きなメリットをもたらします。
当社のHVTはImageNetとCIFAR-100データセットの競合ベースラインを上回っています。
論文 参考訳(メタデータ) (2021-03-19T03:55:58Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z) - LSHR-Net: a hardware-friendly solution for high-resolution computational
imaging using a mixed-weights neural network [5.475867050068397]
本稿では,混合重み付けニューラルネットワークを用いた新しいハードウェアフレンドリな計算手法を提案する。
特に、学習された二分重センシングパターンはサンプリング装置に合わせて調整される。
提案手法はベンチマークデータセットで検証され, 再現精度が向上した。
論文 参考訳(メタデータ) (2020-04-27T20:59:51Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。