論文の概要: Dynamic Neural Representational Decoders for High-Resolution Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2107.14428v1
- Date: Fri, 30 Jul 2021 04:50:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-02 13:02:10.056476
- Title: Dynamic Neural Representational Decoders for High-Resolution Semantic
Segmentation
- Title(参考訳): 高分解能セマンティックセグメンテーションのための動的ニューラルネットワーク表現デコーダ
- Authors: Bowen Zhang, Yifan Liu, Zhi Tian, Chunhua Shen
- Abstract要約: 動的ニューラル表現デコーダ(NRD)と呼ばれる新しいデコーダを提案する。
エンコーダの出力上の各位置がセマンティックラベルの局所的なパッチに対応するので、この研究では、これらの局所的なパッチをコンパクトなニューラルネットワークで表現する。
このニューラル表現により、意味ラベル空間に先行する滑らかさを活用することができ、デコーダをより効率的にすることができる。
- 参考スコア(独自算出の注目度): 98.05643473345474
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Semantic segmentation requires per-pixel prediction for a given image.
Typically, the output resolution of a segmentation network is severely reduced
due to the downsampling operations in the CNN backbone. Most previous methods
employ upsampling decoders to recover the spatial resolution. Various decoders
were designed in the literature. Here, we propose a novel decoder, termed
dynamic neural representational decoder (NRD), which is simple yet
significantly more efficient. As each location on the encoder's output
corresponds to a local patch of the semantic labels, in this work, we represent
these local patches of labels with compact neural networks. This neural
representation enables our decoder to leverage the smoothness prior in the
semantic label space, and thus makes our decoder more efficient. Furthermore,
these neural representations are dynamically generated and conditioned on the
outputs of the encoder networks. The desired semantic labels can be efficiently
decoded from the neural representations, resulting in high-resolution semantic
segmentation predictions. We empirically show that our proposed decoder can
outperform the decoder in DeeplabV3+ with only 30% computational complexity,
and achieve competitive performance with the methods using dilated encoders
with only 15% computation. Experiments on the Cityscapes, ADE20K, and PASCAL
Context datasets demonstrate the effectiveness and efficiency of our proposed
method.
- Abstract(参考訳): セマンティックセグメンテーションは、与えられた画像に対してピクセル単位の予測を必要とする。
通常、セグメンテーションネットワークの出力解像度はCNNバックボーンのダウンサンプリング操作により大幅に低下する。
以前の手法では、空間分解能を回復するためにデコーダのアップサンプリングを用いる。
様々なデコーダが文学で設計された。
本稿では,動的ニューラルネットワーク表現デコーダ(dynamic neural representational decoder, nrd)と呼ばれる新しいデコーダを提案する。
本研究では、エンコーダ出力上の各位置が意味ラベルの局所パッチに対応するため、これらのラベルの局所パッチをコンパクトニューラルネットワークで表現する。
このニューラル表現により、デコーダは意味ラベル空間の前の滑らかさを活用できるため、デコーダをより効率的にします。
さらに、これらの神経表現は動的に生成され、エンコーダネットワークの出力に条件付けされる。
所望のセマンティクスラベルを効率的に神経表現から復号することができ、その結果、高分解能セマンティクスセグメンテーションが予測される。
提案するデコーダは,DeeplabV3+のデコーダを30%の計算複雑性で上回り,15%しか計算できない拡張エンコーダを用いた手法と競合する性能が得られることを示す。
都市景観,ADE20K,PASCALコンテキストデータセットの実験により,提案手法の有効性と有効性を示した。
関連論文リスト
- NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Variable Bitrate Neural Fields [75.24672452527795]
本稿では,特徴格子を圧縮し,メモリ消費を最大100倍に削減する辞書手法を提案する。
辞書の最適化をベクトル量子化オートデコーダ問題として定式化し、直接監督できない空間において、エンドツーエンドの離散神経表現を学習する。
論文 参考訳(メタデータ) (2022-06-15T17:58:34Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - Atrous Residual Interconnected Encoder to Attention Decoder Framework
for Vertebrae Segmentation via 3D Volumetric CT Images [1.8146155083014204]
本稿では,3次元容積CT画像を用いた新しい椎骨分割法を提案する。
提案モデルは,ミニバッチトレーニング性能の最適化にレイヤ正規化を用いた,エンコーダからデコーダへの構造に基づく。
実験の結果,本モデルは他の医学的意味セグメンテーション法と比較して競争力が得られた。
論文 参考訳(メタデータ) (2021-04-08T12:09:16Z) - Beyond Single Stage Encoder-Decoder Networks: Deep Decoders for Semantic
Image Segmentation [56.44853893149365]
セマンティックセグメンテーションのための単一エンコーダ-デコーダ手法は、セマンティックセグメンテーションの品質とレイヤー数あたりの効率の観点からピークに達している。
そこで本研究では,より多くの情報コンテンツを取得するために,浅層ネットワークの集合を用いたデコーダに基づく新しいアーキテクチャを提案する。
アーキテクチャをさらに改善するために,ネットワークの注目度を高めるために,クラスの再バランスを目的とした重み関数を導入する。
論文 参考訳(メタデータ) (2020-07-19T18:44:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。