論文の概要: Beyond Single Stage Encoder-Decoder Networks: Deep Decoders for Semantic
Image Segmentation
- arxiv url: http://arxiv.org/abs/2007.09746v1
- Date: Sun, 19 Jul 2020 18:44:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 00:43:34.757897
- Title: Beyond Single Stage Encoder-Decoder Networks: Deep Decoders for Semantic
Image Segmentation
- Title(参考訳): 単一ステージエンコーダ-デコーダネットワークを超えて:セマンティックイメージセグメンテーションのためのディープデコーダ
- Authors: Gabriel L. Oliveira, Senthil Yogamani, Wolfram Burgard and Thomas Brox
- Abstract要約: セマンティックセグメンテーションのための単一エンコーダ-デコーダ手法は、セマンティックセグメンテーションの品質とレイヤー数あたりの効率の観点からピークに達している。
そこで本研究では,より多くの情報コンテンツを取得するために,浅層ネットワークの集合を用いたデコーダに基づく新しいアーキテクチャを提案する。
アーキテクチャをさらに改善するために,ネットワークの注目度を高めるために,クラスの再バランスを目的とした重み関数を導入する。
- 参考スコア(独自算出の注目度): 56.44853893149365
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single encoder-decoder methodologies for semantic segmentation are reaching
their peak in terms of segmentation quality and efficiency per number of
layers. To address these limitations, we propose a new architecture based on a
decoder which uses a set of shallow networks for capturing more information
content. The new decoder has a new topology of skip connections, namely
backward and stacked residual connections. In order to further improve the
architecture we introduce a weight function which aims to re-balance classes to
increase the attention of the networks to under-represented objects. We carried
out an extensive set of experiments that yielded state-of-the-art results for
the CamVid, Gatech and Freiburg Forest datasets. Moreover, to further prove the
effectiveness of our decoder, we conducted a set of experiments studying the
impact of our decoder to state-of-the-art segmentation techniques.
Additionally, we present a set of experiments augmenting semantic segmentation
with optical flow information, showing that motion clues can boost pure image
based semantic segmentation approaches.
- Abstract(参考訳): セマンティックセグメンテーションのための単一エンコーダ-デコーダ手法は、セマンティックセグメンテーションの品質とレイヤー数あたりの効率の観点からピークに達している。
これらの制約に対処するために,より多くの情報コンテンツを取得するために浅層ネットワークの集合を用いたデコーダに基づく新しいアーキテクチャを提案する。
新しいデコーダにはスキップ接続の新しいトポロジ、すなわち後方およびスタック化された残コネクションがある。
アーキテクチャをさらに改善するために,ネットワークの注目度を高めるために,クラスの再バランスを目的とした重み関数を導入する。
我々はCamVid, Gatech, Freiburg Forestのデータセットに対して,最先端の成果をもたらす広範な実験を行った。
さらに,デコーダの有効性をさらに証明するために,デコーダが最先端のセグメンテーション技術に与える影響について,一連の実験を行った。
さらに,光学フロー情報を用いて意味セグメンテーションを補強する一連の実験を行い,動きの手がかりが純粋な画像に基づく意味セグメンテーションアプローチを促進することを示した。
関連論文リスト
- DiffCut: Catalyzing Zero-Shot Semantic Segmentation with Diffusion Features and Recursive Normalized Cut [62.63481844384229]
ファンデーションモデルは、言語、ビジョン、マルチモーダルタスクなど、さまざまな領域にまたがる強力なツールとして登場した。
本稿では,拡散UNetエンコーダを基礎ビジョンエンコーダとして使用し,教師なしゼロショットセグメンテーション手法であるDiffCutを紹介する。
我々の研究は、拡散UNetエンコーダに埋め込まれた極めて正確なセマンティック知識を強調し、下流タスクの基盤ビジョンエンコーダとして機能する。
論文 参考訳(メタデータ) (2024-06-05T01:32:31Z) - Triple-View Knowledge Distillation for Semi-Supervised Semantic
Segmentation [54.23510028456082]
半教師付きセマンティックセグメンテーションのためのトリプルビュー知識蒸留フレームワークTriKDを提案する。
このフレームワークは、トリプルビューエンコーダとデュアル周波数デコーダを含む。
論文 参考訳(メタデータ) (2023-09-22T01:02:21Z) - Transfer Learning for Segmentation Problems: Choose the Right Encoder
and Skip the Decoder [0.0]
ダウンストリームタスクのパフォーマンスを向上させるために、最初は異なるデータでトレーニングされたモデルを再利用するのが一般的です。
本研究では,画素単位の分類問題であるセグメンテーション問題に対する移動学習の影響について検討する。
デコーダのトランスファー学習は下流のセグメンテーションタスクに役立ちませんが、エンコーダのトランスファー学習は本当に有益です。
論文 参考訳(メタデータ) (2022-07-29T07:02:05Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - Dynamic Neural Representational Decoders for High-Resolution Semantic
Segmentation [98.05643473345474]
動的ニューラル表現デコーダ(NRD)と呼ばれる新しいデコーダを提案する。
エンコーダの出力上の各位置がセマンティックラベルの局所的なパッチに対応するので、この研究では、これらの局所的なパッチをコンパクトなニューラルネットワークで表現する。
このニューラル表現により、意味ラベル空間に先行する滑らかさを活用することができ、デコーダをより効率的にすることができる。
論文 参考訳(メタデータ) (2021-07-30T04:50:56Z) - Fractal Pyramid Networks [3.7384509727711923]
画素ワイズ予測タスクのための新しいネットワークアーキテクチャであるフラクタルピラミッドネットワーク(PFN)を提案する。
PFNは複数の情報処理経路を保持し、情報を複数の小さなチャネルにエンコードする。
我々のモデルは、パラメータをはるかに少なくして、KITTIデータセットの最先端のメソッドを競合または上回ることができます。
論文 参考訳(メタデータ) (2021-06-28T13:15:30Z) - Transformer Meets DCFAM: A Novel Semantic Segmentation Scheme for
Fine-Resolution Remote Sensing Images [6.171417925832851]
Swin Transformerをバックボーンとして導入し、コンテキスト情報を完全に抽出します。
また、高密度接続特徴集合モジュール(DCFAM)と呼ばれる新しいデコーダを設計し、解像度を復元し、セグメンテーションマップを生成する。
論文 参考訳(メタデータ) (2021-04-25T11:34:22Z) - Rethinking and Improving Natural Language Generation with Layer-Wise
Multi-View Decoding [59.48857453699463]
シーケンシャル・ツー・シーケンス学習では、デコーダは注意機構に依存してエンコーダから情報を効率的に抽出する。
近年の研究では、異なるエンコーダ層からの表現を多様なレベルの情報に利用することが提案されている。
本稿では, 各デコーダ層に対して, グローバルビューとして機能する最後のエンコーダ層からの表現とともに, ソースシーケンスの立体視のために他のエンコーダ層からのデコーダ層からのデコーダ層を補足するレイヤワイド・マルチビューデコーダを提案する。
論文 参考訳(メタデータ) (2020-05-16T20:00:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。