論文の概要: Resolution-Aware Design of Atrous Rates for Semantic Segmentation
Networks
- arxiv url: http://arxiv.org/abs/2307.14179v1
- Date: Wed, 26 Jul 2023 13:11:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-27 12:18:28.183037
- Title: Resolution-Aware Design of Atrous Rates for Semantic Segmentation
Networks
- Title(参考訳): セマンティクスセグメンテーションネットワークのためのアトーラスレートの解像度認識設計
- Authors: Bum Jun Kim, Hyeyeon Choi, Hyeonah Jang, Sang Woo Kim
- Abstract要約: DeepLabはセマンティックセグメンテーションに広く使用されているディープニューラルネットワークであり、その成功は、アトラス空間ピラミッドプール(ASPP)と呼ばれる並列アーキテクチャによるものである。
アラスレートの固定値は、視野のサイズを制限するASPPモジュールに使用される。
本研究は,最適アラスレートを得るための実践的ガイドラインを提案する。
- 参考スコア(独自算出の注目度): 7.58745191859815
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: DeepLab is a widely used deep neural network for semantic segmentation, whose
success is attributed to its parallel architecture called atrous spatial
pyramid pooling (ASPP). ASPP uses multiple atrous convolutions with different
atrous rates to extract both local and global information. However, fixed
values of atrous rates are used for the ASPP module, which restricts the size
of its field of view. In principle, atrous rate should be a hyperparameter to
change the field of view size according to the target task or dataset. However,
the manipulation of atrous rate is not governed by any guidelines. This study
proposes practical guidelines for obtaining an optimal atrous rate. First, an
effective receptive field for semantic segmentation is introduced to analyze
the inner behavior of segmentation networks. We observed that the use of ASPP
module yielded a specific pattern in the effective receptive field, which was
traced to reveal the module's underlying mechanism. Accordingly, we derive
practical guidelines for obtaining the optimal atrous rate, which should be
controlled based on the size of input image. Compared to other values, using
the optimal atrous rate consistently improved the segmentation results across
multiple datasets, including the STARE, CHASE_DB1, HRF, Cityscapes, and iSAID
datasets.
- Abstract(参考訳): deeplabはセマンティックセグメンテーションに広く使われているディープニューラルネットワークであり、その成功はatrous spatial pyramid pooling (aspp)と呼ばれる並列アーキテクチャに起因する。
ASPPは、局所情報とグローバル情報の両方を抽出するために異なるアトラスレートを持つ複数のアトラス畳み込みを使用する。
しかし、アラスレートの固定値は、その視野のサイズを制限するASPPモジュールに使用される。
原則として atrous rate は、対象のタスクやデータセットに応じてビューサイズのサイズを変更するハイパーパラメータであるべきです。
しかし、アトーラスレートの操作はいかなるガイドラインにも従わない。
本研究は,最適アラスレートを得るための実践的ガイドラインを提案する。
まず、セグメンテーションネットワークの内部挙動を分析するために、セグメンテーションのための効果的な受容場を導入する。
我々は,ASPPモジュールの使用により,有効受容領域の特定のパターンが得られ,モジュールの基盤となるメカニズムが明らかにされた。
したがって、入力画像のサイズに基づいて制御すべき最適アラス率を得るための実用的なガイドラインを導出する。
他の値と比較して、最適なatrousレートを使用することで、stare、 chase_db1、hrf、cityscapes、isaidデータセットを含む複数のデータセットにまたがるセグメンテーション結果が一貫して改善される。
関連論文リスト
- PiPa++: Towards Unification of Domain Adaptive Semantic Segmentation via Self-supervised Learning [34.786268652516355]
教師なしドメイン適応セグメンテーションは、それらのドメインのラベル付きデータに頼ることなく、ターゲットドメイン上のモデルのセグメンテーション精度を向上させることを目的としている。
ソースドメイン(ラベル付きデータが利用可能な場所)とターゲットドメイン(ラベルなしデータのみが存在する場所)の特徴表現の整合を図る。
論文 参考訳(メタデータ) (2024-07-24T08:53:29Z) - Domain Adaptive Semantic Segmentation by Optimal Transport [13.133890240271308]
セマンティックシーンセグメンテーションは、それが含んでいるセマンティック情報の豊かさから、多くの注目を集めています。
現在のアプローチは主に畳み込みニューラルネットワーク(CNN)に基づいているが、多くのラベルに依存している。
本稿では、最適輸送(OT)とこの問題に対処するためのアテンションメカニズムに基づくドメイン適応(DA)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-29T03:33:54Z) - Interactive Segmentation as Gaussian Process Classification [58.44673380545409]
クリックベースのインタラクティブセグメンテーション(IS)は、ユーザインタラクション下で対象オブジェクトを抽出することを目的としている。
現在のディープラーニング(DL)ベースの手法のほとんどは、主にセマンティックセグメンテーションの一般的なパイプラインに従っている。
本稿では,各画像上でガウス過程(GP)に基づく画素単位のバイナリ分類モデルとしてISタスクを定式化することを提案する。
論文 参考訳(メタデータ) (2023-02-28T14:01:01Z) - Threshold-adaptive Unsupervised Focal Loss for Domain Adaptation of
Semantic Segmentation [25.626882426111198]
意味的セグメンテーションのための教師なしドメイン適応(UDA)は近年研究の注目を集めている。
本稿では,セマンティックセグメンテーションのための2段階エントロピーに基づくUDA手法を提案する。
本稿では,DeepLabV2を用いたSynTHIA-to-CityscapesとGTA5-to-Cityscapesにおける最先端の58.4%と59.6%のmIoUと,軽量BiSeNetを用いた競合性能を実現する。
論文 参考訳(メタデータ) (2022-08-23T03:48:48Z) - Real-Time Scene Text Detection with Differentiable Binarization and
Adaptive Scale Fusion [62.269219152425556]
セグメンテーションに基づくシーンテキスト検出手法はシーンテキスト検出分野において大きな注目を集めている。
本稿では,二項化処理をセグメンテーションネットワークに統合する分散二項化(DB)モジュールを提案する。
アダプティブ・スケール・フュージョン (ASF) モジュールは, 異なるスケールの特徴を適応的に融合させることにより, スケールのロバスト性を向上させる。
論文 参考訳(メタデータ) (2022-02-21T15:30:14Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z) - Improving Semi-Supervised and Domain-Adaptive Semantic Segmentation with
Self-Supervised Depth Estimation [94.16816278191477]
本稿では,セミアダプティブなセマンティックセマンティックセマンティックセグメンテーションのためのフレームワークを提案する。
ラベルのない画像シーケンスでのみ訓練された自己教師付き単眼深度推定によって強化される。
提案したモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2021-08-28T01:33:38Z) - Boosting Few-shot Semantic Segmentation with Transformers [81.43459055197435]
TRansformer-based Few-shot Semantic segmentation Method (TRFS)
我々のモデルは,グローバル・エンハンスメント・モジュール(GEM)とローカル・エンハンスメント・モジュール(LEM)の2つのモジュールから構成される。
論文 参考訳(メタデータ) (2021-08-04T20:09:21Z) - Latent Space Regularization for Unsupervised Domain Adaptation in
Semantic Segmentation [14.050836886292869]
セマンティックセグメンテーションにおけるドメインの不一致を減らすために、機能レベルの空間形成正規化戦略を紹介します。
このような手法の有効性を自律運転環境で検証する。
論文 参考訳(メタデータ) (2021-04-06T16:07:22Z) - Gated Path Selection Network for Semantic Segmentation [72.44994579325822]
我々は,適応的な受容場を学習することを目的とした,GPSNetという新しいネットワークを開発した。
GPSNetにおいて、我々はまず2次元のマルチスケールネットワーク、SuperNetを設計する。
望ましいセマンティックコンテキストを動的に選択するために、ゲート予測モジュールがさらに導入される。
論文 参考訳(メタデータ) (2020-01-19T12:32:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。