論文の概要: Improving Semantic Segmentation via Decoupled Body and Edge Supervision
- arxiv url: http://arxiv.org/abs/2007.10035v2
- Date: Tue, 18 Aug 2020 03:41:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 13:58:10.905375
- Title: Improving Semantic Segmentation via Decoupled Body and Edge Supervision
- Title(参考訳): デカップリングボディとエッジスーパービジョンによるセマンティックセグメンテーションの改善
- Authors: Xiangtai Li, Xia Li, Li Zhang, Guangliang Cheng, Jianping Shi,
Zhouchen Lin, Shaohua Tan, Yunhai Tong
- Abstract要約: 既存のセグメンテーションアプローチは、グローバルコンテキストをモデル化することでオブジェクトの内部の一貫性を改善すること、あるいはマルチスケールの特徴融合によって境界に沿ったオブジェクトの詳細を洗練することを目的としている。
本稿では,セマンティックセグメンテーションのための新しいパラダイムを提案する。
我々の洞察は、セマンティックセグメンテーションの魅力ある性能には、画像の高頻度と低頻度に対応するオブジェクトのテキストボディとテキストエッジを具体的にモデル化する必要があるということである。
さまざまなベースラインやバックボーンネットワークを備えた提案したフレームワークが,オブジェクト内部の一貫性とオブジェクト境界を向上させることを示す。
- 参考スコア(独自算出の注目度): 89.57847958016981
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing semantic segmentation approaches either aim to improve the object's
inner consistency by modeling the global context, or refine objects detail
along their boundaries by multi-scale feature fusion. In this paper, a new
paradigm for semantic segmentation is proposed. Our insight is that appealing
performance of semantic segmentation requires \textit{explicitly} modeling the
object \textit{body} and \textit{edge}, which correspond to the high and low
frequency of the image. To do so, we first warp the image feature by learning a
flow field to make the object part more consistent. The resulting body feature
and the residual edge feature are further optimized under decoupled supervision
by explicitly sampling different parts (body or edge) pixels. We show that the
proposed framework with various baselines or backbone networks leads to better
object inner consistency and object boundaries. Extensive experiments on four
major road scene semantic segmentation benchmarks including
\textit{Cityscapes}, \textit{CamVid}, \textit{KIITI} and \textit{BDD} show that
our proposed approach establishes new state of the art while retaining high
efficiency in inference. In particular, we achieve 83.7 mIoU \% on Cityscape
with only fine-annotated data. Code and models are made available to foster any
further research (\url{https://github.com/lxtGH/DecoupleSegNets}).
- Abstract(参考訳): 既存のセグメンテーションアプローチは、グローバルコンテキストをモデル化することでオブジェクトの内部の一貫性を改善すること、あるいはマルチスケールの特徴融合によって境界に沿ったオブジェクトの詳細を洗練することを目的としている。
本稿では,セマンティックセグメンテーションのための新しいパラダイムを提案する。
我々の洞察では、セグメンテーションの魅力ある性能には、画像の高頻度と低頻度に対応するオブジェクト \textit{body} と \textit{edge} をモデル化する必要がある。
そこで我々はまず,フロー場を学習し,物体の一部をより一貫性のあるものにすることで,画像特徴をワープする。
異なる部分(体またはエッジ)画素を明示的にサンプリングすることにより、得られたボディ特徴と残留エッジ特徴をさらに分離した監督下で最適化する。
様々なベースラインやバックボーンネットワークを備えた提案フレームワークが,オブジェクト内部一貫性とオブジェクト境界の改善に繋がることを示す。
道路シーンのセグメンテーションベンチマークである \textit{cityscapes}, \textit{camvid}, \textit{kiiti}, \textit{kiiti}, \textit{bdd} の4つの主要な4つの主要なベンチマークに関する広範な実験は、提案手法が推論の効率を高く保ちながら新しい状態を確立することを示している。
特に,Cityscape では 83.7 mIoU \% の細かな注釈付きデータしか得られない。
コードとモデルは、さらなる研究を促進するために利用可能である(\url{https://github.com/lxtGH/DecoupleSegNets})。
関連論文リスト
- ViewCo: Discovering Text-Supervised Segmentation Masks via Multi-View
Semantic Consistency [126.88107868670767]
テキスト教師付きセマンティックセグメンテーションのためのマルチテキストbfView textbfConsistent Learning (ViewCo)を提案する。
まず,同じ入力画像の複数ビューに対する対応性を学習するためのテキスト・ツー・ビュー整合性モデリングを提案する。
また,テキスト管理の曖昧性問題に対処するために,クロスビューセグメンテーション整合性モデリングを提案する。
論文 参考訳(メタデータ) (2023-01-31T01:57:52Z) - Open-world Semantic Segmentation via Contrasting and Clustering
Vision-Language Embedding [95.78002228538841]
本研究では,様々なオープンワールドカテゴリのセマンティックオブジェクトを高密度アノテーションを使わずにセマンティックオブジェクトのセマンティックオブジェクトのセマンティック化を学習するための,新しいオープンワールドセマンティックセマンティックセマンティックセマンティクスパイプラインを提案する。
提案手法は任意のカテゴリのオブジェクトを直接分割し、3つのベンチマークデータセット上でデータラベリングを必要とするゼロショットセグメンテーション法より優れている。
論文 参考訳(メタデータ) (2022-07-18T09:20:04Z) - TransFGU: A Top-down Approach to Fine-Grained Unsupervised Semantic
Segmentation [44.75300205362518]
教師なしセマンティックセグメンテーションは、手動のアノテーションを使わずに、低レベルの視覚的特徴の高レベルセマンティック表現を得ることを目的としている。
本稿では, 非常に複雑なシナリオにおける細粒度セグメンテーションのための, トップダウンの教師なしセグメンテーションフレームワークを提案する。
我々の結果は、トップダウンの教師なしセグメンテーションが、オブジェクト中心とシーン中心の両方のデータセットに対して堅牢であることを示している。
論文 参考訳(メタデータ) (2021-12-02T18:59:03Z) - Attention-based fusion of semantic boundary and non-boundary information
to improve semantic segmentation [9.518010235273783]
本稿では,新しい融合方式に基づく画像意味的セグメンテーション手法を提案する。
我々の提案の主な目的は、全体セグメンテーション性能を改善するために、オブジェクト境界情報を調べることである。
提案したモデルでは,CityScapes,CamVid,Pascal Contextデータセットで最高のmIoU,Mapillary Vistasで2番目によいmIoUを達成した。
論文 参考訳(メタデータ) (2021-08-05T20:46:53Z) - A Unified Efficient Pyramid Transformer for Semantic Segmentation [40.20512714144266]
我々はコンテキスト情報と境界アーティファクトの両方を考慮してオブジェクトをセグメント化する統一フレームワーク(UN-EPT)を提唱する。
我々はまず,効率的なコンテキストモデリングのために,トランスフォーマーに基づくアテンション機構を組み込むため,スパースサンプリング戦略を適用した。
メモリフットプリントの少ないセマンティックセグメンテーションのための3つの人気のあるベンチマークで有望な性能を示す。
論文 参考訳(メタデータ) (2021-07-29T17:47:32Z) - BoundarySqueeze: Image Segmentation as Boundary Squeezing [104.43159799559464]
本研究では,オブジェクトとシーンの微細な高画質画像分割のための新しい手法を提案する。
形態素画像処理技術による拡張と浸食に着想を得て,画素レベルのセグメンテーション問題をスクイーズ対象境界として扱う。
提案手法は,COCO,Cityscapesのインスタンス・セグメンテーション・セグメンテーション・セグメンテーションにおいて大きく向上し,同一条件下での精度・速度ともに従来のPointRendよりも優れていた。
論文 参考訳(メタデータ) (2021-05-25T04:58:51Z) - Locate then Segment: A Strong Pipeline for Referring Image Segmentation [73.19139431806853]
参照画像セグメンテーションは、自然言語表現によって参照されるオブジェクトをセグメンテーションすることを目的とする。
従来の方法は、視覚言語機能を融合させ、最終的なセグメンテーションマスクを直接生成するための暗黙的および反復的な相互作用メカニズムの設計に焦点を当てています。
これらの問題に取り組むための「Then-Then-Segment」スキームを紹介します。
私たちのフレームワークはシンプルですが驚くほど効果的です。
論文 参考訳(メタデータ) (2021-03-30T12:25:27Z) - Part-aware Prototype Network for Few-shot Semantic Segmentation [50.581647306020095]
本稿では,プロトタイプ表現に基づく新規な数ショットセマンティックセマンティックセマンティクスフレームワークを提案する。
私たちのキーとなるアイデアは、全体論的なクラス表現を、部分認識型プロトタイプのセットに分解することです。
提案する部分認識型プロトタイプを生成・拡張する新しいグラフニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-07-13T11:03:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。