論文の概要: Class-level Multiple Distributions Representation are Necessary for
Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2303.08029v1
- Date: Tue, 14 Mar 2023 16:10:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-15 14:16:07.219767
- Title: Class-level Multiple Distributions Representation are Necessary for
Semantic Segmentation
- Title(参考訳): セマンティックセグメンテーションに必要なクラスレベルの多重分布表現
- Authors: Jianjian Yin, Zhichao Zheng, Yanhui Gu, Junsheng Zhou, Yi Chen
- Abstract要約: クラス内変動を複数の分布で記述する手法を初めて紹介する。
また,組込み画素の識別的多重分布表現を構築するためのクラス多重分布整合性戦略を提案する。
我々のアプローチは、一般的なセグメンテーションフレームワークFCN/PSPNet/CCNetにシームレスに統合され、5.61%/1.75%/0.75% mIoUの改善がADE20Kで達成される。
- 参考スコア(独自算出の注目度): 9.796689408601775
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing approaches focus on using class-level features to improve semantic
segmentation performance. How to characterize the relationships of intra-class
pixels and inter-class pixels is the key to extract the discriminative
representative class-level features. In this paper, we introduce for the first
time to describe intra-class variations by multiple distributions. Then,
multiple distributions representation learning(\textbf{MDRL}) is proposed to
augment the pixel representations for semantic segmentation. Meanwhile, we
design a class multiple distributions consistency strategy to construct
discriminative multiple distribution representations of embedded pixels.
Moreover, we put forward a multiple distribution semantic aggregation module to
aggregate multiple distributions of the corresponding class to enhance pixel
semantic information. Our approach can be seamlessly integrated into popular
segmentation frameworks FCN/PSPNet/CCNet and achieve 5.61\%/1.75\%/0.75\% mIoU
improvements on ADE20K. Extensive experiments on the Cityscapes, ADE20K
datasets have proved that our method can bring significant performance
improvement.
- Abstract(参考訳): 既存のアプローチでは、セマンティクスのセグメンテーションパフォーマンスを改善するためにクラスレベルの機能を使うことに重点を置いている。
クラス内画素とクラス間画素の関係を特徴付ける方法が、識別可能なクラスレベルの特徴を抽出する鍵である。
本稿では,複数分布によるクラス内変動を初めて記述する。
次に、複数の分布表現学習(\textbf{MDRL})を提案し、セマンティックセグメンテーションのためのピクセル表現を強化する。
一方,組込み画素の判別的多重分布表現を構築するために,クラス多重分布一貫性戦略を設計する。
さらに、画素意味情報を強化するために、対応するクラスの複数の分布を集約する多重分布意味集約モジュールも提案する。
我々のアプローチは、一般的なセグメンテーションフレームワークFCN/PSPNet/CCNetにシームレスに統合され、5.61\%/1.75\%/0.75\% mIoUの改善がADE20K上で達成される。
都市景観に関する広範囲な実験、ade20kデータセットは、本手法が大幅な性能向上をもたらすことを証明した。
関連論文リスト
- Relation-Aware Distribution Representation Network for Person Clustering
with Multiple Modalities [17.569843539515734]
顔、体、声を含む多モードの手がかりでクラスタリングする人は、様々なタスクに欠かせない。
マルチモーダルな手がかりの分布表現を生成するためのリレーショナル・アウェア分布表現ネットワーク(RAD-Net)を提案する。
提案手法は,ビデオパーソンクラスタリングデータセットにおけるFスコアの+6%と+8.2%を大幅に改善する。
論文 参考訳(メタデータ) (2023-08-01T15:04:56Z) - MCIBI++: Soft Mining Contextual Information Beyond Image for Semantic
Segmentation [29.458735435545048]
我々は,MCIBI++という画像パラダイムを超えた,新しいソフトマイニングのコンテキスト情報を提案する。
我々は,各画素表現のクラス確率分布を生成し,データセットレベルのコンテキストアグリゲーションを実行する。
推論フェーズでは,さらにセグメンテーション結果を高めるために,粗大かつ微細な反復推論戦略を設計する。
論文 参考訳(メタデータ) (2022-09-09T18:03:52Z) - Beyond the Prototype: Divide-and-conquer Proxies for Few-shot
Segmentation [63.910211095033596]
少ないショットのセグメンテーションは、少数の濃密なラベル付けされたサンプルのみを与えられた、目に見えないクラスオブジェクトをセグメンテーションすることを目的としている。
分割・分散の精神において, 単純かつ多目的な枠組みを提案する。
提案手法は、DCP(disvision-and-conquer proxies)と呼ばれるもので、適切な信頼性のある情報の開発を可能にする。
論文 参考訳(メタデータ) (2022-04-21T06:21:14Z) - Scaling up Multi-domain Semantic Segmentation with Sentence Embeddings [81.09026586111811]
ゼロショット設定に適用した場合、最先端の教師付き性能を実現するセマンティックセマンティックセマンティクスへのアプローチを提案する。
これは各クラスラベルを、クラスを記述する短い段落のベクトル値の埋め込みに置き換えることによって達成される。
結果として得られた200万以上の画像の統合セマンティックセグメンテーションデータセットは、7つのベンチマークデータセット上の最先端の教師付きメソッドと同等のパフォーマンスを達成するモデルをトレーニングすることができる。
論文 参考訳(メタデータ) (2022-02-04T07:19:09Z) - Dual Prototypical Contrastive Learning for Few-shot Semantic
Segmentation [55.339405417090084]
本稿では,FSSタスクに適合する2つの特徴的コントラスト学習手法を提案する。
第一の考え方は、プロトタイプの特徴空間におけるクラス内距離を減少させながら、クラス間距離を増やすことで、プロトタイプをより差別的にすることである。
提案手法は,PASCAL-5iおよびCOCO-20iデータセット上で,最先端のFSS手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-09T08:14:50Z) - Mining Contextual Information Beyond Image for Semantic Segmentation [37.783233906684444]
セマンティックイメージセグメンテーションにおける文脈集約問題について検討する。
個々の画像以外の文脈情報をマイニングして、ピクセル表現をさらに強化することを提案する。
提案手法は,既存のセグメンテーションフレームワークに強制的に組み込むことができる。
論文 参考訳(メタデータ) (2021-08-26T14:34:23Z) - Multi-dataset Pretraining: A Unified Model for Semantic Segmentation [97.61605021985062]
我々は、異なるデータセットの断片化アノテーションを最大限に活用するために、マルチデータセット事前訓練と呼ばれる統合フレームワークを提案する。
これは、複数のデータセットに対して提案されたピクセルからプロトタイプへのコントラスト損失を通じてネットワークを事前トレーニングすることで実現される。
異なるデータセットからの画像とクラス間の関係をより良くモデル化するために、クロスデータセットの混合によりピクセルレベルの埋め込みを拡張する。
論文 参考訳(メタデータ) (2021-06-08T06:13:11Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - Part-aware Prototype Network for Few-shot Semantic Segmentation [50.581647306020095]
本稿では,プロトタイプ表現に基づく新規な数ショットセマンティックセマンティックセマンティクスフレームワークを提案する。
私たちのキーとなるアイデアは、全体論的なクラス表現を、部分認識型プロトタイプのセットに分解することです。
提案する部分認識型プロトタイプを生成・拡張する新しいグラフニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-07-13T11:03:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。