論文の概要: Semantic Segmentation via Pixel-to-Center Similarity Calculation
- arxiv url: http://arxiv.org/abs/2301.04870v1
- Date: Thu, 12 Jan 2023 08:36:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-13 14:39:11.943489
- Title: Semantic Segmentation via Pixel-to-Center Similarity Calculation
- Title(参考訳): 画素間類似度計算による意味セグメンテーション
- Authors: Dongyue Wu, Zilin Guo, Aoyan Li, Changqian Yu, Changxin Gao, Nong Sang
- Abstract要約: まず、ピクセルとクラスセンターの類似性の観点から、セマンティックセグメンテーションを再考する。
本稿では,上記の課題に対処するクラスセンター類似層(CCS層)を提案する。
我々のモデルは最先端のCNNベースの手法に対して好適に機能する。
- 参考スコア(独自算出の注目度): 40.62804702162577
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Since the fully convolutional network has achieved great success in semantic
segmentation, lots of works have been proposed focusing on extracting
discriminative pixel feature representations. However, we observe that existing
methods still suffer from two typical challenges, i.e. (i) large intra-class
feature variation in different scenes, (ii) small inter-class feature
distinction in the same scene. In this paper, we first rethink semantic
segmentation from a perspective of similarity between pixels and class centers.
Each weight vector of the segmentation head represents its corresponding
semantic class in the whole dataset, which can be regarded as the embedding of
the class center. Thus, the pixel-wise classification amounts to computing
similarity in the final feature space between pixels and the class centers.
Under this novel view, we propose a Class Center Similarity layer (CCS layer)
to address the above-mentioned challenges by generating adaptive class centers
conditioned on different scenes and supervising the similarities between class
centers. It utilizes a Adaptive Class Center Module (ACCM) to generate class
centers conditioned on each scene, which adapt the large intra-class variation
between different scenes. Specially designed loss functions are introduced to
control both inter-class and intra-class distances based on predicted
center-to-center and pixel-to-center similarity, respectively. Finally, the CCS
layer outputs the processed pixel-to-center similarity as the segmentation
prediction. Extensive experiments demonstrate that our model performs
favourably against the state-of-the-art CNN-based methods.
- Abstract(参考訳): 完全畳み込みネットワークはセマンティックセグメンテーションにおいて大きな成功を収めたため、識別的画素特徴表現の抽出に焦点を当てた多くの研究が提案されている。
しかし,既存の手法は依然として2つの典型的な課題に悩まされている。
(i)異なる場面における大きなクラス内特徴変動
(ii)同一場面における小級間特徴の区別
本稿では,まず,画素とクラス中心の類似性の観点から意味セグメンテーションを再考する。
セグメンテーションヘッドの各重みベクトルは、データセット全体の対応するセマンティッククラスを表しており、クラスセンターの埋め込みと見なすことができる。
したがって、画素単位の分類は、画素とクラス中心の間の最終特徴空間における類似性を計算することに相当する。
そこで本研究では,異なるシーンに条件付き適応型クラスセンターを生成し,クラスセンター間の類似性を監視することによって,上記の課題に対処するクラスセンター類似層(CCS層)を提案する。
適応型クラスセンタモジュール(accm)を使用して、各シーンで条件付けられたクラスセンタを生成し、異なるシーン間で大きなクラス内変動を適応させる。
予測された中心間距離と画素間類似度に基づいてクラス間距離とクラス内距離の両方を制御するために特別に設計された損失関数を導入する。
最後に、CCS層は、セグメンテーション予測と処理された画素間類似性を出力する。
大規模な実験により、我々のモデルは最先端のCNNベースの手法に対して好適に機能することを示した。
関連論文リスト
- Superpixel Graph Contrastive Clustering with Semantic-Invariant
Augmentations for Hyperspectral Images [64.72242126879503]
ハイパースペクトル画像(HSI)クラスタリングは重要な課題だが難しい課題である。
まず3次元と2次元のハイブリッド畳み込みニューラルネットワークを用いてHSIの高次空間およびスペクトルの特徴を抽出する。
次に,超画素グラフの対比クラスタリングモデルを設計し,識別的超画素表現を学習する。
論文 参考訳(メタデータ) (2024-03-04T07:40:55Z) - Feature Selection using Sparse Adaptive Bottleneck Centroid-Encoder [1.2487990897680423]
2つ以上のクラスで識別される特徴を決定するために,新しい非線形モデル SABCE (Sparse Adaptive Bottleneckid-Encoder) を導入する。
このアルゴリズムは、高次元生物学的、画像、音声、加速度センサデータなど、様々な実世界のデータセットに適用される。
論文 参考訳(メタデータ) (2023-06-07T21:37:21Z) - Visual Recognition with Deep Nearest Centroids [57.35144702563746]
我々は、概念的にエレガントで驚くほど効果的な大規模視覚認識ネットワークである深部セントロイド(DNC)を考案した。
パラメトリックと比較すると、DNCは画像分類(CIFAR-10, ImageNet)に優れ、画像認識(ADE20K, Cityscapes)を大いに起動する。
論文 参考訳(メタデータ) (2022-09-15T15:47:31Z) - Active Domain Adaptation with Multi-level Contrastive Units for Semantic
Segmentation [22.048328293739182]
セマンティックイメージセグメンテーションのための多レベルコントラストユニット(ADA-MCU)を用いた新しいアクティブドメイン適応方式を提案する。
ADA-MCUは、ラベル付きおよびラベルなしのピクセルを使用して、画像内、クロスイメージ、およびクロスドメインレベルから構築される。
提案手法は,ラベル付き画素を50%減らした最先端のSSDA手法に対する競合性能を実現し,同レベルのアノテーションコストを用いることで,最先端のSSDA手法よりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2022-05-23T10:55:39Z) - SePiCo: Semantic-Guided Pixel Contrast for Domain Adaptive Semantic
Segmentation [52.62441404064957]
ドメイン適応セマンティックセグメンテーションは、ラベル付きソースドメインでトレーニングされたモデルを利用することで、ラベル付きターゲットドメイン上で満足のいく密度の予測を試みる。
多くの手法は、ノイズの多い擬似ラベルを緩和する傾向があるが、類似のセマンティックな概念を持つクロスドメインピクセル間の固有の接続を無視する。
本稿では,個々の画素のセマンティックな概念を強調する一段階適応フレームワークSePiCoを提案する。
論文 参考訳(メタデータ) (2022-04-19T11:16:29Z) - The Fixed Sub-Center: A Better Way to Capture Data Complexity [1.583842747998493]
我々は、F-SC(Fixed Sub-Center)を用いて、より離散的なサブセンターを構築することを提案する。
実験の結果,F-SCは画像分類と微粒化処理の精度を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2022-03-24T08:21:28Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - PiCIE: Unsupervised Semantic Segmentation using Invariance and
Equivariance in Clustering [41.39557700996688]
クラスタリングによるアノテーションのないセマンティックセグメンテーションのための新しいフレームワークを提案する。
画像からピクセルへのクラスタリングを拡張し、各画像内の異なるインスタンスに別々のクラスタメンバシップを割り当てる。
新たな学習目標によって,フレームワークは高度な意味概念を学習することができる。
論文 参考訳(メタデータ) (2021-03-30T00:12:10Z) - Inter-Image Communication for Weakly Supervised Localization [77.2171924626778]
弱教師付きローカライゼーションは、画像レベルの監督のみを使用して対象対象領域を見つけることを目的としている。
我々は,より正確な物体位置を学習するために,異なる物体間の画素レベルの類似性を活用することを提案する。
ILSVRC検証セット上でトップ1のローカライズ誤差率45.17%を達成する。
論文 参考訳(メタデータ) (2020-08-12T04:14:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。