論文の概要: Exploring Set Similarity for Dense Self-supervised Representation
Learning
- arxiv url: http://arxiv.org/abs/2107.08712v1
- Date: Mon, 19 Jul 2021 09:38:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-20 14:56:20.220330
- Title: Exploring Set Similarity for Dense Self-supervised Representation
Learning
- Title(参考訳): 複雑な自己教師型表現学習のための集合類似性の探索
- Authors: Zhaoqing Wang, Qiang Li, Guoxin Zhang, Pengfei Wan, Wen Zheng, Nannan
Wang, Mingming Gong, Tongliang Liu
- Abstract要約: 本研究では,高密度自己教師型表現学習のためのtextbfset textbfsimilarity (SetSim) を提案する。
ピクセルワイドの類似性学習をセットワイドに一般化し,よりセマンティックな情報や構造的な情報を含むため,ロバスト性を向上させる。
具体的には、ビューの注意的特徴に頼って対応する集合を定め、不適切な対応を引き起こす可能性のあるノイズの多い背景をフィルタリングする。
- 参考スコア(独自算出の注目度): 96.35286140203407
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: By considering the spatial correspondence, dense self-supervised
representation learning has achieved superior performance on various dense
prediction tasks. However, the pixel-level correspondence tends to be noisy
because of many similar misleading pixels, e.g., backgrounds. To address this
issue, in this paper, we propose to explore \textbf{set} \textbf{sim}ilarity
(SetSim) for dense self-supervised representation learning. We generalize
pixel-wise similarity learning to set-wise one to improve the robustness
because sets contain more semantic and structure information. Specifically, by
resorting to attentional features of views, we establish corresponding sets,
thus filtering out noisy backgrounds that may cause incorrect correspondences.
Meanwhile, these attentional features can keep the coherence of the same image
across different views to alleviate semantic inconsistency. We further search
the cross-view nearest neighbours of sets and employ the structured
neighbourhood information to enhance the robustness. Empirical evaluations
demonstrate that SetSim is superior to state-of-the-art methods on object
detection, keypoint detection, instance segmentation, and semantic
segmentation.
- Abstract(参考訳): 空間対応を考慮し、密集した自己教師付き表現学習は、様々な密集予測タスクにおいて優れた性能を発揮した。
しかし、画素レベルの対応は、背景など多くの類似の誤解を招く画素のため、ノイズが多い傾向にある。
この問題に対処するため,本稿では,密な自己教師付き表現学習のためのsetsim(setbf{set} \textbf{sim}ilarity)について検討する。
ピクセルワイドの類似性学習をセットワイドに一般化し,よりセマンティックで構造的な情報を含むため,ロバスト性を向上させる。
具体的には,ビューの注意的特徴を活用して対応する集合を確立し,不正確な対応を引き起こす可能性のあるノイズの背景をフィルタリングする。
一方、これらの注意的特徴は、意味的不整合を軽減するために、異なる視点で同じ画像のコヒーレンスを維持することができる。
さらに,集合の直交近傍を探索し,構造化された近傍情報を用いてロバスト性を高める。
実証的な評価では、SetSimはオブジェクト検出、キーポイント検出、インスタンスセグメンテーション、セマンティックセグメンテーションにおける最先端メソッドよりも優れている。
関連論文リスト
- Semantics Meets Temporal Correspondence: Self-supervised Object-centric Learning in Videos [63.94040814459116]
自己教師付き手法は、高レベルの意味論と低レベルの時間対応の学習において顕著な進歩を見せている。
融合した意味特徴と対応地図の上に,意味認識型マスキングスロットアテンションを提案する。
我々は、時間的コヒーレントなオブジェクト中心表現を促進するために、セマンティックおよびインスタンスレベルの時間的一貫性を自己スーパービジョンとして採用する。
論文 参考訳(メタデータ) (2023-08-19T09:12:13Z) - Self-Supervised Visual Representation Learning with Semantic Grouping [50.14703605659837]
我々は、未ラベルのシーン中心のデータから視覚表現を学習する問題に取り組む。
本研究では,データ駆動型セマンティックスロット,すなわちSlotConによる協調型セマンティックグルーピングと表現学習のためのコントラスト学習を提案する。
論文 参考訳(メタデータ) (2022-05-30T17:50:59Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Dense Semantic Contrast for Self-Supervised Visual Representation
Learning [12.636783522731392]
意味圏決定境界を密度の高いレベルでモデル化するためのDense Semantic Contrast(DSC)を提案する。
本稿では,多粒度表現学習のためのクロスイメージ・セマンティック・コントラッシブ・ラーニング・フレームワークを提案する。
実験結果から,DSCモデルは下流の高密度予測タスクに転送する場合に,最先端の手法よりも優れることがわかった。
論文 参考訳(メタデータ) (2021-09-16T07:04:05Z) - Unsupervised Learning of Dense Visual Representations [14.329781842154281]
本研究では,高密度表現の教師なし学習のためのビュー・アグノスティック・Dense Representation (VADeR)を提案する。
VADeRは、異なる視聴条件に対して局所的な特徴を一定に保ち続けるように強制することで、ピクセルワイズ表現を学習する。
提案手法は、複数の密集予測タスクにおいて、ImageNetの教師付き事前学習よりも優れる。
論文 参考訳(メタデータ) (2020-11-11T01:28:11Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z) - Weakly-Supervised Semantic Segmentation by Iterative Affinity Learning [86.45526827323954]
弱教師付きセマンティックセグメンテーションは、トレーニングのためにピクセル単位のラベル情報が提供されないため、難しい課題である。
このようなペア関係を学習するための反復アルゴリズムを提案する。
本稿では,提案アルゴリズムが最先端手法に対して好適に動作することを示す。
論文 参考訳(メタデータ) (2020-02-19T10:32:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。