論文の概要: Pixel-global Self-supervised Learning with Uncertainty-aware Context
Stabilizer
- arxiv url: http://arxiv.org/abs/2210.00646v1
- Date: Sun, 2 Oct 2022 22:25:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 13:39:23.047960
- Title: Pixel-global Self-supervised Learning with Uncertainty-aware Context
Stabilizer
- Title(参考訳): 不確実性認識型文脈安定化器を用いたピクセル・グローバル自己教師付き学習
- Authors: Zhuangzhuang Zhang, Weixiong Zhang
- Abstract要約: 我々は,同じ画像の異なる拡張ビュー間でのグローバルな一貫性と画素レベルの局所的なコンピテンシーを捉えるために,新しいSSLアプローチを開発した。
本手法では,同画像の強調ビューの圧縮表現を集約することにより,大域的な一貫性を実現する。
画素レベルの一貫性は、異なる拡張ビューにおいて同じピクセルに対する同様の表現を追求することによって実現される。
- 参考スコア(独自算出の注目度): 6.357127073697246
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We developed a novel SSL approach to capture global consistency and
pixel-level local consistencies between differently augmented views of the same
images to accommodate downstream discriminative and dense predictive tasks. We
adopted the teacher-student architecture used in previous contrastive SSL
methods. In our method, the global consistency is enforced by aggregating the
compressed representations of augmented views of the same image. The
pixel-level consistency is enforced by pursuing similar representations for the
same pixel in differently augmented views. Importantly, we introduced an
uncertainty-aware context stabilizer to adaptively preserve the context gap
created by the two views from different augmentations. Moreover, we used Monte
Carlo dropout in the stabilizer to measure uncertainty and adaptively balance
the discrepancy between the representations of the same pixels in different
views.
- Abstract(参考訳): 我々は,同一画像の異なる拡張ビュー間のグローバル一貫性とピクセルレベルの局所的構成を捉え,下流の判別および密集した予測タスクに対応する新しいssl手法を開発した。
我々は従来の対照的なSSL手法で使用される教師学生アーキテクチャを採用した。
本手法では,同一画像の拡張ビューの圧縮表現を集約することにより,グローバル一貫性を実現する。
ピクセルレベルの一貫性は、異なる拡張ビューで同じピクセルの類似表現を追求することで実現される。
重要となるのは,異なる拡張による2つのビューによって生成されたコンテキストギャップを適応的に保存する,不確実性を認識するコンテキストスタビライザの導入である。
さらに,安定化器内のモンテカルロドロップアウトを用いて不確かさを計測し,異なるビューにおける同一画素の表現間の不一致を適応的にバランスさせた。
関連論文リスト
- A Spitting Image: Modular Superpixel Tokenization in Vision Transformers [0.0]
Vision Transformer (ViT) アーキテクチャは伝統的に、画像の意味的内容に依存しないトークン化のためのグリッドベースのアプローチを採用している。
本稿では,トークン化と特徴抽出を分離するモジュール型スーパーピクセルトークン化戦略を提案する。
論文 参考訳(メタデータ) (2024-08-14T17:28:58Z) - Fine-grained Image-to-LiDAR Contrastive Distillation with Visual Foundation Models [55.99654128127689]
Visual Foundation Models (VFM) は、3D表現学習を強化するために使用される。
VFMは、弱制御された画素間コントラスト蒸留のためのセマンティックラベルを生成する。
我々は,空間分布とカテゴリー周波数の不均衡に対応するために,点のサンプリング確率を適応させる。
論文 参考訳(メタデータ) (2024-05-23T07:48:19Z) - Multi-View Correlation Consistency for Semi-Supervised Semantic
Segmentation [59.34619548026885]
半教師付きセマンティックセグメンテーションは、ラベルなしデータのリッチで堅牢な監視を必要とする。
本稿では,異なるビュー間の画素・画素対応を保証するビューコヒーレントなデータ拡張戦略を提案する。
2つのデータセットの半教師付き設定では、最先端の手法と比較して、競争の正確さが報告される。
論文 参考訳(メタデータ) (2022-08-17T17:59:11Z) - Introspective Deep Metric Learning for Image Retrieval [80.29866561553483]
良好な類似性モデルは、より堅牢なトレーニングのために曖昧なイメージをよりよく扱うように注意しながら、意味的な相違を考慮すべきである、と我々は主張する。
本稿では,画像の意味的特徴とあいまいさを記述した,意味的埋め込みだけでなく,付随する不確実性埋め込みを用いて画像を表現することを提案する。
提案したIDMLフレームワークは,不確実性モデリングによるディープメトリック学習の性能向上を実現し,広く使用されているCUB-200-2011,Cars196,Stanford Online Productsデータセットの最先端結果を得る。
論文 参考訳(メタデータ) (2022-05-09T17:51:44Z) - SCS-Co: Self-Consistent Style Contrastive Learning for Image
Harmonization [29.600429707123645]
画像調和のための自己整合型コントラスト学習方式(SCS-Co)を提案する。
複数の負のサンプルを動的に生成することにより、SCS-Coはより歪みの少ない知識を学習し、生成した調和像を適切に正規化することができる。
さらに,注目度の高い背景特徴分布を実現するために,背景アテンショナル適応型インスタンス正規化(BAIN)を提案する。
論文 参考訳(メタデータ) (2022-04-29T09:22:01Z) - Learning Contrastive Representation for Semantic Correspondence [150.29135856909477]
セマンティックマッチングのためのマルチレベルコントラスト学習手法を提案する。
画像レベルのコントラスト学習は、畳み込み特徴が類似したオブジェクト間の対応を見出すための鍵となる要素であることを示す。
論文 参考訳(メタデータ) (2021-09-22T18:34:14Z) - ReSSL: Relational Self-Supervised Learning with Weak Augmentation [68.47096022526927]
自己教師付き学習は、データアノテーションなしで視覚表現を学ぶことに成功しました。
本稿では,異なるインスタンス間の関係をモデル化して表現を学習する新しいリレーショナルSSLパラダイムを提案する。
提案したReSSLは,性能とトレーニング効率の両面で,従来の最先端アルゴリズムよりも大幅に優れています。
論文 参考訳(メタデータ) (2021-07-20T06:53:07Z) - Self-supervised Equivariant Attention Mechanism for Weakly Supervised
Semantic Segmentation [93.83369981759996]
本稿では,自己監督同変注意機構(SEAM)を提案する。
本手法は,完全教師付きセマンティックセグメンテーションにおいて,同値が暗黙の制約であることを示す。
本稿では,ネットワーク学習のための自己スーパービジョンを提供するために,様々な変換画像から予測されたCAMの整合性正則化を提案する。
論文 参考訳(メタデータ) (2020-04-09T14:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。