論文の概要: Towards Self-Supervised Learning of Global and Object-Centric
Representations
- arxiv url: http://arxiv.org/abs/2203.05997v1
- Date: Fri, 11 Mar 2022 15:18:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-14 14:01:19.808088
- Title: Towards Self-Supervised Learning of Global and Object-Centric
Representations
- Title(参考訳): グローバルおよびオブジェクト中心表現の自己改善学習に向けて
- Authors: Federico Baldassarre, Hossein Azizpour
- Abstract要約: 自己スーパービジョンを用いた構造化対象中心表現の学習における重要な側面について論じる。
CLEVRデータセットに関するいくつかの実験を通じて、私たちの洞察を検証します。
- 参考スコア(独自算出の注目度): 4.36572039512405
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervision allows learning meaningful representations of natural images
which usually contain one central object. How well does it transfer to
multi-entity scenes? We discuss key aspects of learning structured
object-centric representations with self-supervision and validate our insights
through several experiments on the CLEVR dataset. Regarding the architecture,
we confirm the importance of competition for attention-based object discovery,
where each image patch is exclusively attended by one object. For training, we
show that contrastive losses equipped with matching can be applied directly in
a latent space, avoiding pixel-based reconstruction. However, such an
optimization objective is sensitive to false negatives (recurring objects) and
false positives (matching errors). Thus, careful consideration is required
around data augmentation and negative sample selection.
- Abstract(参考訳): 自己スーパービジョンは、通常1つの中心オブジェクトを含む自然画像の有意義な表現を学習することを可能にする。
マルチエンタテインメントのシーンにどの程度移行しますか?
我々は、自己スーパービジョンで構造化されたオブジェクト中心表現を学習し、CLEVRデータセットに関するいくつかの実験を通して洞察を検証する。
アーキテクチャに関して、各画像パッチが1つのオブジェクトにのみ参加する、注目に基づくオブジェクト発見の競争の重要性を確認する。
学習では,マッチング機能を備えたコントラスト損失を潜在空間に直接適用し,画素ベースの再構成を回避できることを示す。
しかし、このような最適化の目標は偽陰性(繰り返しオブジェクト)と偽陽性(一致エラー)に敏感である。
したがって、データ拡張と負のサンプル選択に関して慎重に検討する必要がある。
関連論文リスト
- Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。
8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。
多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-17T10:37:07Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Spotlight Attention: Robust Object-Centric Learning With a Spatial
Locality Prior [88.9319150230121]
オブジェクト中心のビジョンは、シーン内のオブジェクトの明示的な表現を構築することを目的としています。
我々は、空間的局所性を最先端のオブジェクト中心視覚モデルに組み込む。
合成および実世界の両方のデータセットにおけるセグメンテーションオブジェクトの大幅な改善が得られた。
論文 参考訳(メタデータ) (2023-05-31T04:35:50Z) - Matching Multiple Perspectives for Efficient Representation Learning [0.0]
本稿では,自己教師型学習とマルチパースペクティブマッチング技術を組み合わせたアプローチを提案する。
我々は,同一オブジェクトの複数ビューと多種多様な自己教師付き事前学習アルゴリズムを組み合わせることで,オブジェクト分類性能が向上することを示す。
論文 参考訳(メタデータ) (2022-08-16T10:33:13Z) - Object Pursuit: Building a Space of Objects via Discriminative Weight
Generation [23.85039747700698]
視覚学習と理解のためのオブジェクト中心表現を継続的に学習するフレームワークを提案する。
我々は、オブジェクト中心の表現を学習しながら、オブジェクトとそれに対応するトレーニング信号の多様なバリエーションをサンプリングするために、インタラクションを活用する。
提案するフレームワークの重要な特徴について広範な研究を行い,学習した表現の特徴を分析した。
論文 参考訳(メタデータ) (2021-12-15T08:25:30Z) - Unsupervised Part Discovery from Contrastive Reconstruction [90.88501867321573]
自己監督型視覚表現学習の目標は、強く伝達可能な画像表現を学習することである。
対象部分の発見とセグメンテーションに対する教師なしアプローチを提案する。
本手法は, 細粒度, 視覚的に異なるカテゴリ間でセマンティックな部分を生成する。
論文 参考訳(メタデータ) (2021-11-11T17:59:42Z) - Object-aware Contrastive Learning for Debiased Scene Representation [74.30741492814327]
オブジェクトを自己教師型でローカライズする,オブジェクト認識型コントラスト学習フレームワークを開発した。
また、コントラCAM、オブジェクト認識型乱作、背景混合に基づく2つのデータ拡張を導入し、コントラスト型自己教師型学習における文脈バイアスと背景バイアスを低減した。
論文 参考訳(メタデータ) (2021-07-30T19:24:07Z) - Generalization and Robustness Implications in Object-Centric Learning [23.021791024676986]
本稿では,5つの共通オブジェクトデータセット上で,最先端の教師なしモデルを訓練する。
実験結果から,ダウンストリームタスクに一般的に有用なオブジェクト中心表現が得られた。
論文 参考訳(メタデータ) (2021-07-01T17:51:11Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。