論文の概要: On Equivariant and Invariant Learning of Object Landmark Representations
- arxiv url: http://arxiv.org/abs/2006.14787v2
- Date: Fri, 2 Apr 2021 20:23:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 21:48:11.793219
- Title: On Equivariant and Invariant Learning of Object Landmark Representations
- Title(参考訳): オブジェクトランドマーク表現の同変および不変学習について
- Authors: Zezhou Cheng, Jong-Chyi Su, Subhransu Maji
- Abstract要約: 実例識別学習と空間識別学習を組み合わせた,シンプルで効果的な手法を開発した。
深層ネットワークが幾何学的および測光的変換に不変であるように訓練されると、その中間層から表現が出現し、物体のランドマークを高い精度で予測できることが示される。
- 参考スコア(独自算出の注目度): 36.214069685880986
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given a collection of images, humans are able to discover landmarks by
modeling the shared geometric structure across instances. This idea of
geometric equivariance has been widely used for the unsupervised discovery of
object landmark representations. In this paper, we develop a simple and
effective approach by combining instance-discriminative and
spatially-discriminative contrastive learning. We show that when a deep network
is trained to be invariant to geometric and photometric transformations,
representations emerge from its intermediate layers that are highly predictive
of object landmarks. Stacking these across layers in a "hypercolumn" and
projecting them using spatially-contrastive learning further improves their
performance on matching and few-shot landmark regression tasks. We also present
a unified view of existing equivariant and invariant representation learning
approaches through the lens of contrastive learning, shedding light on the
nature of invariances learned. Experiments on standard benchmarks for landmark
learning, as well as a new challenging one we propose, show that the proposed
approach surpasses prior state-of-the-art.
- Abstract(参考訳): 画像の集合が与えられたら、人間はインスタンス間で共有される幾何学構造をモデル化することでランドマークを発見することができる。
この幾何学的等式の概念は、対象のランドマーク表現の教師なし発見に広く用いられている。
本稿では,インスタンス識別学習と空間識別学習を組み合わせた簡易かつ効果的な手法を提案する。
深層ネットワークが幾何学的および測光的変換に不変であるように訓練されると、その中間層から表現が出現し、オブジェクトのランドマークを非常に予測する。
これらのレイヤを"ハイパーカラム"に積み重ねて、空間的コントラスト学習を使ってプロジェクションすることで、マッチングと少数ショットのランドマークのレグレッションタスクのパフォーマンスがさらに向上する。
また,既存の同変および不変表現学習のアプローチをコントラスト学習のレンズを通して統一し,学習した不変性の性質に光を当てる。
ランドマーク学習の標準ベンチマークに関する実験と,提案する新たな課題は,提案手法が先行する最先端技術を超えていることを示すものである。
関連論文リスト
- Current Symmetry Group Equivariant Convolution Frameworks for Representation Learning [5.802794302956837]
ユークリッドの深層学習はしばしば、表現空間が不規則で複雑な位相で湾曲した実世界の信号に対処するのに不十分である。
我々は、対称性群同変深層学習モデルの重要性と、グラフや3次元形状、非ユークリッド空間における畳み込みのような操作の実現に焦点を当てる。
論文 参考訳(メタデータ) (2024-09-11T15:07:18Z) - Object-centric architectures enable efficient causal representation
learning [51.6196391784561]
観測対象が複数の物体である場合, 生成関数はもはや注入的ではなく, 実際に乱れは生じないことを示す。
スパース摂動からの弱い監督を利用して各オブジェクトのプロパティを乱すオブジェクト中心アーキテクチャを開発する。
このアプローチはユークリッド空間にエンコードする同等のアプローチよりもはるかに少ない摂動を必要とするという意味で、よりデータ効率が高い。
論文 参考訳(メタデータ) (2023-10-29T16:01:03Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Leveraging Equivariant Features for Absolute Pose Regression [9.30597356471664]
変換と回転の同変である畳み込みニューラルネットワークは,カメラの動きの表現を直接特徴空間に誘導することを示す。
次に、この幾何学的性質により、画像平面保存変換の全グループの下でトレーニングデータを暗黙的に増大させることができることを示す。
論文 参考訳(メタデータ) (2022-04-05T12:44:20Z) - Fusing Local Similarities for Retrieval-based 3D Orientation Estimation
of Unseen Objects [70.49392581592089]
我々は,モノクロ画像から未確認物体の3次元配向を推定する作業に取り組む。
我々は検索ベースの戦略に従い、ネットワークがオブジェクト固有の特徴を学習するのを防ぐ。
また,LineMOD,LineMOD-Occluded,T-LESSのデータセットを用いた実験により,本手法が従来の手法よりもはるかに優れた一般化をもたらすことが示された。
論文 参考訳(メタデータ) (2022-03-16T08:53:00Z) - Digging Into Self-Supervised Learning of Feature Descriptors [14.47046413243358]
強力な機能記述子に繋がる一連の改善を提案する。
強負の採鉱において, 対面内からバッチ内への探索空間の増大が一貫した改善をもたらすことを示す。
合成ホモグラフィ変換,色強調,フォトリアリスティック画像スタイリングの組み合わせが有用であることを示す。
論文 参考訳(メタデータ) (2021-10-10T12:22:44Z) - Geometry-Aware Self-Training for Unsupervised Domain Adaptationon Object
Point Clouds [36.49322708074682]
本稿では,オブジェクトポイントクラウド分類の教師なし領域適応のためのジオメトリ・アウェア・セルフトレーニング(GAST)を提案する。
具体的には,2つの自己監督型幾何学的学習タスクを特徴正規化として,意味カテゴリーのドメイン共有表現を学習することを目的とする。
一方、データセット間の多様な点分布は、新しい曲率認識歪みの局所化によって正規化することができる。
論文 参考訳(メタデータ) (2021-08-20T13:29:11Z) - Instance Similarity Learning for Unsupervised Feature Representation [83.31011038813459]
教師なし特徴表現のための例類似性学習(ISL)手法を提案する。
我々はGAN(Generative Adversarial Networks)を用いて、基礎となる特徴多様体をマイニングする。
画像分類実験は, 最先端手法と比較して, 提案手法の優位性を示した。
論文 参考訳(メタデータ) (2021-08-05T16:42:06Z) - Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-04-07T05:42:11Z) - Quadric hypersurface intersection for manifold learning in feature space [52.83976795260532]
適度な高次元と大きなデータセットに適した多様体学習技術。
この手法は、二次超曲面の交点という形で訓練データから学習される。
テスト時、この多様体は任意の新しい点に対する外れ値スコアを導入するのに使うことができる。
論文 参考訳(メタデータ) (2021-02-11T18:52:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。