論文の概要: Unsupervised Feature Learning with Emergent Data-Driven Prototypicality
- arxiv url: http://arxiv.org/abs/2307.01421v1
- Date: Tue, 4 Jul 2023 01:26:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 18:35:14.062741
- Title: Unsupervised Feature Learning with Emergent Data-Driven Prototypicality
- Title(参考訳): 創発的データ駆動型プロトタイプによる教師なし特徴学習
- Authors: Yunhui Guo, Youren Zhang, Yubei Chen, Stella X. Yu
- Abstract要約: 球状パッキングを用いたハイパーボリック空間における教師なし特徴学習アルゴリズムを提案する。
私たちの重要な洞察は、ユークリッド空間の代わりに双曲型で教師なしの機能学習を行うことです。
画像は結束によって原点に近づき、教師なしの原形質発見の考え方を検証する。
- 参考スコア(独自算出の注目度): 38.063430373194194
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given an image set without any labels, our goal is to train a model that maps
each image to a point in a feature space such that, not only proximity
indicates visual similarity, but where it is located directly encodes how
prototypical the image is according to the dataset.
Our key insight is to perform unsupervised feature learning in hyperbolic
instead of Euclidean space, where the distance between points still reflect
image similarity, and yet we gain additional capacity for representing
prototypicality with the location of the point: The closer it is to the origin,
the more prototypical it is. The latter property is simply emergent from
optimizing the usual metric learning objective: The image similar to many
training instances is best placed at the center of corresponding points in
Euclidean space, but closer to the origin in hyperbolic space.
We propose an unsupervised feature learning algorithm in Hyperbolic space
with sphere pACKing. HACK first generates uniformly packed particles in the
Poincar\'e ball of hyperbolic space and then assigns each image uniquely to
each particle. Images after congealing are regarded more typical of the dataset
it belongs to. With our feature mapper simply trained to spread out training
instances in hyperbolic space, we observe that images move closer to the origin
with congealing, validating our idea of unsupervised prototypicality discovery.
We demonstrate that our data-driven prototypicality provides an easy and
superior unsupervised instance selection to reduce sample complexity, increase
model generalization with atypical instances and robustness with typical ones.
- Abstract(参考訳): ラベルのない画像集合が与えられた場合、我々の目標は、それぞれの画像を特徴空間内の点にマッピングするモデルを訓練することであり、近接が視覚的な類似性を示すだけでなく、その画像がデータセットに従ってどのように原型的であるかを直接エンコードする。
私たちの重要な洞察は、ユークリッド空間ではなく双曲空間で教師なしの機能学習を行うことです。そこでは、点間の距離は依然として画像の類似性を反映しています。
後者の性質は、通常のメートル法学習の目的を最適化することから単純に発せられる: 多くの訓練例に類似したイメージはユークリッド空間の対応する点の中心に配置されるが、双曲空間の原点に近い。
球状パッキングを用いたハイパーボリック空間における教師なし特徴学習アルゴリズムを提案する。
HACKはまず、双曲空間のポインカーボールに一様に充填された粒子を生成し、各粒子にそれぞれの画像を一意に割り当てる。
凝縮後の画像は、そのデータセットのより典型的なものとみなされる。
我々の特徴マッパーは、単に双曲空間のトレーニングインスタンスを広げるように訓練されただけで、画像が結束によって原点に近づくのを観察し、教師なしの原型発見という考え方を検証する。
サンプルの複雑さを低減し、非定型インスタンスによるモデル一般化を増加させ、典型的なインスタンスとの堅牢性を高めるため、データ駆動型プロトティピカリティは簡単で優れた非教師なしインスタンス選択を提供する。
関連論文リスト
- HyperPg -- Prototypical Gaussians on the Hypersphere for Interpretable Deep Learning [2.0599237172837523]
ProtoPNetは、トレーニング画像から既知のプロトタイプ部品を“見た目”で学習し、予測力とケースベースの推論の固有の解釈可能性を組み合わせる。
この研究は、潜在空間の超球面上のガウス分布を利用した新しいプロトタイプ表現であるHyperPgを導入する。
CUB-200-2011とStanford Carsデータセットの実験では、HyperPgNetが他のプロトタイプ学習アーキテクチャより優れていることが示されている。
論文 参考訳(メタデータ) (2024-10-11T15:50:31Z) - Spotlight Attention: Robust Object-Centric Learning With a Spatial
Locality Prior [88.9319150230121]
オブジェクト中心のビジョンは、シーン内のオブジェクトの明示的な表現を構築することを目的としています。
我々は、空間的局所性を最先端のオブジェクト中心視覚モデルに組み込む。
合成および実世界の両方のデータセットにおけるセグメンテーションオブジェクトの大幅な改善が得られた。
論文 参考訳(メタデータ) (2023-05-31T04:35:50Z) - HMSN: Hyperbolic Self-Supervised Learning by Clustering with Ideal
Prototypes [7.665392786787577]
プロトタイプに基づくクラスタリング手法の自己教師付き表現学習には,双曲表現空間を用いる。
我々はMasked Siamese Networksを拡張し、双曲空間のPoincar'eボールモデルで操作する。
従来の手法とは異なり、エンコーダネットワークの出力における双曲空間に投影し、双曲投影ヘッドを利用して、下流タスクに使用される表現が双曲的であることを保証する。
論文 参考訳(メタデータ) (2023-05-18T12:38:40Z) - Unicom: Universal and Compact Representation Learning for Image
Retrieval [65.96296089560421]
大規模LAION400Mを,CLIPモデルにより抽出された共同テキストと視覚的特徴に基づいて,100万の擬似クラスにクラスタリングする。
このような矛盾を緩和するために、我々は、マージンベースのソフトマックス損失を構築するために、ランダムにクラス間の部分的なプロトタイプを選択する。
提案手法は,複数のベンチマークにおいて,教師なし,教師なしの画像検索手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-12T14:25:52Z) - Few-shot Classification with Hypersphere Modeling of Prototypes [45.211350826691856]
メトリックベースのメタ学習は、数ショット学習におけるデファクトスタンダードの1つである。
我々はテンソル場(areas')を用いて幾何学的観点からクラスをモデル化し、数ショットの学習を行う。
ハイパースフィアプロトタイプ(HyperProto)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2022-11-10T03:46:02Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - On Equivariant and Invariant Learning of Object Landmark Representations [36.214069685880986]
実例識別学習と空間識別学習を組み合わせた,シンプルで効果的な手法を開発した。
深層ネットワークが幾何学的および測光的変換に不変であるように訓練されると、その中間層から表現が出現し、物体のランドマークを高い精度で予測できることが示される。
論文 参考訳(メタデータ) (2020-06-26T04:06:56Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。