Fugu-MT 論文翻訳(概要): Pose-Guided Self-Training with Two-Stage Clustering for Unsupervised Landmark Discovery

論文の概要: Pose-Guided Self-Training with Two-Stage Clustering for Unsupervised Landmark Discovery

arxiv url: http://arxiv.org/abs/2403.16194v1
Date: Sun, 24 Mar 2024 15:24:04 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-26 17:06:13.249644
Title: Pose-Guided Self-Training with Two-Stage Clustering for Unsupervised Landmark Discovery
Title（参考訳）: 教師なしランドマーク発見のための2段階クラスタリングによるPose-Guided Self-Training
Authors: Siddharth Tourani, Ahmed Alwheibi, Arif Mahmood, Muhammad Haris Khan,
Abstract要約: オブジェクトカテゴリの教師なしランドマーク発見(ULD)は、コンピュータビジョンの問題である。堅牢な ULD フレームワークの開発を追求するために,拡散モデルとして知られる,近年の自己教師型学習アルゴリズムの可能性を探る。提案手法は, AFLW, MAFL, CatHeads, LS3Dの4つの挑戦的ベンチマークにおいて, 最先端の手法を著しく上回っている。
参考スコア（独自算出の注目度）: 17.455841673719625
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Unsupervised landmarks discovery (ULD) for an object category is a challenging computer vision problem. In pursuit of developing a robust ULD framework, we explore the potential of a recent paradigm of self-supervised learning algorithms, known as diffusion models. Some recent works have shown that these models implicitly contain important correspondence cues. Towards harnessing the potential of diffusion models for the ULD task, we make the following core contributions. First, we propose a ZeroShot ULD baseline based on simple clustering of random pixel locations with nearest neighbour matching. It delivers better results than existing ULD methods. Second, motivated by the ZeroShot performance, we develop a ULD algorithm based on diffusion features using self-training and clustering which also outperforms prior methods by notable margins. Third, we introduce a new proxy task based on generating latent pose codes and also propose a two-stage clustering mechanism to facilitate effective pseudo-labeling, resulting in a significant performance improvement. Overall, our approach consistently outperforms state-of-the-art methods on four challenging benchmarks AFLW, MAFL, CatHeads and LS3D by significant margins.
Abstract（参考訳）: オブジェクトカテゴリの教師なしランドマーク発見(ULD)は、コンピュータビジョンの問題である。堅牢な ULD フレームワークの開発を追求するために,拡散モデルとして知られる,近年の自己教師型学習アルゴリズムの可能性を探る。近年の研究では、これらのモデルに重要な対応手段が暗黙的に含まれていることが示されている。 ULDタスクの拡散モデルの可能性を活用するため、以下のコアコントリビューションを行う。まず,近接する近傍マッチングを持つランダムな画素位置の単純なクラスタリングに基づくZeroShot ULDベースラインを提案する。既存のUDDメソッドよりも優れた結果を提供する。第2に、ZeroShotのパフォーマンスを動機として、自己学習とクラスタリングによる拡散特性に基づくUDDアルゴリズムを開発し、先行手法を顕著なマージンで上回っている。第3に、潜在ポーズコードの生成に基づく新しいプロキシタスクを導入し、効果的な擬似ラベル作成を容易にするための2段階クラスタリング機構を提案する。全体として、我々のアプローチはAFLW、MAFL、CatHeads、LS3Dの4つの挑戦的なベンチマークにおいて、最先端の手法よりも大幅に優れています。

関連論文リスト

Self-Enhanced Image Clustering with Cross-Modal Semantic Consistency [57.961869351897384]
効率的な画像クラスタリングのためのクロスモーダルなセマンティック一貫性に基づくフレームワークを提案する。当社のフレームワークはまず,クロスモーダルセマンティック一貫性を通じて,強力な基盤を構築します。最初の段階では、トレーニング済みモデルのリッチなセマンティクスに合わせて、軽量クラスタリングヘッドをトレーニングします。第2段階では、自己強化微調整戦略を導入する。
論文参考訳（メタデータ） (2025-08-02T08:12:57Z)
Dual-Center Graph Clustering with Neighbor Distribution [48.904324854543894]
本稿では,隣接分布特性に基づく新しいDual-Center Graph Clustering (DCGC) 手法を提案する。提案手法は,近傍分布を用いた表現学習と重心最適化を含む。
論文参考訳（メタデータ） (2025-07-18T09:17:04Z)
Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文参考訳（メタデータ） (2023-07-07T04:03:48Z)
Rethinking Clustering-Based Pseudo-Labeling for Unsupervised Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文参考訳（メタデータ） (2022-09-27T19:04:36Z)
Unsupervised Learning on 3D Point Clouds by Clustering and Contrasting [11.64827192421785]
教師なし表現学習は、人間の介入なしに機能を自動抽出するための有望な方向である。本稿では、ポイントワイドおよびグローバルな特徴の学習を行うために、textbfConClu という、一般的な教師なしアプローチを提案する。
論文参考訳（メタデータ） (2022-02-05T12:54:17Z)
Deep Attention-guided Graph Clustering with Dual Self-supervision [49.040136530379094]
デュアル・セルフ・スーパービジョン(DAGC)を用いたディープアテンション誘導グラフクラスタリング法を提案する。我々は,三重項Kulback-Leibler分散損失を持つソフトな自己スーパービジョン戦略と,擬似的な監督損失を持つハードな自己スーパービジョン戦略からなる二重自己スーパービジョンソリューションを開発する。提案手法は6つのベンチマークデータセットにおける最先端の手法より一貫して優れている。
論文参考訳（メタデータ） (2021-11-10T06:53:03Z)
Light Field Saliency Detection with Dual Local Graph Learning andReciprocative Guidance [148.9832328803202]
我々は、グラフネットワークを介して焦点スタック内のインフォメーション融合をモデル化する。我々は、全焦点パタンを用いて焦点スタック融合過程をガイドする新しいデュアルグラフモデルを構築した。
論文参考訳（メタデータ） (2021-10-02T00:54:39Z)
Learning Robust Representation for Clustering through Locality Preserving Variational Discriminative Network [16.259673823482665]
Variational Deep Embeddingは、さまざまなクラスタリングタスクで大きな成功を収めます。 VaDEは,1)入力ノイズに弱い,2)隣接するデータポイント間の局所性情報を無視する,という2つの問題に悩まされている。強固な埋め込み判別器と局所構造制約によりvadeを改善する共同学習フレームワークを提案する。
論文参考訳（メタデータ） (2020-12-25T02:31:55Z)
PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文参考訳（メタデータ） (2020-12-18T18:06:43Z)
An unsupervised deep learning framework via integrated optimization of representation learning and GMM-based modeling [31.334196673143257]
本稿では,ディープ表現とGMMに基づくディープモデリングの両面において,共同学習の新たな原則を提案する。類似分野の既存の作業と比較すると、目的関数は2つの学習目標を持ち、共同で最適化されるように作成される。クラスタ間距離を小さくすることでクラスタのコンパクト性を著しく向上し、クラスタ間距離を増大させることで分離性を向上させる。
論文参考訳（メタデータ） (2020-09-11T04:57:03Z)
Learning to Cluster Faces via Confidence and Connectivity Estimation [136.5291151775236]
重複する部分グラフを多数必要とせず,完全に学習可能なクラスタリングフレームワークを提案する。提案手法はクラスタリングの精度を大幅に向上させ,その上で訓練した認識モデルの性能を向上させるが,既存の教師付き手法に比べて桁違いに効率的である。
論文参考訳（メタデータ） (2020-04-01T13:39:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。