論文の概要: Jamais Vu: Exposing the Generalization Gap in Supervised Semantic Correspondence
- arxiv url: http://arxiv.org/abs/2506.08220v1
- Date: Mon, 09 Jun 2025 20:40:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 15:11:40.753361
- Title: Jamais Vu: Exposing the Generalization Gap in Supervised Semantic Correspondence
- Title(参考訳): Jamais Vu: 監視されたセマンティック対応で一般化ギャップを露呈する
- Authors: Octave Mariotti, Zhipeng Du, Yash Bhalgat, Oisin Mac Aodha, Hakan Bilen,
- Abstract要約: 単眼深度推定を用いて2次元鍵点を正準3次元空間に昇降させることにより高密度対応を学習するための新しい手法を提案する。
本手法は, オブジェクト形状を明示的な3次元監視やカメラアノテーションを必要とせず, 連続カノニカル多様体を構成する。
- 参考スコア(独自算出の注目度): 37.26437707181298
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Semantic correspondence (SC) aims to establish semantically meaningful matches across different instances of an object category. We illustrate how recent supervised SC methods remain limited in their ability to generalize beyond sparsely annotated training keypoints, effectively acting as keypoint detectors. To address this, we propose a novel approach for learning dense correspondences by lifting 2D keypoints into a canonical 3D space using monocular depth estimation. Our method constructs a continuous canonical manifold that captures object geometry without requiring explicit 3D supervision or camera annotations. Additionally, we introduce SPair-U, an extension of SPair-71k with novel keypoint annotations, to better assess generalization. Experiments not only demonstrate that our model significantly outperforms supervised baselines on unseen keypoints, highlighting its effectiveness in learning robust correspondences, but that unsupervised baselines outperform supervised counterparts when generalized across different datasets.
- Abstract(参考訳): 意味対応(SC)は、オブジェクトカテゴリの異なるインスタンス間で意味的に意味のあるマッチングを確立することを目的としている。
本稿では,近年の教師付きSC法がキーポイント検出器として有効に機能する,希少な注釈付きトレーニングキーポイントを超えて一般化する能力に制限を課していることを示す。
そこで本研究では, 単眼深度推定を用いて2次元鍵点を標準3次元空間に引き上げることにより, 密接な対応を学習するための新しい手法を提案する。
本手法は, オブジェクト形状を明示的な3次元監視やカメラアノテーションを必要とせず, 連続カノニカル多様体を構成する。
さらに,SPair-71kに新しいキーポイントアノテーションを付加したSPair-Uを導入し,一般化をよりよく評価する。
実験によって、我々のモデルは教師なしのキーポイントにおいて、教師なしのベースラインを著しく上回り、堅牢な対応を学習する上での有効性を強調するだけでなく、教師なしのベースラインは、異なるデータセットにまたがって一般化されたとき、教師なしのベースラインよりも優れていることを示した。
関連論文リスト
- Do It Yourself: Learning Semantic Correspondence from Pseudo-Labels [69.58063088519852]
本稿では,3D対応の擬似ラベルを用いた意味対応推定法を提案する。
具体的には, 3D-aware chaining を用いて得られた擬似ラベルを用いて, 既製の特徴を洗練するためのアダプタを訓練する。
データセット固有のアノテーションの必要性を減らしながら、SPair-71kに新たな最先端を4%以上の絶対的なゲインに設定しました。
論文 参考訳(メタデータ) (2025-06-05T17:54:33Z) - Imputation-free and Alignment-free: Incomplete Multi-view Clustering Driven by Consensus Semantic Learning [65.75756724642932]
不完全なマルチビュークラスタリングでは、欠落したデータがビュー内のプロトタイプシフトとビュー間のセマンティック不整合を誘導する。
コンセンサスセマンティクス学習(FreeCSL)のためのIMVCフレームワークを提案する。
FreeCSLは、最先端の競合他社と比較して、IMVCタスクの信頼性と堅牢な割り当てを実現している。
論文 参考訳(メタデータ) (2025-05-16T12:37:10Z) - Improving Semantic Correspondence with Viewpoint-Guided Spherical Maps [39.00415825387414]
そこで本研究では, 識別的特徴を3次元的理解で補う意味対応推定手法を提案する。
より複雑な3Dパイプラインと比較して、我々のモデルは弱い視点情報しか必要とせず、球面表現の単純さにより、トレーニング中に情報的幾何学的先行情報をモデルに注入することができる。
本研究では,SPair-71kデータセットを用いて,複数のオブジェクトカテゴリにまたがる対称なビューと繰り返し部分の区別が可能であることを実証した。
論文 参考訳(メタデータ) (2023-12-20T17:35:24Z) - Beyond Prototypes: Semantic Anchor Regularization for Better
Representation Learning [82.29761875805369]
表現学習の最終的な目標の1つは、クラス内のコンパクトさとクラス間の十分な分離性を達成することである。
本稿では,機能セントロイドとして機能する事前定義されたクラスアンカーを用いて,特徴学習を一方向ガイドする新しい視点を提案する。
提案したSemantic Anchor Regularization (SAR) は,既存モデルのプラグアンドプレイ方式で使用することができる。
論文 参考訳(メタデータ) (2023-12-19T05:52:38Z) - Unsupervised 3D Keypoint Discovery with Multi-View Geometry [104.76006413355485]
本研究では,多視点画像から人体上の3Dキーポイントを,監督やラベルなしで発見するアルゴリズムを提案する。
我々の手法は、他の最先端の教師なしアプローチと比較して、より解釈可能で正確な3Dキーポイントを発見する。
論文 参考訳(メタデータ) (2022-11-23T10:25:12Z) - Unsupervised Learning of 3D Semantic Keypoints with Mutual
Reconstruction [11.164069907549756]
3Dセマンティックキーポイントは、3Dオブジェクト上のカテゴリレベルのセマンティック一貫性ポイントである。
点群から一貫した意味的キーポイントを明示的に生成するための教師なし手法を提案する。
我々の知る限り,提案手法は相互再構成の観点から初めて3次元意味的一貫したキーポイントを抽出するものである。
論文 参考訳(メタデータ) (2022-03-19T01:49:21Z) - Unsupervised Learning on 3D Point Clouds by Clustering and Contrasting [11.64827192421785]
教師なし表現学習は、人間の介入なしに機能を自動抽出するための有望な方向である。
本稿では、ポイントワイドおよびグローバルな特徴の学習を行うために、textbfConClu という、一般的な教師なしアプローチを提案する。
論文 参考訳(メタデータ) (2022-02-05T12:54:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。