論文の概要: Semi-Supervised Gaze Estimation via Disentangled Subspace Contrastive Learning
- arxiv url: http://arxiv.org/abs/2605.27080v1
- Date: Tue, 26 May 2026 14:31:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.224966
- Title: Semi-Supervised Gaze Estimation via Disentangled Subspace Contrastive Learning
- Title(参考訳): アンタングル付き部分空間コントラスト学習による半教師付き迷路推定
- Authors: Qida Tan, Hongyu Yang, Wenchao Du,
- Abstract要約: 出現に基づく視線推定は、注釈付きサンプルが限られ、データセットの多様性が不十分なため、常に一般化に苦しむ。
先行するアプローチでは、制約のない現実世界のシナリオから大規模な擬似ラベル付きデータを生成するために、弱教師付き学習を採用する。
我々は、ラベルのないデータを活用してドメインの一般化を促進する、シンプルで効果的な半教師付き学習アーキテクチャを考案する。
- 参考スコア(独自算出の注目度): 20.422491630669885
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Appearance-based gaze estimation always suffers from poor generalization due to limited annotated samples and insufficient dataset diversity. Leading approaches adopt weakly supervised learning to generate large-scale pseudo-labeled data from unconstrained real-world scenarios, aiming to mitigate the domain shifts. In this work, we devise a simple yet effective semi-supervised learning architecture that leverages unlabeled data to enhance domain generalization, thereby reducing reliance on labor-intensive manual annotations. Our key insight is to impose Jacobian regularization to disentangle feature representations into discriminative subspaces dedicated to specific gaze components, such as pitch and yaw angles. We further exploit the intrinsic ordinal ranking within each subspace for contrastive learning, enabling the model to learn robust gaze representations from a small set of labeled samples and an abundance of unlabeled ones. This ultimately yields our Disentangled Subspace Contrastive Learning (DSCL) framework. Extensive experiments on multiple benchmarks verify that the proposed DSCL is plug-and-play, achieving competitive performance using only 20\%, 10\%, and even 5\% of the annotated data under both in-domain and cross-domain evaluation settings. The public code is available at \href{https://github.com/da60266/DSCL}{https://github.com/da60266/DSCL}.
- Abstract(参考訳): 出現に基づく視線推定は、注釈付きサンプルが限られ、データセットの多様性が不十分なため、常に一般化に苦しむ。
先行するアプローチでは、弱い教師付き学習を採用して、制約のない現実のシナリオから大規模な擬似ラベル付きデータを生成し、ドメインシフトを緩和する。
本研究では、ラベルのないデータを活用し、ドメインの一般化を強化し、労働集約的なマニュアルアノテーションへの依存を減らすための、シンプルで効果的な半教師付き学習アーキテクチャを考案する。
私たちのキーとなる洞察は、ヤコビアン正規化(Jacobian regularization)によって特徴表現を、ピッチやヤウ角のような特定の視線成分に特化した識別的部分空間に分解することである。
さらに,各部分空間内における内在的順序付けをコントラスト学習に活用し,ラベル付きサンプルの小さな集合とラベルなしサンプルの豊富な集合から頑健な視線表現を学習することを可能にする。
これにより、最終的にDisentangled Subspace Contrastive Learning(DSCL)フレームワークが得られます。
複数のベンチマークでの大規模な実験により、提案されたDSCLがプラグイン・アンド・プレイであることを検証し、ドメイン内およびクロスドメイン評価設定の両方で、アノテーション付きデータのわずか20%、10%、さらには5倍の競合性能を達成した。
公開コードは \href{https://github.com/da60266/DSCL}{https://github.com/da60266/DSCL} で公開されている。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Virtual Category Learning: A Semi-Supervised Learning Method for Dense
Prediction with Extremely Limited Labels [63.16824565919966]
本稿では,ラベルの修正を伴わずに,混乱したサンプルを積極的に使用することを提案する。
仮想カテゴリー(VC)は、モデルの最適化に安全に貢献できるように、各混乱したサンプルに割り当てられる。
私たちの興味深い発見は、密集した視覚タスクにおけるVC学習の利用に注目しています。
論文 参考訳(メタデータ) (2023-12-02T16:23:52Z) - Instance Adaptive Prototypical Contrastive Embedding for Generalized
Zero Shot Learning [11.720039414872296]
一般的なゼロショット学習は、トレーニング中に目に見えないラベルがアクセスできないと仮定して、目に見えないラベルと見えないラベルからサンプルを分類することを目的としている。
GZSLの最近の進歩は、生成ネットワークにコントラッシブラーニングベースの埋め込みを組み込むことによって、加速している。
論文 参考訳(メタデータ) (2023-09-13T14:26:03Z) - Chaos to Order: A Label Propagation Perspective on Source-Free Domain
Adaptation [8.27771856472078]
我々は、ソースフリードメイン適応(SFDA)のための新しいアプローチであるChaos to Order(CtO)を提示する。
CtOは、セマンティックな信頼性を制約し、ターゲットのサブポピュレーション間でラベル情報を伝達する。
実証的な証拠は、CtOが3つの公開ベンチマークで芸術の状態を上回っていることを示している。
論文 参考訳(メタデータ) (2023-01-20T03:39:35Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Learning to Count in the Crowd from Limited Labeled Data [109.2954525909007]
我々は,限られた数のラベル付きサンプルから参加者を数えることを学ぶことで,アノテーションの努力を減らすことに重点を置いている。
具体的には,未ラベルデータに対する擬似地下真理推定を含むガウス過程に基づく反復学習機構を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:17:01Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。