論文の概要: See Through the Noise: Improving Domain Generalization in Gaze Estimation
- arxiv url: http://arxiv.org/abs/2604.16562v1
- Date: Fri, 17 Apr 2026 09:23:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.073256
- Title: See Through the Noise: Improving Domain Generalization in Gaze Estimation
- Title(参考訳): 騒音を通して見る:注視推定における領域一般化の改善
- Authors: Yanming Peng, Shijing Wang, Yaping Huang, Yi Tian,
- Abstract要約: 一般化可能な視線推定法は、現実の応用において重要な重要性から注目が集まっている。
彼らはしばしば、正確な注視アノテーションを取得することの難しさから生じるラベルノイズの影響を見落としている。
本稿では,SeeTN(SeeeTN)フレームワークという新しい手法を提案する。
- 参考スコア(独自算出の注目度): 20.857116511986153
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generalizable gaze estimation methods have garnered increasing attention due to their critical importance in real-world applications and have achieved significant progress. However, they often overlook the effect of label noise, arising from the inherent difficulty of acquiring precise gaze annotations, on model generalization performance. In this paper, we are the first to comprehensively investigate the negative effects of label noise on generalization in gaze estimation. Further, we propose a novel solution, called See-Through-Noise (SeeTN) framework, which improves generalization from a novel perspective of mitigating label noise. Specifically, we propose to construct a semantic embedding space via a prototype-based transformation to preserve a consistent topological structure between gaze features and continuous labels. We then measure feature-label affinity consistency to distinguish noisy from clean samples, and introduce a novel affinity regularization in the semantic manifold to transfer gaze-related information from clean to noisy samples. Our proposed SeeTN promotes semantic structure alignment and enforces domain-invariant gaze relationships, thereby enhancing robustness against label noise. Extensive experiments demonstrate that our SeeTN effectively mitigates the adverse impact of source-domain noise, leading to superior cross-domain generalization without compromising the source-domain accuracy, and highlight the importance of explicitly handling noise in generalized gaze estimation.
- Abstract(参考訳): 一般化可能な視線推定法は、現実の応用において重要な重要性から注目され、大きな進歩を遂げた。
しかし、正確な注視アノテーションを取得することの難しさから生じるラベルノイズがモデル一般化性能に与える影響をしばしば見落としている。
本稿では,ラベルノイズが視線推定における一般化に与える影響を包括的に調査する。
さらに、ラベルノイズを緩和する新しい視点から一般化を改善する、See-Through-Noise (SeeTN) フレームワークを提案する。
具体的には,目視特徴と連続ラベル間の一貫した位相構造を維持するために,プロトタイプベースの変換を用いて意味埋め込み空間を構築することを提案する。
次に、特徴ラベル親和性一貫性を測定して、クリーンサンプルとノイズを区別し、セマンティック多様体に新しい親和性正規化を導入し、クリーンサンプルからノイズサンプルへ視線関連情報を転送する。
提案するSeeTNは,意味構造アライメントを促進し,ドメイン不変の視線関係を強制することにより,ラベルノイズに対する堅牢性を高める。
広汎な実験により、SeeTNはソースドメインノイズの悪影響を効果的に軽減し、ソースドメインの精度を損なうことなくクロスドメインの一般化を実現し、一般化された視線推定においてノイズを明示的に扱うことの重要性を強調した。
関連論文リスト
- Combating Noisy Labels through Fostering Self- and Neighbor-Consistency [120.4394402099635]
ラベルノイズは様々な現実世界のシナリオで広まり、教師付きディープラーニングの課題を提起する。
我々は、Jo-SNC(textbfSelf- と textbfNeighbor-textbfConsistency に基づくサンプル選択とモデル正規化)というノイズロバスト手法を提案する。
我々は、クラスごとの選択閾値を調整するための自己適応型データ駆動しきい値設定方式を設計する。
論文 参考訳(メタデータ) (2026-01-19T07:55:29Z) - Mitigating the Noise Shift for Denoising Generative Models via Noise Awareness Guidance [54.88271057438763]
ノイズアウェアネスガイダンス (NAG) は、事前に定義された騒音スケジュールと整合性を保つために、サンプリング軌道を明示的に制御する補正手法である。
NAGは一貫してノイズシフトを緩和し、主流拡散モデルの生成品質を大幅に改善する。
論文 参考訳(メタデータ) (2025-10-14T13:31:34Z) - Robust Prompt Tuning for Vision-Language Models with Mild Semantic Noise [9.536089523962486]
本稿では弱いセマンティックノイズを積極的に組み込んだ堅牢なプロンプトチューニングフレームワークであるANPromptを提案する。
我々は、ANPromptが既存のプロンプトチューニング手法より一貫して優れていることを示す。
セマンティックノイズに対して優れたロバスト性を提供し、タスク間の一般化を改善している。
論文 参考訳(メタデータ) (2025-08-06T17:42:30Z) - Nested Graph Pseudo-Label Refinement for Noisy Label Domain Adaptation Learning [26.926061463569567]
Nested Graph Pseudo-Label Refinement (NeGPR)は、ノイズラベルによるグラフレベルのドメイン適応に適した、新しいフレームワークである。
NeGPRは、厳密なラベルノイズ下での最先端の手法を一貫して上回り、最大12.7%の精度を達成している。
論文 参考訳(メタデータ) (2025-08-01T15:32:40Z) - Modeling State Shifting via Local-Global Distillation for Event-Frame Gaze Tracking [61.44701715285463]
本稿では,イベントデータとフレームデータの両方を用いた受動的視線推定の問題に取り組む。
我々は、現在の状態からいくつかの事前登録されたアンカー状態に移行する状態の定量化として、視線推定を再構成する。
大規模視線推定ネットワークを直接学習する代わりに,地域の専門家グループと学生ネットワークを連携させることにより,一般化能力の向上を図る。
論文 参考訳(メタデータ) (2024-03-31T03:30:37Z) - Feature Noise Boosts DNN Generalization under Label Noise [65.36889005555669]
トレーニングデータにおけるラベルノイズの存在は、ディープニューラルネットワーク(DNN)の一般化に大きな影響を与える
本研究では,学習データの特徴に直接ノイズを付加する単純な特徴雑音法を,理論的に導入し,理論的に実証する。
論文 参考訳(メタデータ) (2023-08-03T08:31:31Z) - Calibrating Undisciplined Over-Smoothing in Transformer for Weakly Supervised Semantic Segmentation [51.14107156747967]
弱教師付きセマンティックセマンティックセマンティクス(WSSS)は、完全な教師付きアプローチよりもアノテーションが少ないため、かなりの注目を集めている。
本研究では,非学際的な過密化に対する深い注意を抑えるための適応的再活性化機構 (AReAM) を提案する。
AReAMは既存のWSSS手法と比較してセグメンテーション性能を大幅に改善し、ノイズを低減し、関連するセマンティック領域に焦点を絞る。
論文 参考訳(メタデータ) (2023-05-04T19:11:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。