論文の概要: Contrastive Weighted Learning for Near-Infrared Gaze Estimation
- arxiv url: http://arxiv.org/abs/2211.03073v1
- Date: Sun, 6 Nov 2022 10:03:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 16:09:28.875360
- Title: Contrastive Weighted Learning for Near-Infrared Gaze Estimation
- Title(参考訳): 近赤外視線推定のためのコントラスト重み学習
- Authors: Adam Lee
- Abstract要約: コントラスト学習を用いた近赤外画像による視線推定のための新しいフレームワークであるGazeCWLを提案する。
我々のモデルは、赤外線画像に基づく視線推定において、以前の領域一般化モデルよりも優れている。
- 参考スコア(独自算出の注目度): 0.228438857884398
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Appearance-based gaze estimation has been very successful with the use of
deep learning. Many following works improved domain generalization for gaze
estimation. However, even though there has been much progress in domain
generalization for gaze estimation, most of the recent work have been focused
on cross-dataset performance -- accounting for different distributions in
illuminations, head pose, and lighting. Although improving gaze estimation in
different distributions of RGB images is important, near-infrared image based
gaze estimation is also critical for gaze estimation in dark settings. Also
there are inherent limitations relying solely on supervised learning for
regression tasks. This paper contributes to solving these problems and proposes
GazeCWL, a novel framework for gaze estimation with near-infrared images using
contrastive learning. This leverages adversarial attack techniques for data
augmentation and a novel contrastive loss function specifically for regression
tasks that effectively clusters the features of different samples in the latent
space. Our model outperforms previous domain generalization models in infrared
image based gaze estimation and outperforms the baseline by 45.6\% while
improving the state-of-the-art by 8.6\%, we demonstrate the efficacy of our
method.
- Abstract(参考訳): 外観に基づく視線推定は、ディープラーニングを用いて非常に成功した。
以下の多くの研究は、視線推定のための領域一般化を改善した。
しかしながら、視線推定のための領域一般化の進展は多いが、最近の研究の多くは、照度、ヘッドポーズ、照明の異なる分布を考慮した、クロスデータセットのパフォーマンスに焦点を当てている。
RGB画像の異なる分布における視線推定の改善は重要であるが、近赤外画像に基づく視線推定は暗黒環境での視線推定にも重要である。
また、回帰タスクの教師付き学習のみに依存する固有の制限もある。
本稿では,これらの問題の解決に寄与し,コントラスト学習を用いた近赤外画像による視線推定のための新しいフレームワークであるGazeCWLを提案する。
これは、データ拡張のための逆攻撃技術と、潜在空間で異なるサンプルの特徴を効果的にクラスタ化する回帰タスクに特化した新しいコントラスト損失関数を利用する。
我々のモデルは、赤外線画像に基づく視線推定における従来の領域一般化モデルより優れ、ベースラインは45.6\%、最先端は8.6\%、提案手法の有効性を実証する。
関連論文リスト
- Data Augmentation via Latent Diffusion for Saliency Prediction [67.88936624546076]
残差予測モデルはラベル付きデータの限られた多様性と量によって制約される。
本研究では,実世界のシーンの複雑さと変動性を保ちながら,自然画像の編集を行うディープ・サリエンシ・予測のための新しいデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2024-09-11T14:36:24Z) - Improving Neural Surface Reconstruction with Feature Priors from Multi-View Image [87.00660347447494]
ニューラルサーフェス・コンストラクション(NSR)の最近の進歩は、ボリュームレンダリングと組み合わせることで、マルチビュー・コンストラクションを著しく改善している。
本稿では,多種多様な視覚的タスクから価値ある特徴を活用すべく,特徴レベルの一貫した損失について検討する。
DTU と EPFL を用いて解析した結果,画像マッチングと多視点ステレオデータセットによる特徴が,他のプリテキストタスクよりも優れていたことが判明した。
論文 参考訳(メタデータ) (2024-08-04T16:09:46Z) - Semi-supervised Contrastive Regression for Estimation of Eye Gaze [0.609170287691728]
本稿では、視線方向推定のための半教師付きコントラスト学習フレームワークを開発する。
小さなラベル付きガゼデータセットにより、このフレームワークは、目に見えない顔画像であっても、一般化されたソリューションを見つけることができる。
コントラスト回帰フレームワークは, 視線推定に用いられているいくつかの手法と比較して, 優れた性能を示す。
論文 参考訳(メタデータ) (2023-08-05T04:11:38Z) - 3DGazeNet: Generalizing Gaze Estimation with Weak-Supervision from
Synthetic Views [67.00931529296788]
本稿では,適応を伴わない新しい環境に直接適用可能な一般的な視線推定モデルを訓練することを提案する。
視覚的擬似アノテーションを用いた多彩な顔の大規模データセットを作成し、シーンの3次元形状に基づいて抽出する。
本研究では,本手法を視線一般化タスクにおいて検証し,真理データが得られない場合の最先端技術と比較して最大30%の改善を実証する。
論文 参考訳(メタデータ) (2022-12-06T14:15:17Z) - Jitter Does Matter: Adapting Gaze Estimation to New Domains [12.482427155726413]
本稿では、視線領域適応タスクの分析と最適化に、視線ジッタを活用することを提案する。
高周波成分(HFC)がジッタに繋がる重要な因子であることがわかった。
我々は、オリジナルのデータと摂動データの間に類似した表現を得るようモデルに促すために、対照的な学習を採用する。
論文 参考訳(メタデータ) (2022-10-05T08:20:41Z) - Wild ToFu: Improving Range and Quality of Indirect Time-of-Flight Depth
with RGB Fusion in Challenging Environments [56.306567220448684]
本稿では,ノイズの多い生のI-ToF信号とRGB画像を用いた学習に基づくエンド・ツー・エンドの深度予測ネットワークを提案する。
最終深度マップでは,ベースラインアプローチと比較して40%以上のRMSE改善が見られた。
論文 参考訳(メタデータ) (2021-12-07T15:04:14Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Non-Convex Tensor Low-Rank Approximation for Infrared Small Target
Detection [32.67489082946838]
赤外線小目標検出は、多くの赤外線システムにおいて重要な役割を果たす。
ほとんどの低ランク手法は、異なる特異値を不正確な背景推定に割り当てる。
この小さな赤外線ターゲット検出アルゴリズムに対して,非ネイティブ空間近似(NTLA)を提案する。
論文 参考訳(メタデータ) (2021-05-31T14:04:58Z) - Perceptual Loss for Robust Unsupervised Homography Estimation [1.2891210250935146]
BiHomEは、ソース視点からの歪んだ画像とターゲット視点からの対応する画像との間の特徴空間における距離を最小化する。
我々は、biHomEが合成COCOデータセットの最先端のパフォーマンスを達成することを示しています。
論文 参考訳(メタデータ) (2021-04-20T14:41:54Z) - Vulnerability of Appearance-based Gaze Estimation [16.0559382707645]
外観に基づく視線推定は深層学習による大幅な改善を達成した。
本稿では,外観に基づく視線推定の脆弱性について検討する。
そこで,CA-Netは,4つの人気視線推定ネットワークにおいて,攻撃に対する優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2021-03-24T12:19:59Z) - Monte Carlo Dropout Ensembles for Robust Illumination Estimation [94.14796147340041]
計算カラー一貫性(Computational Color Constancy)は、多くのカメラシステムで使用される前処理ステップである。
出力の不確実性に応じて異なる深層学習手法を集約することを提案する。
提案したフレームワークはINTEL-TAUデータセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-07-20T13:56:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。