論文の概要: A Survey on Deep Learning-based Gaze Direction Regression: Searching for the State-of-the-art
- arxiv url: http://arxiv.org/abs/2410.17082v1
- Date: Tue, 22 Oct 2024 15:07:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-23 14:28:41.299483
- Title: A Survey on Deep Learning-based Gaze Direction Regression: Searching for the State-of-the-art
- Title(参考訳): 深層学習に基づく視線方向回帰に関する調査 : 最先端の探索
- Authors: Franko Šikić, Donik Vršnak, Sven Lončarić,
- Abstract要約: 本稿では,頭部・眼像からの視線方向ベクトルの回帰に対する深層学習に基づく手法について検討する。
本稿では、入力データ、モデルのアーキテクチャ、モデルの監視に使用される損失関数に焦点をあてた、多数の公開手法について詳述する。
本稿では、視線方向回帰法を訓練し、評価するために使用できるデータセットのリストを示す。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In this paper, we present a survey of deep learning-based methods for the regression of gaze direction vector from head and eye images. We describe in detail numerous published methods with a focus on the input data, architecture of the model, and loss function used to supervise the model. Additionally, we present a list of datasets that can be used to train and evaluate gaze direction regression methods. Furthermore, we noticed that the results reported in the literature are often not comparable one to another due to differences in the validation or even test subsets used. To address this problem, we re-evaluated several methods on the commonly used in-the-wild Gaze360 dataset using the same validation setup. The experimental results show that the latest methods, although claiming state-of-the-art results, significantly underperform compared with some older methods. Finally, we show that the temporal models outperform the static models under static test conditions.
- Abstract(参考訳): 本稿では,頭と目の画像から視線方向ベクトルを回帰する深層学習に基づく手法について検討する。
本稿では、入力データ、モデルのアーキテクチャ、モデルの監視に使用される損失関数に焦点をあてた、多数の公開手法について詳述する。
さらに、視線方向回帰法を訓練し、評価するために使用できるデータセットのリストも提示する。
さらに、文献で報告された結果が検証やテストサブセットの違いのため、互いに比較できないことが多いことに気付きました。
この問題に対処するため、我々は、同じ検証設定を用いて、一般的に使われているGaz360データセットについて、いくつかの手法を再評価した。
実験の結果,最新の手法は最先端の手法ではあるものの,従来の手法に比べて性能が著しく劣っていることが明らかとなった。
最後に、時間モデルが静的テスト条件下で静的モデルより優れていることを示す。
関連論文リスト
- The Mirrored Influence Hypothesis: Efficient Data Influence Estimation by Harnessing Forward Passes [30.30769701138665]
我々は、訓練データとテストデータの間の相互影響を浮き彫りにして、ミラーレッド影響仮説を導入し、探求する。
具体的には、テスト予測に対するトレーニングデータの影響を評価することは、等価だが逆問題として再定義することができることを示唆している。
トレーニングポイント毎に前方パスとペアを組むことで,特定のテストサンプルの勾配を計算し,トレーニングデータの影響を推定する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-02-14T03:43:05Z) - Projection Regret: Reducing Background Bias for Novelty Detection via
Diffusion Models [72.07462371883501]
本研究では,非意味情報のバイアスを緩和する効率的な新規性検出手法であるemphProjection Regret(PR)を提案する。
PRは、テスト画像とその拡散ベースの投影の間の知覚距離を計算し、異常を検出する。
拡張実験により、PRは生成モデルに基づく新規性検出手法の先行技術よりも有意なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-12-05T09:44:47Z) - Too Good To Be True: performance overestimation in (re)current practices
for Human Activity Recognition [49.1574468325115]
データセグメンテーションのためのスライディングウィンドウと、標準のランダムk倍のクロスバリデーションが続くと、バイアスのある結果が得られる。
この問題に対する科学界の認識を高めることは重要であり、その否定的な影響は見落とされつつある。
異なるタイプのデータセットと異なるタイプの分類モデルを用いたいくつかの実験により、問題を示し、メソッドやデータセットとは独立して持続することを示すことができる。
論文 参考訳(メタデータ) (2023-10-18T13:24:05Z) - How Close are Other Computer Vision Tasks to Deepfake Detection? [42.79190870582115]
教師なしの方法でデータを分離するために,モデルの生容量を評価するための新しい測定手法「モデル分離可能性」を提案する。
分析の結果,事前学習した顔認識モデルは,他のモデルよりもディープフェイク検出と密接な関係があることが判明した。
自己教師型モデルは最高の結果をもたらすが、過度に適合するリスクがある。
論文 参考訳(メタデータ) (2023-10-02T06:32:35Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - Fake It Till You Make It: Near-Distribution Novelty Detection by
Score-Based Generative Models [54.182955830194445]
既存のモデルは、いわゆる"近く分布"設定で失敗するか、劇的な低下に直面します。
本稿では, スコアに基づく生成モデルを用いて, 合成近分布異常データを生成することを提案する。
本手法は,9つのノベルティ検出ベンチマークにおいて,近分布ノベルティ検出を6%改善し,最先端のノベルティ検出を1%から5%パスする。
論文 参考訳(メタデータ) (2022-05-28T02:02:53Z) - Object-centric and memory-guided normality reconstruction for video
anomaly detection [56.64792194894702]
本稿では,ビデオ監視における異常検出問題に対処する。
異常事象の固有な規則性と不均一性のため、問題は正規性モデリング戦略と見なされる。
我々のモデルは、トレーニング中に異常なサンプルを見ることなく、オブジェクト中心の正規パターンを学習する。
論文 参考訳(メタデータ) (2022-03-07T19:28:39Z) - Backpropagated Gradient Representations for Anomaly Detection [19.191613437266184]
異常は、通常のデータと比較して、それらを完全に表現するために、より劇的なモデル更新を必要とする。
本稿では,勾配に基づく表現を用いた提案手法が,ベンチマーク画像認識データセットにおける最先端の異常検出性能を実現することを示す。
論文 参考訳(メタデータ) (2020-07-18T19:39:42Z) - Evaluating the Disentanglement of Deep Generative Models through
Manifold Topology [66.06153115971732]
本稿では,生成モデルのみを用いた乱れの定量化手法を提案する。
複数のデータセットにまたがるいくつかの最先端モデルを実証的に評価する。
論文 参考訳(メタデータ) (2020-06-05T20:54:11Z) - Classification-Based Anomaly Detection for General Data [37.31168012111834]
我々は統一的な視点を示し、現在の仮定を緩和するオープンセット手法であるGOADを提案する。
我々は、ランダムアフィン変換を用いた非画像データへの変換に基づく手法の適用性を拡張する。
提案手法は最先端の精度を示し, 広範データ型に適用可能である。
論文 参考訳(メタデータ) (2020-05-05T17:44:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。