論文の概要: Identifying Fixation and Saccades in Virtual Reality
- arxiv url: http://arxiv.org/abs/2205.04121v1
- Date: Mon, 9 May 2022 08:40:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-10 20:30:43.253563
- Title: Identifying Fixation and Saccades in Virtual Reality
- Title(参考訳): 仮想現実における固定とサッカードの同定
- Authors: Xiao-lin Chen and Wen-jun Hou
- Abstract要約: 仮想現実環境の3次元特性は、既存の認識アルゴリズムに新たな課題をもたらす。
Ve-Threshold Identification, Dispersion-Threshold Identification, Velocity & Dispersion-Threshold Identificationを最適パラメータと比較した。
その結果,修正したVelocity & Dispersion-Threshold Identificationが最良であることがわかった。
- 参考スコア(独自算出の注目度): 2.045796882831387
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Gaze recognition can significantly reduce the amount of eye movement data for
a better understanding of cognitive and visual processing. Gaze recognition is
an essential precondition for eye-based interaction applications in virtual
reality. However, the three-dimensional characteristics of virtual reality
environments also pose new challenges to existing recognition algorithms. Based
on seven evaluation metrics and the Overall score (the mean of the seven
normalized metric values), we obtain optimal parameters of three existing
recognition algorithms (Velocity-Threshold Identification, Dispersion-Threshold
Identification, and Velocity & Dispersion-Threshold Identification) and our
modified Velocity & Dispersion-Threshold Identification algorithm. We compare
the performance of these four algorithms with optimal parameters. The results
show that our modified Velocity & Dispersion-Threshold Identification performs
the best. The impact of interface complexity on classification results is also
preliminarily explored. The results show that the algorithms are not sensitive
to interface complexity.
- Abstract(参考訳): 視線認識は、認知および視覚処理をよりよく理解するために、眼球運動データ量を大幅に削減することができる。
視線認識は、仮想現実における視線に基づくインタラクションアプリケーションにとって必須の前提条件である。
しかし、仮想現実環境の3次元特性は、既存の認識アルゴリズムにも新たな課題をもたらす。
7つの評価指標と総合スコア(7つの正規化基準値の平均値)に基づいて、3つの既存の認識アルゴリズム(Velocity-Threshold Identification、Dispersion-Threshold Identification、Velocity & Dispersion-Threshold Identification)と修正Velocity & Dispersion-Threshold Identificationアルゴリズムの最適パラメータを求める。
これら4つのアルゴリズムの性能を最適パラメータと比較する。
その結果,修正したVelocity & Dispersion-Threshold Identificationが最良であることがわかった。
インタフェースの複雑さが分類結果に与える影響も事前に検討されている。
その結果,アルゴリズムはインタフェースの複雑さに敏感ではないことがわかった。
関連論文リスト
- Multi-threshold Deep Metric Learning for Facial Expression Recognition [60.26967776920412]
本稿では,難易度検証を回避する多閾値深度学習手法を提案する。
その結果,三重項損失のそれぞれの閾値は本質的にクラス間変動の特異な分布を決定することがわかった。
埋め込み層はスライスで構成されており、より情報的で差別的な特徴である。
論文 参考訳(メタデータ) (2024-06-24T08:27:31Z) - An Enhanced Low-Resolution Image Recognition Method for Traffic
Environments [3.018656336329545]
低解像度の画像は、小さなサイズ、低い品質、詳細さの欠如に悩まされ、従来のニューラルネットワーク認識アルゴリズムの精度が低下する。
本稿では、残差ネットワークの基本構造と共通特徴部分空間アルゴリズムを利用する二重分岐残差ネットワーク構造を提案する。
低解像度画像認識の精度を高めるために、中間層特徴の利用を取り入れている。
論文 参考訳(メタデータ) (2023-09-28T12:38:31Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - SHREC 2022 Track on Online Detection of Heterogeneous Gestures [11.447098172408111]
本稿では,3Dハンドポーズのシーケンスからヘテロジニアスなジェスチャーをオンライン認識する方法を評価するために組織されたコンテストの結果について述べる。
データセットは、ジェスチャーが重要でない動きとインターリーブされた手追跡データの連続的なシーケンスを特徴としている。
この評価は、検出性能だけでなく、レイテンシや偽陽性にも基づき、実用的な対話ツールの実現可能性を理解することができる。
論文 参考訳(メタデータ) (2022-07-14T07:24:02Z) - Homogeneous Low-Resolution Face Recognition Method based Correlation
Features [3.747737951407512]
監視ビデオと画像の低解像度特徴は、高解像度の顔認識アルゴリズムが効果的な特徴情報を抽出することを困難にしている。
密集都市化の時代には、セキュリティ監視における顔認証がますます重要になるため、低解像度監視カメラが生み出す映像フレームの処理に十分な性能を発揮できるアルゴリズムを開発することが不可欠である。
本稿では,同種低分解能監視ビデオの相関特徴に基づく顔認識(CoFFaR)手法について,その理論,実験の詳細,実験結果について詳しく述べる。
論文 参考訳(メタデータ) (2021-11-25T17:11:52Z) - Research on facial expression recognition based on Multimodal data
fusion and neural network [2.5431493111705943]
このアルゴリズムはマルチモーダルデータに基づいており、顔画像、画像の方向勾配のヒストグラム、顔のランドマークを入力とする。
実験結果から, マルチモーダルデータの相補性により, 精度, 堅牢性, 検出速度が大幅に向上したことがわかった。
論文 参考訳(メタデータ) (2021-09-26T23:45:40Z) - Progressive Spatio-Temporal Bilinear Network with Monte Carlo Dropout
for Landmark-based Facial Expression Recognition with Uncertainty Estimation [93.73198973454944]
提案手法の性能は, 広く使用されている3つのデータセットで評価される。
ビデオベースの最先端の手法に匹敵するが、複雑さははるかに少ない。
論文 参考訳(メタデータ) (2021-06-08T13:40:30Z) - Feeling of Presence Maximization: mmWave-Enabled Virtual Reality Meets
Deep Reinforcement Learning [76.46530937296066]
本稿では,無線モバイルユーザに対して,超信頼性でエネルギー効率のよいバーチャルリアリティ(VR)体験を提供するという課題について検討する。
モバイルユーザへの信頼性の高い超高精細ビデオフレーム配信を実現するために,コーディネートマルチポイント(CoMP)伝送技術とミリ波(mmWave)通信を利用する。
論文 参考訳(メタデータ) (2021-06-03T08:35:10Z) - Hierarchical Deep CNN Feature Set-Based Representation Learning for
Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。
既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。
本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文 参考訳(メタデータ) (2021-03-25T14:03:42Z) - Generalized Iris Presentation Attack Detection Algorithm under
Cross-Database Settings [63.90855798947425]
プレゼンテーションアタックは、バイオメトリックなモダリティの大部分に大きな課題をもたらす。
本稿では,汎用的な深層学習に基づくプレゼンテーション攻撃検出ネットワークであるMVANetを提案する。
これはハイブリッドアルゴリズムの単純さと成功、あるいは複数の検出ネットワークの融合にインスパイアされている。
論文 参考訳(メタデータ) (2020-10-25T22:42:27Z) - Unconstrained Periocular Recognition: Using Generative Deep Learning
Frameworks for Attribute Normalization [2.5288257442251107]
本稿では,ディープラーニング生成フレームワークに基づく属性正規化戦略を提案する。
これは、識別性を低下させることなく、ペア比較で使用されるサンプルの変動を減少させる。
実験は2つの異なるデータセットで実施された。
論文 参考訳(メタデータ) (2020-02-10T17:55:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。