論文の概要: Comparison of Data Representations and Machine Learning Architectures
for User Identification on Arbitrary Motion Sequences
- arxiv url: http://arxiv.org/abs/2210.00527v1
- Date: Sun, 2 Oct 2022 14:12:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 17:30:02.902332
- Title: Comparison of Data Representations and Machine Learning Architectures
for User Identification on Arbitrary Motion Sequences
- Title(参考訳): 任意動作系列におけるユーザ識別のためのデータ表現と機械学習アーキテクチャの比較
- Authors: Christian Schell, Andreas Hotho, Marc Erich Latoschik
- Abstract要約: 本稿では,頭部と手の動きの任意のシーケンスに基づいて,異なる機械学習手法を用いてユーザを識別する。
すべてのコードを公開して、将来の作業のベースラインを提供しています。
このモデルは、150秒以内の精度で、34人の被験者のどれかを正確に識別する。
- 参考スコア(独自算出の注目度): 8.967985264567217
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Reliable and robust user identification and authentication are important and
often necessary requirements for many digital services. It becomes paramount in
social virtual reality (VR) to ensure trust, specifically in digital encounters
with lifelike realistic-looking avatars as faithful replications of real
persons. Recent research has shown great interest in providing new solutions
that verify the identity of extended reality (XR) systems. This paper compares
different machine learning approaches to identify users based on arbitrary
sequences of head and hand movements, a data stream provided by the majority of
today's XR systems. We compare three different potential representations of the
motion data from heads and hands (scene-relative, body-relative, and
body-relative velocities), and by comparing the performances of five different
machine learning architectures (random forest, multilayer perceptron, fully
recurrent neural network, long-short term memory, gated recurrent unit). We use
the publicly available dataset "Talking with Hands" and publish all our code to
allow reproducibility and to provide baselines for future work. After
hyperparameter optimization, the combination of a long-short term memory
architecture and body-relative data outperformed competing combinations: the
model correctly identifies any of the 34 subjects with an accuracy of 100\%
within 150 seconds. The code for models, training and evaluation is made
publicly available. Altogether, our approach provides an effective foundation
for behaviometric-based identification and authentication to guide researchers
and practitioners.
- Abstract(参考訳): 信頼性が高く堅牢なユーザ識別と認証は、多くのデジタルサービスにとって重要かつ必要な要件である。
ソーシャルバーチャルリアリティ(VR)において最重要であり、特に現実的な現実的なアバターのようなリアルな人物の忠実な複製としてのデジタル出会いにおいて、信頼を確保する。
最近の研究は、拡張現実(XR)システムの同一性を検証する新しいソリューションを提供することに大きな関心を示している。
本稿では,現在のxrシステムの大部分が提供するデータストリームである頭と手の動きの任意のシーケンスに基づいて,ユーザを識別するためのさまざまな機械学習手法を比較する。
頭と手の動きデータ(シーン相対性,体相対性,体相対速度)の3つのポテンシャル表現を比較し,5つの機械学習アーキテクチャ(ランダムフォレスト,多層パーセプトロン,フルリカレントニューラルネットワーク,長時間記憶,ゲートリカレントユニット)のパフォーマンスを比較した。
公開データセット“Talking with Hands”を使用して、再現性を確保し、将来の作業のベースラインを提供するために、すべてのコードを公開しています。
ハイパーパラメータ最適化の後、長期記憶アーキテクチャと身体関連データの組み合わせは競合する組み合わせよりも優れており、モデルは150秒以内に精度100\%の34人のどれかを正確に識別する。
モデル、トレーニング、評価のコードは公開されています。
また,本手法は,研究者や実践者を支援するために,行動計測に基づく識別と認証のための効果的な基盤を提供する。
関連論文リスト
- SDFR: Synthetic Data for Face Recognition Competition [51.9134406629509]
大規模な顔認識データセットは、インターネットをクロールして個人の同意なしに収集し、法的、倫理的、プライバシー上の懸念を提起する。
近年、ウェブクローリングされた顔認識データセットにおける懸念を軽減するために、合成顔認識データセットの生成が提案されている。
本稿では,第18回IEEE International Conference on Automatic Face and Gesture Recognition (FG 2024)と共同で開催されているSynthetic Data for Face Recognition (SDFR)コンペティションの概要を紹介する。
SDFRコンペティションは2つのタスクに分けられ、参加者は新しい合成データセットまたは/または既存のデータセットを使用して顔認識システムを訓練することができる。
論文 参考訳(メタデータ) (2024-04-06T10:30:31Z) - Efficient Gesture Recognition on Spiking Convolutional Networks Through
Sensor Fusion of Event-Based and Depth Data [1.474723404975345]
本研究は,ジェスチャー認識のためのイベントおよび深度データを処理するスパイキング畳み込みニューラルネットワークを提案する。
このネットワークは、オープンソースのニューロモルフィックコンピューティングフレームワークLAVAを用いて、組込みシステム上でのオフライントレーニングと評価をシミュレートする。
論文 参考訳(メタデータ) (2024-01-30T14:42:35Z) - DNA-Rendering: A Diverse Neural Actor Repository for High-Fidelity
Human-centric Rendering [126.00165445599764]
ニューラルアクターレンダリングのための人間のパフォーマンスデータの大規模かつ高忠実なリポジトリであるDNAレンダリングを提案する。
我々のデータセットには、1500人以上の被験者、5000のモーションシーケンス、67.5Mのフレームのデータボリュームが含まれています。
我々は,最大解像度4096 x 3000の60個の同期カメラと15fpsの速度,ステルカメラキャリブレーションステップを含む,データをキャプチャするプロフェッショナルなマルチビューシステムを構築した。
論文 参考訳(メタデータ) (2023-07-19T17:58:03Z) - Dialogue-Contextualized Re-ranking for Medical History-Taking [5.039849340960835]
本稿では,第1段階の質問候補を再ランク付けすることで,トレーニングと推論のギャップを埋める2段階の再ランク付け手法を提案する。
専門家システムと比較して,提案するトランスフォーマーバックボーンを用いたグローバルリランカにより,最高の性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-04-04T17:31:32Z) - Versatile User Identification in Extended Reality using Pretrained Similarity-Learning [16.356961801884562]
類似性学習モデルを開発し、“Who Is Alyx?”データセットで事前学習する。
従来の分類学習ベースラインと比較して,本モデルは優れた性能を示す。
本手法は,実運用XRシステムにおける事前学習した動きに基づく識別モデルの容易な統合方法である。
論文 参考訳(メタデータ) (2023-02-15T08:26:24Z) - NEVIS'22: A Stream of 100 Tasks Sampled from 30 Years of Computer Vision
Research [96.53307645791179]
我々は,100以上の視覚的分類タスクのストリームからなるベンチマークであるNever-Ending VIsual-classification Stream (NEVIS'22)を紹介する。
分類に制限されているにもかかわらず、OCR、テクスチャ分析、シーン認識など、様々なタスクが生成される。
NEVIS'22は、タスクの規模と多様性のために、現在のシーケンシャルな学習アプローチに対して前例のない課題を提起している。
論文 参考訳(メタデータ) (2022-11-15T18:57:46Z) - A Comparative Study of Data Augmentation Techniques for Deep Learning
Based Emotion Recognition [11.928873764689458]
感情認識のための一般的なディープラーニングアプローチを包括的に評価する。
音声信号の長距離依存性が感情認識に重要であることを示す。
スピード/レート向上は、モデル間で最も堅牢なパフォーマンス向上を提供する。
論文 参考訳(メタデータ) (2022-11-09T17:27:03Z) - Facial Emotion Recognition using Deep Residual Networks in Real-World
Environments [5.834678345946704]
そこで本研究では,Wild内および大規模に収集されたビデオデータセットに基づいて訓練された顔特徴抽出モデルを提案する。
データセットは100万のラベル付きフレームと2,616万の被験者で構成されている。
感情認識領域において時間情報は重要であるため、LSTM細胞を用いてデータの時間的ダイナミクスを捉える。
論文 参考訳(メタデータ) (2021-11-04T10:08:22Z) - Semantics-aware Adaptive Knowledge Distillation for Sensor-to-Vision
Action Recognition [131.6328804788164]
本稿では,視覚・センサ・モダリティ(動画)における行動認識を強化するためのフレームワーク,Semantics-Aware Adaptive Knowledge Distillation Networks (SAKDN)を提案する。
SAKDNは複数のウェアラブルセンサーを教師のモダリティとして使用し、RGB動画を学生のモダリティとして使用している。
論文 参考訳(メタデータ) (2020-09-01T03:38:31Z) - ResNeSt: Split-Attention Networks [86.25490825631763]
このアーキテクチャは、異なるネットワークブランチにチャンネルワイズを応用し、機能間相互作用のキャプチャと多様な表現の学習の成功を活用する。
我々のモデルはResNeStと呼ばれ、画像分類の精度と遅延トレードオフにおいてEfficientNetより優れています。
論文 参考訳(メタデータ) (2020-04-19T20:40:31Z) - Deep Learning for Person Re-identification: A Survey and Outlook [233.36948173686602]
人物再識別(Re-ID)は、複数の重複しないカメラを通して興味ある人物を検索することを目的としている。
人物のRe-IDシステム開発に関わるコンポーネントを分離することにより、それをクローズドワールドとオープンワールドのセッティングに分類する。
論文 参考訳(メタデータ) (2020-01-13T12:49:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。