論文の概要: Predicting User Grasp Intentions in Virtual Reality
- arxiv url: http://arxiv.org/abs/2508.16582v1
- Date: Tue, 05 Aug 2025 15:17:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-31 21:54:20.562113
- Title: Predicting User Grasp Intentions in Virtual Reality
- Title(参考訳): 仮想現実におけるユーザグラフインテンションの予測
- Authors: Linghao Zeng,
- Abstract要約: 対象の種類,サイズ,操作の異なる810の試験において,分類と回帰のアプローチを評価した。
回帰ベースのアプローチはより堅牢なパフォーマンスを示し、タイミングエラーは0.25秒以内、距離エラーは5~20cm程度である。
私たちの結果は、VRインタラクションを強化する機械学習モデルの可能性を強調します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting user intentions in virtual reality (VR) is crucial for creating immersive experiences, particularly in tasks involving complex grasping motions where accurate haptic feedback is essential. In this work, we leverage time-series data from hand movements to evaluate both classification and regression approaches across 810 trials with varied object types, sizes, and manipulations. Our findings reveal that classification models struggle to generalize across users, leading to inconsistent performance. In contrast, regression-based approaches, particularly those using Long Short Term Memory (LSTM) networks, demonstrate more robust performance, with timing errors within 0.25 seconds and distance errors around 5-20 cm in the critical two-second window before a grasp. Despite these improvements, predicting precise hand postures remains challenging. Through a comprehensive analysis of user variability and model interpretability, we explore why certain models fail and how regression models better accommodate the dynamic and complex nature of user behavior in VR. Our results underscore the potential of machine learning models to enhance VR interactions, particularly through adaptive haptic feedback, and lay the groundwork for future advancements in real-time prediction of user actions in VR.
- Abstract(参考訳): 仮想現実(VR)におけるユーザ意図の予測は没入感のある体験、特に正確な触覚フィードバックが不可欠である複雑な把握動作を含むタスクに不可欠である。
本研究では,手の動きの時系列データを利用して,物体の種類,サイズ,操作の異なる810の試行において,分類と回帰の両方のアプローチを評価する。
分析の結果,分類モデルはユーザ間での一般化に苦慮し,不整合性能に繋がることがわかった。
対照的に、回帰ベースのアプローチ、特にLong Short Term Memory (LSTM) ネットワークを使用するアプローチは、時間誤差が0.25秒以内で、時間誤差が5~20cm程度で、グリップ前のクリティカルな2秒のウィンドウでより堅牢な性能を示す。
これらの改善にもかかわらず、正確な手の位置を予測することは依然として困難である。
ユーザの多様性とモデルの解釈可能性に関する包括的な分析を通じて、特定のモデルが失敗し、レグレッションモデルがVRにおけるユーザの振る舞いの動的で複雑な性質にどのように適合するかを考察する。
この結果は,特に適応的な触覚フィードバックを通じて,VRにおけるユーザ行動のリアルタイム予測における今後の進歩の基盤となる,VRインタラクションを強化する機械学習モデルの可能性を強調した。
関連論文リスト
- From Seeing to Experiencing: Scaling Navigation Foundation Models with Reinforcement Learning [59.88543114325153]
本稿では,航法基礎モデルの強化学習能力を高めるためのSeeing-to-Experiencingフレームワークを提案する。
S2Eは、ビデオの事前トレーニングとRLによるポストトレーニングの長所を組み合わせたものだ。
実世界のシーンを3DGSで再現した3D画像に基づく総合的なエンドツーエンド評価ベンチマークであるNavBench-GSを構築した。
論文 参考訳(メタデータ) (2025-07-29T17:26:10Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [78.18946529195254]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - Towards Consumer-Grade Cybersickness Prediction: Multi-Model Alignment for Real-Time Vision-Only Inference [3.4667973471411853]
サイバーシックネスは没入型バーチャルリアリティ(VR)の普及の大きな障害である
我々は、パーソナライズされたサイバーシックネス予測のためのスケーラブルでデプロイ可能なフレームワークを提案する。
当社のフレームワークは,コンシューマレベルのVRプラットフォームとの統合に理想的なリアルタイムアプリケーションをサポートしています。
論文 参考訳(メタデータ) (2025-01-02T11:41:43Z) - Self-Avatar Animation in Virtual Reality: Impact of Motion Signals Artifacts on the Full-Body Pose Reconstruction [13.422686350235615]
本研究の目的は,自己アバターのフルボディポーズの再現に対する影響を計測することである。
テキストYOLOv8のポーズ推定から推定した3次元動画像と3次元動画像座標を用いて動画像再構成誤差を解析する。
論文 参考訳(メタデータ) (2024-04-29T12:02:06Z) - Scaling Up Dynamic Human-Scene Interaction Modeling [58.032368564071895]
TRUMANSは、現在利用可能な最も包括的なモーションキャプチャーHSIデータセットである。
人体全体の動きや部分レベルの物体の動きを複雑に捉えます。
本研究では,任意の長さのHSI配列を効率的に生成する拡散型自己回帰モデルを提案する。
論文 参考訳(メタデータ) (2024-03-13T15:45:04Z) - Toward Optimized VR/AR Ergonomics: Modeling and Predicting User Neck
Muscle Contraction [21.654553113159665]
頭を動かして仮想環境と対話しながら,VRユーザの頸部筋収縮レベル(MCL)を測定し,モデル化し,予測する。
種々の頭部運動状態下での頚部MCLを予測するための生体物理モデルを構築した。
この研究は、VR/ARおよびインタラクティブグラフィックスアプリケーションのための新しいエルゴノミクス中心のデザインを動機付けることを願っている。
論文 参考訳(メタデータ) (2023-08-28T18:58:01Z) - Force-Aware Interface via Electromyography for Natural VR/AR Interaction [69.1332992637271]
我々はVR/ARにおける自然的および直感的な力入力のための学習ベースのニューラルネットワークを設計する。
我々は,3.3%の平均誤差で指の力量をリアルタイムでデコードし,キャリブレーションの少ない新規ユーザに一般化できることを実証した。
今後のVR/ARにおける、より現実的な物理性に向けた研究を進めるために、我々の研究成果を期待する。
論文 参考訳(メタデータ) (2022-10-03T20:51:25Z) - Short-Term Trajectory Prediction for Full-Immersive Multiuser Virtual
Reality with Redirected Walking [6.622115542749609]
完全没入型マルチユーザーバーチャルリアリティ(VR)は、仮想世界のユーザの制約のないモビリティをサポートすることを想定している。
RNN ファミリーの別の候補である Gated Recurrent Unit (GRU) ネットワークは、一般的に従来の LSTM よりも優れていることを示す。
第2に、仮想世界からのコンテキストは、追加の入力機能として使用すれば、予測の精度を高めることができることを示す。
論文 参考訳(メタデータ) (2022-07-15T15:09:07Z) - On the Real-World Adversarial Robustness of Real-Time Semantic
Segmentation Models for Autonomous Driving [59.33715889581687]
現実世界の敵対的な例(通常はパッチの形で)の存在は、安全クリティカルなコンピュータビジョンタスクにおけるディープラーニングモデルの使用に深刻な脅威をもたらす。
本稿では,異なる種類の対立パッチを攻撃した場合のセマンティックセグメンテーションモデルのロバスト性を評価する。
画素の誤分類を誘導する攻撃者の能力を改善するために, 新たな損失関数を提案する。
論文 参考訳(メタデータ) (2022-01-05T22:33:43Z) - Social NCE: Contrastive Learning of Socially-aware Motion
Representations [87.82126838588279]
実験結果から, 提案手法は最近の軌道予測, 行動クローニング, 強化学習アルゴリズムの衝突速度を劇的に低減することがわかった。
本手法は,ニューラルネットワークの設計に関する仮定をほとんど示さないため,神経運動モデルのロバスト性を促進する汎用的手法として使用できる。
論文 参考訳(メタデータ) (2020-12-21T22:25:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。