論文の概要: GazePrior: Zero-Shot AR/VR Eye Tracking via Learned 3D Gaze Reconstruction
- arxiv url: http://arxiv.org/abs/2605.22359v1
- Date: Thu, 21 May 2026 11:54:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.238559
- Title: GazePrior: Zero-Shot AR/VR Eye Tracking via Learned 3D Gaze Reconstruction
- Title(参考訳): GazePrior:学習した3D視線再構成によるゼロショットAR/VR視線追跡
- Authors: Corentin Dumery, David Colmenares, Alexander Fix, Pascal Fua, Ali Behrooz, Jogendra Kundu,
- Abstract要約: 我々は、さまざまなアイデンティティ、視線方向、光設定にわたる人間の目の分布をモデル化する、データ駆動型3Dプリミティブを導入する。
このモデルは、以前のETデバイスで収集された注釈付きデータのスパースインプット3D再構成を可能にする。
提案手法は, 実データ収集の現実性, 多様性, 地道的精度を, 禁止コストを伴わずに, データを合成する。
- 参考スコア(独自算出の注目度): 60.68732444876243
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Eye tracking (ET) is a foundational technology for advanced AR/VR applications. However, training ET models for every new ET device is challenging: real data collection is costly and time-consuming, while existing synthetic data generation methods lack realism. To remove the need for additional data collection while maintaining data quality, we introduce a data-driven 3D prior that models the distribution of human eyes across diverse identities, gaze directions, and light settings. This model, which we coin GazePrior, then enables sparse-input 3D reconstruction of annotated data collected with previous ET devices, which can in turn be rendered from the cameras of any target ET device. Our approach synthesizes data with the realism, diversity and ground-truth accuracy of real data collection without its prohibitive costs. Our experiments demonstrate that ET models trained with our synthesized data outperform previous zero-shot methods, achieving higher accuracy and robustness.
- Abstract(参考訳): アイトラッキング(ET)は、高度なAR/VRアプリケーションのための基礎技術である。
しかし、新しいETデバイスごとにETモデルをトレーニングすることは困難である: 実際のデータ収集はコストと時間を要するが、既存の合成データ生成方法は現実性に欠ける。
データ品質を維持しながら追加のデータ収集の必要性を取り除くため、さまざまなアイデンティティ、視線方向、光設定の人間の目分布をモデル化するデータ駆動型3Dモデルを導入する。
GazePrior を造語したこのモデルは,従来の ET デバイスで収集したアノテートデータのスパースインプット3D再構成を可能にし,任意の ET デバイスのカメラからレンダリングすることができる。
提案手法は, 実データ収集の現実性, 多様性, 地道的精度を, 禁止コストを伴わずに, データを合成する。
実験により, 合成したデータを用いて訓練したETモデルは, 従来のゼロショット法より優れ, 精度とロバスト性が高いことがわかった。
関連論文リスト
- Mirage2Matter: A Physically Grounded Gaussian World Model from Video [87.9732484393686]
我々は、グラフィック駆動の世界モデリングおよびシミュレーションフレームワークであるSimulate Anythingを紹介する。
実世界の環境を3次元ガウススプレイティング(3DGS)による写実的シーン表現に再構築する。
次に、生成モデルを利用して、物理的に現実的な表現を復元し、精度校正ターゲットを介してシミュレーション環境に統合する。
論文 参考訳(メタデータ) (2026-01-24T07:43:57Z) - R3ST: A Synthetic 3D Dataset With Realistic Trajectories [7.7401133539188365]
R3ST(Realistic 3D Synthetic Trajectories)は,現実的な車両運動の欠如を克服する合成データセットである。
提案したデータセットは、合成データとリアルな軌跡のギャップを埋める。
論文 参考訳(メタデータ) (2025-12-18T17:18:45Z) - The Comparability of Model Fusion to Measured Data in Confuser Rejection [0.24578723416255746]
ライブ使用で見られるわずかな偏差を考慮に入れたデータセットは存在しない。
3次元モデル上で合成SARデータを生成するために, シューティング・バウンシング・レイ法を利用したシミュレータが開発されている。
我々は,この品質測定データの欠如に代えて,合成データに基づいて訓練された多くのモデルを統合することを目的としている。
論文 参考訳(メタデータ) (2025-05-01T19:51:30Z) - Drive-1-to-3: Enriching Diffusion Priors for Novel View Synthesis of Real Vehicles [81.29018359825872]
本稿では,実世界の課題に対して,大規模な事前学習モデルを微調整するための一連の優れたプラクティスを統合する。
具体的には,合成データと実運転データとの相違を考慮に入れたいくつかの戦略を開発する。
我々の洞察は、先行芸術よりも新しいビュー合成のためのFIDを68.8%値下げする効果のある微調整につながる。
論文 参考訳(メタデータ) (2024-12-19T03:39:13Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - Multi-Modal Dataset Acquisition for Photometrically Challenging Object [56.30027922063559]
本稿では,3次元視覚タスクにおける現在のデータセットの限界について,精度,サイズ,リアリズム,および光度に挑戦する対象に対する適切な画像モダリティの観点から検討する。
既存の3次元認識と6次元オブジェクトポーズデータセットを強化する新しいアノテーションと取得パイプラインを提案する。
論文 参考訳(メタデータ) (2023-08-21T10:38:32Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - Hands-Up: Leveraging Synthetic Data for Hands-On-Wheel Detection [0.38233569758620045]
この研究は、ドライバモニタリングシステムのトレーニングに合成フォトリアリスティックインキャビンデータを使用することを実証する。
プラットフォームでエラー解析を行い、欠落したエッジケースを生成することで、パフォーマンスが向上することを示す。
これは、人間中心の合成データが現実世界にうまく一般化する能力を示している。
論文 参考訳(メタデータ) (2022-05-31T23:34:12Z) - SimAug: Learning Robust Representations from Simulation for Trajectory
Prediction [78.91518036949918]
本研究では,シミュレーション学習データの拡張により,ロバスト表現を学習する新しい手法を提案する。
我々は,SimAugが実世界の3つのベンチマークで有望な結果を得ることを示す。
論文 参考訳(メタデータ) (2020-04-04T21:22:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。