論文の概要: FOVAL: Calibration-Free and Subject-Invariant Fixation Depth Estimation Across Diverse Eye-Tracking Datasets
- arxiv url: http://arxiv.org/abs/2408.03591v2
- Date: Fri, 19 Sep 2025 14:02:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:10.754142
- Title: FOVAL: Calibration-Free and Subject-Invariant Fixation Depth Estimation Across Diverse Eye-Tracking Datasets
- Title(参考訳): FOVAL: 眼球追跡データセット間の校正自由度および被写体不変量固定深さ推定
- Authors: Benedikt W. Hosp,
- Abstract要約: 深度推定に対するロバストなキャリブレーションフリーアプローチであるFOVALを導入する。
変換器、時空間ネットワーク(TCN)、CNNと比較して、FOVALは優れた性能を発揮する。
LOOCV(Leave-One-Out Cross-Validation)とクロスデータセットバリデーション(cross-dataset Validation)を用いた3つのベンチマークデータセットに対する評価は、平均絶対誤差(MAE)が9.1cmであり、キャリブレーションなしでの強い一般化を示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate fixation depth estimation is essential for applications in extended reality (XR), robotics, and human-computer interaction. However, current methods heavily depend on user-specific calibration, which limits their scalability and usability. We introduce FOVAL, a robust calibration-free approach that combines spatiotemporal sequence modelling via Long Short-Term Memory (LSTM) networks with subject-invariant feature engineering and normalisation. Compared to Transformers, Temporal Convolutional Networks (TCNs), and CNNs, FOVAL achieves superior performance, particularly in scenarios with limited and noisy gaze data. Evaluations across three benchmark datasets using Leave-One-Out Cross-Validation (LOOCV) and cross-dataset validation show a mean absolute error (MAE) of 9.1 cm and strong generalisation without calibration. We further analyse inter-subject variability and domain shifts, providing insight into model robustness and adaptation. FOVAL's scalability and accuracy make it highly suitable for real-world deployment.
- Abstract(参考訳): 正確な固定深度推定は、拡張現実(XR)、ロボット工学、人間とコンピュータの相互作用における応用に不可欠である。
しかし、現在の手法はユーザ固有のキャリブレーションに大きく依存しており、スケーラビリティとユーザビリティを制限している。
本稿では,LSTM(Long Short-Term Memory)ネットワークによる時空間シーケンスモデリングと,主観的不変な特徴工学と正規化を組み合わせた,ロバストなキャリブレーションフリーアプローチであるFOVALを紹介する。
Transformers, Temporal Convolutional Networks (TCNs) や CNN と比較して,FOVAL は特に限られたノイズの多い視線データを持つシナリオにおいて,優れたパフォーマンスを実現している。
LOOCV(Leave-One-Out Cross-Validation)とクロスデータセットバリデーション(cross-dataset Validation)を用いた3つのベンチマークデータセットに対する評価は、平均絶対誤差(MAE)が9.1cmであり、キャリブレーションなしでの強い一般化を示している。
さらに、オブジェクト間の変動性とドメインシフトを分析し、モデルの堅牢性と適応性に関する洞察を提供する。
FOVALのスケーラビリティと精度は、現実世界のデプロイメントに非常に適している。
関連論文リスト
- Continual Action Quality Assessment via Adaptive Manifold-Aligned Graph Regularization [53.82400605816587]
アクション品質アセスメント(AQA)は、ビデオにおける人間の行動を定量化し、スポーツスコアリング、リハビリテーション、スキル評価の応用を支援する。
大きな課題は、現実世界のシナリオにおける品質分布の非定常的な性質にある。
本稿では,進化する分布を扱うための連続学習機能を備えた連続AQA(Continuous AQA)を紹介する。
論文 参考訳(メタデータ) (2025-10-08T10:09:47Z) - Analysis of Transferability Estimation Metrics for Surgical Phase Recognition [3.3285108719932555]
微調整された事前学習モデルは現代の機械学習の基盤となり、限られたラベル付きデータで実践者がハイパフォーマンスを達成できるようになった。
専門的アノテーションが特に時間がかかり費用がかかる外科的ビデオ解析では、下流タスクに最適な事前学習モデルを特定することが重要かつ困難である。
我々は,2つの多様なデータセット上で,LogME,H-Score,TransRateの3つの代表的な指標の総合ベンチマークを行った。
論文 参考訳(メタデータ) (2025-08-22T18:05:33Z) - Foundation Feature-Driven Online End-Effector Pose Estimation: A Marker-Free and Learning-Free Approach [4.132336580197184]
本研究は,機能駆動型オンライン・エンド・エフェクト・オア・ポース推定アルゴリズムを提案する。
トレーニング不要の方法で、ロボットとエンドエフェクターをまたいで一般化する。
実験は、その優れた柔軟性、一般化、パフォーマンスを示します。
論文 参考訳(メタデータ) (2025-03-18T09:12:49Z) - Active Alignments of Lens Systems with Reinforcement Learning [0.0]
センサ出力の画素空間内でのみ学習する強化学習(RL)手法を提案する。
我々は、広範囲にわたるベンチマーク研究を行い、我々のアプローチが、速度、精度、堅牢性において他の手法を超えることを示す。
論文 参考訳(メタデータ) (2025-03-03T21:57:08Z) - What Really Matters for Learning-based LiDAR-Camera Calibration [50.2608502974106]
本稿では,学習に基づくLiDAR-Cameraキャリブレーションの開発を再考する。
我々は、広く使われているデータ生成パイプラインによる回帰ベースの手法の限界を識別する。
また,入力データ形式と前処理操作がネットワーク性能に与える影響についても検討する。
論文 参考訳(メタデータ) (2025-01-28T14:12:32Z) - SONNET: Enhancing Time Delay Estimation by Leveraging Simulated Audio [17.811771707446926]
学習に基づく手法は、合成データにもとづいても、新しい実世界のデータに基づいてGCC-PHATを著しく上回り得ることを示す。
トレーニングされたモデルであるSONNETは、リアルタイムに実行可能で、多くの実データアプリケーションのために、最初から新しいデータに取り組んでいます。
論文 参考訳(メタデータ) (2024-11-20T10:23:21Z) - Consistency Calibration: Improving Uncertainty Calibration via Consistency among Perturbed Neighbors [22.39558434131574]
モデルキャリブレーションの代替視点として一貫性の概念を導入する。
本稿では,入力間の一貫性に基づいて信頼度を調整する,一貫性(CC)と呼ばれるポストホックキャリブレーション手法を提案する。
また,ロジットレベルでの摂動は計算効率を著しく向上させることを示した。
論文 参考訳(メタデータ) (2024-10-16T06:55:02Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Scalable Numerical Embeddings for Multivariate Time Series: Enhancing Healthcare Data Representation Learning [6.635084843592727]
独立トークンとして各特徴値を扱う新しいフレームワークであるSCANEを提案する。
SCANEは、異なる機能埋め込みの特性を正規化し、スケーラブルな埋め込みメカニズムを通じて表現学習を強化する。
本研究は,MTSの精度の高い予測出力を実現するために,nUMerical eMbeddIng Transformer (SUMMIT) を開発した。
論文 参考訳(メタデータ) (2024-05-26T13:06:45Z) - PLATE: A perception-latency aware estimator, [0.46040036610482665]
知覚遅延認識型エストリメータ(PLATE)
PLATEは、特定のパフォーマンス指標を最適化するために、異なるタイミングで異なる知覚構成を使用する。
他のフレームスキッピング技術と比較して、PLATEは形式的な複雑さと最適性解析を持つ。
論文 参考訳(メタデータ) (2024-01-24T17:04:18Z) - Uncertainty Guided Adaptive Warping for Robust and Efficient Stereo
Matching [77.133400999703]
相関に基づくステレオマッチングは優れた性能を達成した。
固定モデルによる現在のメソッドは、さまざまなデータセットで均一に動作しない。
本稿では,ロバストなステレオマッチングのための相関を動的に計算する新しい視点を提案する。
論文 参考訳(メタデータ) (2023-07-26T09:47:37Z) - Deep Reinforcement Learning Based System for Intraoperative
Hyperspectral Video Autofocusing [2.476200036182773]
この研究は、焦点調整可能な液体レンズをビデオHSIエクソスコープに統合する。
現実的で再現可能なテストデータセットを作成するために、第一種ロボット焦点時間スキャンが実施された。
論文 参考訳(メタデータ) (2023-07-21T15:04:21Z) - EasyHeC: Accurate and Automatic Hand-eye Calibration via Differentiable
Rendering and Space Exploration [49.90228618894857]
我々は、マーカーレスでホワイトボックスであり、より優れた精度とロバスト性を提供するEasyHeCと呼ばれる手眼校正の新しいアプローチを導入する。
我々は,2つの重要な技術 – レンダリングベースのカメラポーズの最適化と整合性に基づく共同空間探索 – を利用することを提案する。
本評価は,合成および実世界のデータセットにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-02T03:49:54Z) - Bridging Precision and Confidence: A Train-Time Loss for Calibrating
Object Detection [58.789823426981044]
本稿では,境界ボックスのクラス信頼度を予測精度に合わせることを目的とした,新たな補助損失定式化を提案する。
その結果,列車の走行時間損失はキャリブレーション基準を超過し,キャリブレーション誤差を低減させることがわかった。
論文 参考訳(メタデータ) (2023-03-25T08:56:21Z) - Aberration-Aware Depth-from-Focus [20.956132508261664]
焦点スタックにおける最良焦点フレームの決定に影響を及ぼすオフ軸収差による領域ギャップについて検討する。
次に、収差認識トレーニング(AAT)を通じて、この領域ギャップをブリッジすることを検討する。
我々のアプローチは、異なる位置でレンズ収差をモデル化し、フォーカス距離をモデル化する軽量ネットワークで、従来のネットワークトレーニングパイプラインに統合される。
論文 参考訳(メタデータ) (2023-03-08T15:21:33Z) - A Targeted Accuracy Diagnostic for Variational Approximations [8.969208467611896]
変分推論(VI)はマルコフ・チェイン・モンテカルロ(MCMC)の魅力的な代替品である
既存の方法は、全変分分布の品質を特徴付ける。
配電近似精度(TADDAA)のためのTArgeted診断法を提案する。
論文 参考訳(メタデータ) (2023-02-24T02:50:18Z) - Learned Monocular Depth Priors in Visual-Inertial Initialization [4.99761983273316]
視覚慣性オドメトリー(VIO)は、今日のほとんどのAR/VRおよび自律ロボットシステムのポーズ推定バックボーンである。
本稿では,古典的視覚慣性構造の限界を回避することを提案する。
学習した単眼深度画像(単眼深度)を利用して特徴の相対的深度を制約し,そのスケールとシフトを最適化することにより,単眼深度をメートル法スケールにアップグレードする。
論文 参考訳(メタデータ) (2022-04-20T00:30:04Z) - An automatic differentiation system for the age of differential privacy [65.35244647521989]
Tritiumは、微分プライベート(DP)機械学習(ML)のための自動微分ベース感度分析フレームワークである
我々は、微分プライベート(DP)機械学習(ML)のための自動微分に基づく感度分析フレームワークTritiumを紹介する。
論文 参考訳(メタデータ) (2021-09-22T08:07:42Z) - A parameter refinement method for Ptychography based on Deep Learning
concepts [55.41644538483948]
伝播距離、位置誤差、部分的コヒーレンスにおける粗いパラメトリゼーションは、しばしば実験の生存性を脅かす。
最新のDeep Learningフレームワークは、セットアップの不整合を自律的に補正するために使用され、ポチコグラフィーの再構築の質が向上する。
我々は,elettra シンクロトロン施設のツインミックビームラインで取得した合成データセットと実データの両方でシステムをテストした。
論文 参考訳(メタデータ) (2021-05-18T10:15:17Z) - Estimating Egocentric 3D Human Pose in Global Space [70.7272154474722]
本稿では,魚眼カメラを用いた自己中心型3次元体姿勢推定法を提案する。
提案手法は, 定量的, 定性的に, 最先端の手法より優れている。
論文 参考訳(メタデータ) (2021-04-27T20:01:57Z) - Universal and Flexible Optical Aberration Correction Using Deep-Prior
Based Deconvolution [51.274657266928315]
そこで本研究では,収差画像とpsfマップを入力とし,レンズ固有深層プリエントを組み込んだ潜在高品質版を生成する,psf対応プラグイン・アンド・プレイ深層ネットワークを提案する。
具体的には、多彩なレンズの集合からベースモデルを事前訓練し、パラメータを迅速に精製して特定のレンズに適応させる。
論文 参考訳(メタデータ) (2021-04-07T12:00:38Z) - Calibrating Self-supervised Monocular Depth Estimation [77.77696851397539]
近年、ニューラルネットワークが深度を学習し、画像のシーケンスに変化を起こさせる能力を示す方法は、訓練信号として自己スーパービジョンのみを使用している。
カメラの構成や環境に関する事前情報を取り入れることで,センサの追加に頼ることなく,自己教師型定式化を用いて,スケールのあいまいさを排除し,深度を直接予測できることを示す。
論文 参考訳(メタデータ) (2020-09-16T14:35:45Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z) - Calibrating Deep Neural Networks using Focal Loss [77.92765139898906]
ミススキャリブレーション(Miscalibration)は、モデルの信頼性と正しさのミスマッチである。
焦点損失は、既に十分に校正されたモデルを学ぶことができることを示す。
ほぼすべてのケースにおいて精度を損なうことなく,最先端のキャリブレーションを達成できることを示す。
論文 参考訳(メタデータ) (2020-02-21T17:35:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。