論文の概要: EyeDentify: A Dataset for Pupil Diameter Estimation based on Webcam Images
- arxiv url: http://arxiv.org/abs/2407.11204v1
- Date: Mon, 15 Jul 2024 19:39:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 19:21:30.826317
- Title: EyeDentify: A Dataset for Pupil Diameter Estimation based on Webcam Images
- Title(参考訳): EyeDentify:Webカメラ画像に基づく瞳孔径推定用データセット
- Authors: Vijul Shah, Ko Watanabe, Brian B. Moser, Andreas Dengel,
- Abstract要約: EyeDentifyは、Webカメラ画像に基づく瞳孔径推定のために設計されたデータセットである。
標準的なウェブカメラデータを用いて瞳孔径を推定できるディープラーニングモデルは少ない。
EyeDentifyは、装備の少ない環境向けに特別に設計されたモデルの開発と改良を可能にする。
- 参考スコア(独自算出の注目度): 6.298516754485939
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we introduce EyeDentify, a dataset specifically designed for pupil diameter estimation based on webcam images. EyeDentify addresses the lack of available datasets for pupil diameter estimation, a crucial domain for understanding physiological and psychological states traditionally dominated by highly specialized sensor systems such as Tobii. Unlike these advanced sensor systems and associated costs, webcam images are more commonly found in practice. Yet, deep learning models that can estimate pupil diameters using standard webcam data are scarce. By providing a dataset of cropped eye images alongside corresponding pupil diameter information, EyeDentify enables the development and refinement of models designed specifically for less-equipped environments, democratizing pupil diameter estimation by making it more accessible and broadly applicable, which in turn contributes to multiple domains of understanding human activity and supporting healthcare. Our dataset is available at https://vijulshah.github.io/eyedentify/.
- Abstract(参考訳): 本研究では,Webカメラ画像に基づく瞳孔径推定のためのデータセットであるEyeDentifyを紹介する。
EyeDentifyは、トビイのような高度に専門化されたセンサーシステムによって伝統的に支配される生理的および心理的状態を理解するための重要な領域である瞳孔径推定のためのデータセットの欠如に対処している。
これらの先進的なセンサーシステムや関連するコストとは異なり、ウェブカメラ画像は実際より一般的に見られる。
しかし、標準的なウェブカメラデータを用いて瞳孔径を推定できるディープラーニングモデルは少ない。
眼球画像のデータセットとそれに対応する瞳径情報を提供することにより、EyeDentifyは、低装備環境向けに設計されたモデルの開発と改良を可能にし、よりアクセスし、広く適用できるようにすることで、瞳径推定を民主化し、それによって、人間の活動を理解し、医療をサポートする複数の領域に寄与する。
私たちのデータセットはhttps://vijulshah.github.io/eyedentify/で公開されています。
関連論文リスト
- Webcam-based Pupil Diameter Prediction Benefits from Upscaling [6.298516754485939]
本研究では,バイコビックから高度超解像まで,様々なアップスケーリング手法が瞳孔径予測に与える影響について検討した。
以上の結果から,大規模データセットで訓練した瞳孔径予測モデルは,選択したアップスケーリング手法やスケールに非常に敏感であることが示唆された。
論文 参考訳(メタデータ) (2024-08-19T20:28:39Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - DeepMetricEye: Metric Depth Estimation in Periocular VR Imagery [4.940128337433944]
本稿では,U-Net 3+のディープラーニングバックボーンをベースとした軽量なフレームワークを提案する。
本手法は,3次元眼球周囲領域を再構成し,関連する光刺激計算プロトコルと医療ガイドラインの計量基準を提供する。
被験者36名を対象に, 眼球全球精度評価実験, 瞳孔径測定において有意な有効性を示した。
論文 参考訳(メタデータ) (2023-11-13T10:55:05Z) - A Deep Learning Approach for the Segmentation of Electroencephalography
Data in Eye Tracking Applications [56.458448869572294]
脳波データの時系列セグメンテーションのための新しいフレームワークDETRtimeを紹介する。
エンドツーエンドのディープラーニングベースのフレームワークは、コンピュータビジョンの進歩を前面に立たせています。
我々のモデルは脳波睡眠ステージセグメンテーションのタスクにおいてよく一般化される。
論文 参考訳(メタデータ) (2022-06-17T10:17:24Z) - Monocular Depth Estimation Using Cues Inspired by Biological Vision
Systems [22.539300644593936]
単眼深度推定(MDE)は、シーンのRGB画像を同じカメラビューから画素幅の深度マップに変換することを目的としている。
MDEタスクの一部は、画像内のどの視覚的手がかりを深度推定に使用できるか、どのように使うかを学ぶことである。
モデルに視覚的キュー情報を明示的に注入することは深度推定に有用であることを示す。
論文 参考訳(メタデータ) (2022-04-21T19:42:36Z) - Analyzing General-Purpose Deep-Learning Detection and Segmentation
Models with Images from a Lidar as a Camera Sensor [0.06554326244334865]
本研究は,高度ライダーセンサのイメージライクな出力処理のための汎用DL認識アルゴリズムの可能性について検討する。
3次元の点クラウドデータを処理するのではなく、私たちの知る限りでは、360textの視野を持つ低解像度の画像にフォーカスする最初の試みである。
適切な事前処理を行うことで、汎用DLモデルはこれらの画像を処理し、環境条件下での使用への扉を開くことができることを示す。
論文 参考訳(メタデータ) (2022-03-08T13:14:43Z) - An Interpretable Multiple-Instance Approach for the Detection of
referable Diabetic Retinopathy from Fundus Images [72.94446225783697]
基礎画像における参照糖尿病網膜症検出のための機械学習システムを提案する。
画像パッチから局所情報を抽出し,アテンション機構により効率的に組み合わせることで,高い分類精度を実現することができる。
我々は,現在入手可能な網膜画像データセットに対するアプローチを評価し,最先端の性能を示す。
論文 参考訳(メタデータ) (2021-03-02T13:14:15Z) - Semantics-aware Adaptive Knowledge Distillation for Sensor-to-Vision
Action Recognition [131.6328804788164]
本稿では,視覚・センサ・モダリティ(動画)における行動認識を強化するためのフレームワーク,Semantics-Aware Adaptive Knowledge Distillation Networks (SAKDN)を提案する。
SAKDNは複数のウェアラブルセンサーを教師のモダリティとして使用し、RGB動画を学生のモダリティとして使用している。
論文 参考訳(メタデータ) (2020-09-01T03:38:31Z) - Neural Ray Surfaces for Self-Supervised Learning of Depth and Ego-motion [51.19260542887099]
カメラモデルの事前知識を必要とせずに、自己超越を用いて正確な深度とエゴモーション推定を学習できることが示される。
Grossberg と Nayar の幾何学モデルにインスパイアされた我々は、ピクセルワイド射影線を表す畳み込みネットワークである Neural Ray Surfaces (NRS) を導入する。
本研究では,多種多様なカメラシステムを用いて得られた生ビデオから,視覚計測の自己教師付き学習と深度推定にNRSを用いることを実証する。
論文 参考訳(メタデータ) (2020-08-15T02:29:13Z) - Optimal Transfer Learning Model for Binary Classification of Funduscopic
Images through Simple Heuristics [0.8370915747360484]
深層学習ニューラルネットワークを用いて、眼内画像の視覚的表現を診断する。
本稿では, 病原体が健康であるか, 病原体なのかを, 低コストで推定する, 病原体分類の統一モデルを提案する。
論文 参考訳(メタデータ) (2020-02-11T03:49:14Z) - 1-D Convlutional Neural Networks for the Analysis of Pupil Size
Variations in Scotopic Conditions [79.71065005161566]
1次元畳み込みニューラルネットワークモデルは、短距離配列の分類のために訓練されている。
モデルは、ホールドアウトテストセット上で、高い平均精度で予測を提供する。
論文 参考訳(メタデータ) (2020-02-06T17:25:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。