論文の概要: Real-Time Face and Landmark Localization for Eyeblink Detection
- arxiv url: http://arxiv.org/abs/2006.00816v2
- Date: Wed, 15 Jul 2020 16:16:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 07:33:55.263253
- Title: Real-Time Face and Landmark Localization for Eyeblink Detection
- Title(参考訳): まばたき検出のためのリアルタイム顔とランドマーク定位
- Authors: Paul Bakker, Henk-Jan Boele, Zaid Al-Ars and Christos Strydis
- Abstract要約: 顔と目印検出アルゴリズムを慎重に組み合わせて、完全に自動化された視線追跡を実現している。
実験により,1フレームあたり0.533ミリ秒の全体ランタイム応用が明らかになった。
これは、シーケンシャルな実装よりも高速で、1,101$times$である。
- 参考スコア(独自算出の注目度): 1.617280000789628
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pavlovian eyeblink conditioning is a powerful experiment used in the field of
neuroscience to measure multiple aspects of how we learn in our daily life. To
track the movement of the eyelid during an experiment, researchers have
traditionally made use of potentiometers or electromyography. More recently,
the use of computer vision and image processing alleviated the need for these
techniques but currently employed methods require human intervention and are
not fast enough to enable real-time processing. In this work, a face- and
landmark-detection algorithm have been carefully combined in order to provide
fully automated eyelid tracking, and have further been accelerated to make the
first crucial step towards online, closed-loop experiments. Such experiments
have not been achieved so far and are expected to offer significant insights in
the workings of neurological and psychiatric disorders. Based on an extensive
literature search, various different algorithms for face detection and landmark
detection have been analyzed and evaluated. Two algorithms were identified as
most suitable for eyelid detection: the Histogram-of-Oriented-Gradients (HOG)
algorithm for face detection and the Ensemble-of-Regression-Trees (ERT)
algorithm for landmark detection. These two algorithms have been accelerated on
GPU and CPU, achieving speedups of 1,753$\times$ and 11$\times$, respectively.
To demonstrate the usefulness of our eyelid-detection algorithm, a research
hypothesis was formed and a well-established neuroscientific experiment was
employed: eyeblink detection. Our experimental evaluation reveals an overall
application runtime of 0.533 ms per frame, which is 1,101$\times$ faster than
the sequential implementation and well within the real-time requirements of
eyeblink conditioning in humans, i.e. faster than 500 frames per second.
- Abstract(参考訳): pavlovian eyeblink conditioningは、神経科学の分野において、日常生活における学習の多面的な側面を測定するために使用される強力な実験である。
実験中のまぶたの動きを追跡するために、研究者は従来、電位計や筋電図を用いてきた。
最近では、コンピュータビジョンと画像処理がこれらの技術の必要性を軽減する一方で、現在使われている手法は人間の介入を必要としており、リアルタイム処理を実現するには不十分である。
本研究では,視線追跡を完全自動化するために顔と目印検出アルゴリズムを慎重に組み合わせ,オンライン・クローズドループ実験に向けた最初の重要な一歩を踏み出すためにさらに加速した。
このような実験は今のところ行われておらず、神経疾患や精神疾患の働きに重要な洞察を与えるものと期待されている。
広範な文献検索に基づいて,顔検出とランドマーク検出のための様々なアルゴリズムを解析,評価した。
顔検出のためのHistogram-of-Oriented-Gradients (HOG)アルゴリズムとランドマーク検出のためのEnsemble-of-Regression-Trees (ERT)アルゴリズムである。
これらの2つのアルゴリズムはGPUとCPUで加速され、それぞれ1,753$\times$と11$\times$のスピードアップを達成した。
まばたき検出アルゴリズムの有用性を示すために, 研究仮説を定式化し, 確立した神経科学実験であるeyeblink detectionを用いた。
実験により,1フレームあたり0.533msのアプリケーションランタイムが,連続的な実装よりも1,101$\times$高速であり,人間のアイブリンク条件のリアルタイム要件,すなわち毎秒500フレーム以上であることがわかった。
関連論文リスト
- A Framework for Pupil Tracking with Event Cameras [1.708806485130162]
サッカデス(Saccades)は、同時に起こる両眼の非常に速い動きである。
ササード中の眼の最高角速度は、ヒトでは700deg/sに達する。
標準的なディープラーニングアルゴリズムで容易に利用できるフレームとしてイベントを提示する。
論文 参考訳(メタデータ) (2024-07-23T17:32:02Z) - Spatiotemporal Pyramidal CNN with Depth-Wise Separable Convolution for
Eye Blinking Detection in the Wild [0.0]
点眼検出は、誤認検出、運転疲労検出などにおいて重要な役割を担っている。
眼球点眼検出モデルは、様々な条件下で異なる眼球画像の解像度から効率的に学習する方法と、より高速な推論時間で検出モデルのサイズを減らす方法の2つに対処されている。
論文 参考訳(メタデータ) (2023-06-20T04:59:09Z) - Measuring Human Perception to Improve Open Set Recognition [4.124573231232705]
オブジェクトが特定の視覚タスクに属しているか、属していないかを認識できる能力は、すべてのオープンセット認識アルゴリズムより優れている。
被験者による測定された反応時間は、クラスサンプルが別のクラスと混同される傾向にあるかどうかについての洞察を与えることができる。
新たな精神物理学的損失関数は、異なる画像に対する可変反応時間を示すディープネットワークにおける人間の行動と整合性を強制する。
論文 参考訳(メタデータ) (2022-09-08T01:19:36Z) - Human Activity Recognition Using Cascaded Dual Attention CNN and
Bi-Directional GRU Framework [3.3721926640077795]
視覚に基づく人間の活動認識は、ビデオ分析領域において重要な研究領域の1つとして現れてきた。
本稿では,人間の行動認識における深部識別的空間的特徴と時間的特徴を利用した,計算的に効率的だが汎用的な空間時空間カスケードフレームワークを提案する。
提案手法は, 従来の動作認識手法と比較して, フレーム毎秒最大167倍の性能向上を実現している。
論文 参考訳(メタデータ) (2022-08-09T20:34:42Z) - A Deep Learning Approach for the Segmentation of Electroencephalography
Data in Eye Tracking Applications [56.458448869572294]
脳波データの時系列セグメンテーションのための新しいフレームワークDETRtimeを紹介する。
エンドツーエンドのディープラーニングベースのフレームワークは、コンピュータビジョンの進歩を前面に立たせています。
我々のモデルは脳波睡眠ステージセグメンテーションのタスクにおいてよく一般化される。
論文 参考訳(メタデータ) (2022-06-17T10:17:24Z) - PosePipe: Open-Source Human Pose Estimation Pipeline for Clinical
Research [0.0]
我々は臨床現場で取得したデータに対して最先端のアルゴリズムの実行を容易にする人間のポーズ推定パイプラインを開発する。
本研究の目的は,新しいアルゴリズムの訓練ではなく,臨床・翻訳研究における最先端のポーズ推定アルゴリズムの活用を推し進めることである。
論文 参考訳(メタデータ) (2022-03-16T17:54:37Z) - MTCD: Cataract Detection via Near Infrared Eye Images [69.62768493464053]
白内障は一般的な眼疾患であり、盲目や視力障害の主な原因の1つである。
近赤外画像を用いた白内障検出のための新しいアルゴリズムを提案する。
深層学習に基づくアイセグメンテーションとマルチタスクネットワーク分類ネットワークについて述べる。
論文 参考訳(メタデータ) (2021-10-06T08:10:28Z) - Optimal Sequential Detection of Signals with Unknown Appearance and
Disappearance Points in Time [64.26593350748401]
本論文は、変化の期間が有限で未知であると仮定して、逐次的な変化点検出問題に対処する。
我々は、所定の時間(または空間)ウィンドウにおける最小検出確率を最大化する信頼性の高い最大変更検出基準に焦点を当てる。
FMAアルゴリズムは、光学画像中の衛星のかすかなストリークを検出するために応用される。
論文 参考訳(メタデータ) (2021-02-02T04:58:57Z) - Searching for Efficient Architecture for Instrument Segmentation in
Robotic Surgery [58.63306322525082]
ほとんどのアプリケーションは、高解像度の外科画像の正確なリアルタイムセグメンテーションに依存している。
我々は,高解像度画像のリアルタイム推論を行うために調整された,軽量で高効率なディープ残差アーキテクチャを設計する。
論文 参考訳(メタデータ) (2020-07-08T21:38:29Z) - Detecting Parkinsonian Tremor from IMU Data Collected In-The-Wild using
Deep Multiple-Instance Learning [59.74684475991192]
パーキンソン病(英: Parkinson's Disease、PD)は、60歳以上の人口の約1%に影響を与える徐々に進化する神経学的疾患である。
PD症状には、震動、剛性、ブレイキネジアがある。
本稿では,スマートフォン端末から受信したIMU信号に基づいて,PDに関連するトレモラスなエピソードを自動的に識別する手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T09:02:30Z) - Robust Medical Instrument Segmentation Challenge 2019 [56.148440125599905]
腹腔鏡装置の術中追跡は、しばしばコンピュータとロボットによる介入の必要条件である。
本研究の課題は,30の手術症例から取得した10,040枚の注釈画像からなる外科的データセットに基づいていた。
結果は、初期仮説、すなわち、アルゴリズムの性能がドメインギャップの増大とともに低下することを確認する。
論文 参考訳(メタデータ) (2020-03-23T14:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。