論文の概要: EveLoad: Cognitive Workload Recognition from Event-Based Eye Movements
- arxiv url: http://arxiv.org/abs/2606.25177v1
- Date: Tue, 23 Jun 2026 21:06:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:05:30.145396
- Title: EveLoad: Cognitive Workload Recognition from Event-Based Eye Movements
- Title(参考訳): EveLoad:イベントベースアイムーブメントによる認知的ワークロード認識
- Authors: Guorui Lu, Shaohua Guan, Zhen Xu, Qinyu Chen,
- Abstract要約: 既存のアイモーメントに基づく認知的ワークロード認識手法は、フレームベースのアイトラッカーに依存している。
イベントカメラは、マイクロ秒レベルの時間分解能、高ダイナミックレンジ、低レイテンシを提供し、きめ細かい目の動きを捉えるのに適している。
EveLoadは、グレード付き認知ワークロードアノテーションを備えた、最初のイベントベースのアイモーメントデータセットである。
- 参考スコア(独自算出の注目度): 4.802081767877088
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cognitive workload monitoring is important for adaptive rehabilitation and assistive interfaces, where task difficulty, pacing, and feedback should be adjusted according to the user's cognitive state to avoid overload and under-challenge. Emerging extended reality and robot-assisted rehabilitation environments provide controllable training tasks, but they require unobtrusive sensing methods that can capture rapid ocular dynamics during interaction. Existing eye-movement-based cognitive workload recognition methods mainly rely on frame-based eye trackers, which often suffer from limited temporal resolution and degraded robustness under rapid eye movements. In contrast, event cameras provide microsecond-level temporal resolution, high dynamic range and low latency, making them suitable for capturing fine-grained ocular dynamics. Many previous studies rely on free-viewing or similar paradigms, where gaze locations can vary across tasks. As a result, models may learn associations between gaze-location distributions and cognitive workload, rather than workload-related eye movement characteristics themselves. In this work, we introduce EveLoad, which, to the best of our knowledge, is the first event-based eye-movement dataset with graded cognitive workload annotations, collected from 20 healthy participants under spatially constrained and task-driven conditions using a controlled N-back-guided fixation paradigm. Based on this dataset, we establish a benchmark for cognitive workload recognition with six workload levels and propose a learning framework that encodes spatiotemporal event representations. Experimental results show that our approach achieves an average subject-specific accuracy of 96.36% and 96.13% under mixed random split evaluation. These results suggest that event-based eye movements may provide a useful sensing pathway for future workload-aware rehabilitation.
- Abstract(参考訳): 認知的作業負荷モニタリングは、タスクの難易度、ペーシング、フィードバックをユーザの認知状態に応じて調整し、過負荷や不整合を避けるための適応的リハビリテーションおよび補助インターフェースにおいて重要である。
拡張現実とロボットによるリハビリテーション環境は、制御可能なトレーニングタスクを提供するが、それらは相互作用の間、迅速な眼のダイナミクスを捉える、邪魔にならないセンシング方法を必要とする。
既存の眼球運動に基づく認知作業量認識法は主にフレームベースの眼球追跡装置に依存しており、眼球運動時の時間分解能の制限や頑健さの低下に悩まされることが多い。
対照的に、イベントカメラはマイクロ秒レベルの時間分解能、高ダイナミックレンジ、低レイテンシを提供し、きめ細かい目の動きを捉えるのに適している。
以前の多くの研究は自由視聴や類似のパラダイムに依存しており、視線の位置はタスクによって異なる。
その結果、モデルは、作業負荷に関連する眼球運動特性自体よりも、視線位置分布と認知的作業量との関係を学習することができる。
EveLoadは、私たちの知る限り、20人の健康な参加者から、N-back-guided固定パラダイムを用いて、空間的制約とタスク駆動の条件下で収集された、段階的認知的ワークロードアノテーションを備えた、初めてのイベントベースの眼球運動データセットである。
このデータセットに基づいて,6つのワークロードレベルの認知的ワークロード認識のためのベンチマークを構築し,時空間のイベント表現を符号化する学習フレームワークを提案する。
実験の結果, 混合ランダム分割評価では, 被験者比96.36%, 96.13%の精度が得られた。
これらの結果から,事象をベースとした眼球運動は将来の作業負荷対応リハビリテーションに有用な感覚経路となる可能性が示唆された。
関連論文リスト
- LatentPilot: Scene-Aware Vision-and-Language Navigation by Dreaming Ahead with Latent Visual Reasoning [51.969318585152116]
LatentPilotは、トレーニング中の将来の観察を貴重なデータソースとして利用して、アクション条件付きビジュアルダイナミクスを学習する。
そこで本稿では,フライホイール方式のトレーニング機構を提案する。これは,道路上の軌道を反復的に収集し,エージェントの行動分布に適合するようにモデルを再訓練する。
R2R-CE、RxR-CE、R2R-PEベンチマークの実験では新たなSOTA結果が得られた。
論文 参考訳(メタデータ) (2026-03-31T02:21:59Z) - Data-centric Design of Learning-based Surgical Gaze Perception Models in Multi-Task Simulation [16.689550165317765]
ロボットによる侵襲的最小侵襲手術(RMIS)では、触覚フィードバックと奥行きの手がかりが専門的な視覚的知覚に依存している。
本研究では,ダ・ヴィンチ・シムNowシミュレータ上で4つのドリルで収集した,アクティブ・パッシブ・マルチタスク・サーチ・ギャグ・データセットについて紹介する。
我々は、視線組織におけるスキルとモダリティに依存した差異を定量化し、手術監督のための受動的視線の置換性を評価する。
論文 参考訳(メタデータ) (2026-02-09T22:52:59Z) - Act, Sense, Act: Learning Non-Markovian Active Perception Strategies from Large-Scale Egocentric Human Data [30.493131697188627]
我々は、情報ゲインと意思決定分岐によって駆動される非マルコフ過程として能動的知覚を定式化する。
本稿では,認知と記憶を意識した視覚言語アクションフレームワークCoMe-VLAを紹介する。
本フレームワークは,自律的なサブタスク遷移のための認知補助ヘッドと,一貫した自己および環境意識を維持するためのデュアルトラックメモリシステムを統合する。
論文 参考訳(メタデータ) (2026-02-04T14:28:14Z) - Emulating Human-like Adaptive Vision for Efficient and Flexible Machine Visual Perception [93.20637973889434]
本稿では、"パッシブ"から"アクティブ"ビジョンモデルへのパラダイムシフトを促進するための一般的なフレームワークであるAdaptiveNNを紹介する。
AdaptiveNNは、視覚知覚を粗い連続的な意思決定プロセスとして定式化する。
アダプティブNNは、大規模な視覚認識、きめ細かい識別、視覚検索、実際の運転と医療シナリオからの画像処理を含む、9つのタスクにまたがる17のベンチマークで評価する。
論文 参考訳(メタデータ) (2025-09-18T18:25:43Z) - Human Scanpath Prediction in Target-Present Visual Search with Semantic-Foveal Bayesian Attention [49.99728312519117]
SemBA-FASTは、ターゲットの視覚検索における人間の視覚的注意を予測するためのトップダウンフレームワークである。
我々は、COCO-Search18ベンチマークデータセット上でSemBA-FASTを評価し、その性能を他のスキャンパス予測モデルと比較した。
これらの知見は、人間のような注意モデリングのためのセマンティック・フレーバー・確率的フレームワークの能力に関する貴重な知見を提供する。
論文 参考訳(メタデータ) (2025-07-24T15:19:23Z) - EyeSeg: An Uncertainty-Aware Eye Segmentation Framework for AR/VR [58.33693755009173]
EyeSegは拡張現実(AR)と仮想現実(VR)のための不確実性を認識したアイセグメンテーションフレームワーク
我々は,従来のアプローチを超越したMIoU,E1,F1,ACCのセグメンテーション改善を実現していることを示す。
論文 参考訳(メタデータ) (2025-07-13T14:33:10Z) - Multimodal Graph Representation Learning for Robust Surgical Workflow Recognition with Adversarial Feature Disentanglement [45.691433426389985]
本稿では,精度と信頼性を高めるために,視覚と運動データを統合するグラフベースの手法を提案する。
ヴィジュアルデータはダイナミックな手術シーンをキャプチャし、キネマティックデータは正確な運動情報を提供する。
本研究の目的は, 外科手術に固有の複雑度とダイナミズムに対処し, 自動的なワークフロー認識を向上することである。
論文 参考訳(メタデータ) (2025-05-03T09:43:30Z) - CLERA: A Unified Model for Joint Cognitive Load and Eye Region Analysis
in the Wild [18.79132232751083]
目領域のダイナミックスをリアルタイムに分析することで、人間の視覚的注意の割り当てを監視し、精神状態を推定することができる。
共同学習フレームワークにおいて,正確なキーポイント検出と時間追跡を実現するCLERAを提案する。
また,共同瞳孔,眼開放性,ランドマークアノテーションを用いた30万人の顔の大規模データセットも導入した。
論文 参考訳(メタデータ) (2023-06-26T21:20:23Z) - Self-Regulated Learning for Egocentric Video Activity Anticipation [147.9783215348252]
自己制御学習(SRL)は、中間表現を連続的に制御し、現在のタイムスタンプのフレームにおける新しい情報を強調する表現を作り出すことを目的としている。
SRLは2つのエゴセントリックなビデオデータセットと2つの第三者のビデオデータセットにおいて、既存の最先端技術よりも大幅に優れています。
論文 参考訳(メタデータ) (2021-11-23T03:29:18Z) - Causal Navigation by Continuous-time Neural Networks [108.84958284162857]
本研究では,連続時間ニューラルネットワークを用いた因果表現学習のための理論的,実験的枠組みを提案する。
本手法は,ドローンの視覚制御学習の文脈において,一連の複雑なタスクにおいて評価する。
論文 参考訳(メタデータ) (2021-06-15T17:45:32Z) - Rethinking Eye-blink: Assessing Task Difficulty through Physiological
Representation of Spontaneous Blinking [3.680403821470857]
本稿では,タスク難易度の自動推定のための視線応答分析手法を提案する。
コアモジュールは、点滅に反映された情報の豊かさをキャプチャすることを目的としたアイリンクの時間周波数表現です。
論文 参考訳(メタデータ) (2021-02-12T18:47:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。