論文の概要: MambaGaze: Bidirectional Mamba with Explicit Missing Data Modeling for Cognitive Load Assessment from Eye-Gaze Tracking Data
- arxiv url: http://arxiv.org/abs/2605.22775v1
- Date: Thu, 21 May 2026 17:33:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.381155
- Title: MambaGaze: Bidirectional Mamba with Explicit Missing Data Modeling for Cognitive Load Assessment from Eye-Gaze Tracking Data
- Title(参考訳): MambaGaze:視線追跡データによる認知負荷評価のための明示的欠落データモデリングによる双方向マンバ
- Authors: Amir Mousavi, Mohammad Sadegh Sirjani, Erfan Nourbakhsh, Mimi Xie, Rocky Slavin, Leslie Neely, John Davis, John Quarles,
- Abstract要約: 視線追跡信号によるリアルタイム認知負荷評価は、適応的な人間中心AIを可能にする可能性がある。
我々は、瞬きや障害追跡から頻繁にデータ不足を処理するフレームワークであるMambaGazeを提案する。
我々は,MambaGazeが76.8%,73.1%の精度でCNN,Transformer,ResNet,VGGのベースラインを4-12ポイント上回っていることを示す。
- 参考スコア(独自算出の注目度): 5.256332889764464
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Real-time cognitive load assessment from eye-tracking signals could potentially enable adaptive human-centered-AI such as safety-critical applications such as driver vigilance monitoring or automated flight deck assistance, yet two challenges persist: handling frequent data missingness from blinks and tracking failures, and efficiently modeling long-range temporal dependencies. We propose MambaGaze, a framework that addresses these challenges through 1) XMD encoding, which augments raw features with observation masks and time-deltas to explicitly model data uncertainty, and 2) bidirectional Mamba-2, which captures temporal dependencies with linear computational complexity. Experiments on CLARE and CL-Drive datasets under leave-one-subject-out evaluation show that MambaGaze achieves 76.8% and 73.1% accuracy, respectively, outperforming CNN, Transformer, ResNet, and VGG baselines by 4-12 percentage points. Edge deployment benchmarks on NVIDIA Jetson platforms demonstrate real-time inference at 43-68 FPS with power consumption below 7.5W, confirming feasibility for wearable cognitive load monitoring.
- Abstract(参考訳): 視線追跡信号からのリアルタイム認知負荷評価は、ドライバーの警戒監視や自動フライトデッキアシストといった安全クリティカルなアプリケーションなど、適応的な人間中心AIを可能にする可能性があるが、2つの課題が持続する。
これらの課題に対処するフレームワークであるMambaGazeを提案する。
1)XMD符号化は、データ不確実性を明示的にモデル化するために、観測マスクと時間差で生の特徴を増強する。
2) 線形計算複雑性を伴う時間的依存関係を捉える双方向Mamba-2。
CLAREとCL-Driveデータセットの実験では、MambaGazeは76.8%、73.1%の精度でCNN、Transformer、ResNet、VGGのベースラインを4-12ポイント上回っている。
NVIDIA Jetsonプラットフォーム上のエッジデプロイメントベンチマークでは、43-68 FPSでリアルタイムの推測が実施され、7.5W未満の消費電力で、ウェアラブル認知負荷監視の可能性が確認されている。
関連論文リスト
- PersonalAI 2.0: Enhancing knowledge graph traversal/retrieval with planning mechanism for Personalized LLM Agents [53.369140518949656]
外部知識グラフ(KG)の統合により,大規模言語モデル(LLM)ベースのシステムを強化する新しいフレームワークであるPersonalAI 2.0(PAI-2)を紹介する。
提案手法は,動的でマルチステージなクエリ処理パイプラインを組み込むことにより,既存のGraphRAG(Retrieval-Augmented Generation)メソッドの重要な制限に対処する。
グラフアルゴリズム(例えば、BeamSearch、WaterCircles)は、平均6%の標準フラットテンレトリバーよりも優れた結果が得られる一方で、検索計画強化機構は、6つのデータセットにわたるLLM-as-a-Judgeによる障害アルゴリズムに比べて18%向上することを示す。
論文 参考訳(メタデータ) (2026-05-13T13:06:30Z) - TinyGLASS: Real-Time Self-Supervised In-Sensor Anomaly Detection [7.978059159334374]
異常検出は、ラベル付き欠陥サンプルの不足にもかかわらず欠陥を特定する必要がある産業品質管理において重要な役割を担っている。
GLASSのような近年の自己教師型アプローチは、欠陥のないデータのみを用いて通常の視覚パターンを学習し、産業ベンチマークで高い性能を示した。
この研究は、リアルタイムエッジとセンサ内異常検出のために設計されたGLASSフレームワークの軽量な適応であるTinyGLASSを紹介する。
論文 参考訳(メタデータ) (2026-03-17T12:31:34Z) - Modeling Information Blackouts in Missing Not-At-Random Time Series Data [0.0]
大規模な交通予測は、しばしばブラックアウトを示す固定センサーネットワークに依存している。
本稿では,線形力学系による交通力学を協調的にモデル化する潜在状態空間フレームワークを提案する。
明示的なMNARモデリングは、実際のデータに対して一貫したがより小さな改善を提供する。
論文 参考訳(メタデータ) (2026-01-04T11:03:13Z) - Learning to Track Any Points from Human Motion [55.831218129679144]
点追跡のための擬似ラベル付きトレーニングデータを生成する自動パイプラインを提案する。
AnthroTAPでトレーニングされた点追跡モデルは、TAP-Vidベンチマークで注釈付き最先端性能を達成する。
論文 参考訳(メタデータ) (2025-07-08T17:59:58Z) - What You Have is What You Track: Adaptive and Robust Multimodal Tracking [72.92244578461869]
本研究では,時間的に不完全なマルチモーダルデータを用いたトラッカー性能に関する総合的研究を行った。
我々のモデルは9つのベンチマークでSOTA性能を達成し、従来の完全性と欠落したモダリティ設定の両方で優れている。
論文 参考訳(メタデータ) (2025-07-08T11:40:21Z) - TrackingMiM: Efficient Mamba-in-Mamba Serialization for Real-time UAV Object Tracking [4.6672950054734255]
本稿では,追跡問題の画像列処理のための最小計算負荷モデルであるTrackingMiMを提案する。
本フレームワークでは,時間的および空間的コヒーレントなパッチトークンを独立に処理しながら,ネストした方法でマンバスキャンを行う。
論文 参考訳(メタデータ) (2025-07-02T09:40:37Z) - LSM-2: Learning from Incomplete Wearable Sensor Data [65.58595667477505]
本稿では,Adaptive and Inherited Masking (AIM)を用いた第2世代Large Sensor Model (LSM-2)を紹介する。
AIMは明示的な計算を必要とせず、不完全なデータから直接堅牢な表現を学習する。
AIMを用いた LSM-2 は, 分類, 回帰, 生成モデルなど, 多様なタスクにまたがる最高の性能を実現する。
論文 参考訳(メタデータ) (2025-06-05T17:57:11Z) - Tracking Meets Large Multimodal Models for Driving Scenario Understanding [76.71815464110153]
大規模マルチモーダルモデル(LMM)は、最近自動運転研究で注目されている。
本稿では3次元の空間的・時間的詳細を復元するための追加入力として追跡情報を統合することを提案する。
本稿では,この追跡情報をLMMに埋め込んで,運転シナリオの理解を深めるための新しい手法を提案する。
論文 参考訳(メタデータ) (2025-03-18T17:59:12Z) - 8-Calves Image dataset [0.8233028449337972]
マルチアニマル検出、追跡、識別のための挑戦的なベンチマークである8-Calvesデータセットを紹介した。
バーに8匹のホルスタイン・フリーズ人の子牛の1時間のビデオが映し出され、頻繁にオクルージョン、動きのぼやけ、さまざまなポーズが収められている。
微調整されたYOLOv8検出器とByteTrackを使った半きめのパイプラインと手作業による修正により、537,000以上のバウンディングボックスと時間的アイデンティティラベルが提供される。
論文 参考訳(メタデータ) (2025-03-17T23:47:52Z) - MambaNUT: Nighttime UAV Tracking via Mamba-based Adaptive Curriculum Learning [5.9089796108568855]
本稿では,線形複雑度を背骨とする状態空間モデルを用いた純粋なMambaベースのトラッキングフレームワーク(MambaNUT)を提案する。
適応型カリキュラム学習(ACL)アプローチを導入し、動的サンプリング戦略と損失重みを調整する。
複数の夜間UAV追跡ベンチマークでの被曝実験は、提案されたMambaNUTが最先端の性能を達成することを示す。
論文 参考訳(メタデータ) (2024-12-01T00:51:23Z) - SIGMA: Selective Gated Mamba for Sequential Recommendation [56.85338055215429]
最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-08-21T09:12:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。