論文の概要: TinyGaze: Lightweight Gaze-Gesture Recognition on Commodity Mobile Devices
- arxiv url: http://arxiv.org/abs/2604.09658v1
- Date: Mon, 30 Mar 2026 14:30:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.605434
- Title: TinyGaze: Lightweight Gaze-Gesture Recognition on Commodity Mobile Devices
- Title(参考訳): TinyGaze:コモディティモバイルデバイス上での軽量ゲジチュア認識
- Authors: Yaxiong Lei, Hyochan Cho, Fergus Buchanan, Shijing He, Xinya Gong, Yuheng Wang, Juan Ye,
- Abstract要約: 本稿では,コモディティARKitのヘッド/アイ変換を用いたエンドツーエンドパイプラインと,学習理論に基づく足場付き誘導-リコールプロトコルを提案する。
TinyHARは5方向ジェスチャー認識と4方向ユーザ識別のパイロットベンチマークで高いパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 4.936752407189753
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Gaze gestures can provide hands free input on mobile devices, but practical use requires (i) gestures users can learn and recall and (ii) recognition models that are efficient enough for on-device deployment. We present an end-to-end pipeline using commodity ARKit head/eye transforms and a scaffolded guidance-to-recall protocol grounded in learning theory. In a pilot feasibility study (N=4 participants; 240 trials; controlled single-session setting), we benchmark a compact time-series model (TinyHAR) against deeper baselines (DeepConvLSTM, SA-HAR) on 5-way gesture recognition and 4-way user identification. TinyHAR achieves strong performance in this pilot benchmark (Macro F1 = 0.960 for gesture recognition; Macro F1 = 0.997 for user identification) while using only 46k parameters. A modality analysis further indicates that head pose dynamics are highly informative for mobile gaze gestures, highlighting embodied head--eye coordination as a key design consideration. Although the small sample size and controlled setting limit generalizability, these results indicate a potential direction for further investigation into on-device gaze gesture recognition.
- Abstract(参考訳): ゲーズジェスチャはモバイル端末で手入力を無料にするが、実用的利用は必要
(i) 学習・思い出・思い出のジェスチャー
(ii)デバイス上でのデプロイメントに十分な効率の認識モデル。
本稿では,コモディティARKitのヘッド/アイ変換を用いたエンドツーエンドパイプラインと,学習理論に基づく足場付き誘導-リコールプロトコルを提案する。
パイロット実現可能性調査(N=4人, 240人, コントロールシングルセッション設定)において, 5方向ジェスチャー認識と4方向ユーザ識別において, より深いベースライン(DeepConvLSTM, SA-HAR)に対して, コンパクトな時系列モデル(TinyHAR)をベンチマークした。
TinyHARは、46kパラメータのみを使用しながら、このベンチマーク(ジェスチャー認識ではMacro F1 = 0.960、ユーザ識別ではMacro F1 = 0.997)で強力なパフォーマンスを達成する。
さらに、モダリティ分析により、頭部ポーズのダイナミクスは、移動体視線のジェスチャーに非常に有益であることが示され、重要な設計上の考慮事項として、具体的頭部調整が強調される。
これらの結果は,小さなサンプルサイズと制御された設定制限の一般化性を示すが,デバイス上での視線ジェスチャー認識のさらなる研究の方向性を示す。
関連論文リスト
- MobileManiBench: Simplifying Model Verification for Mobile Manipulation [70.30578259859512]
MobileManiBenchは、モバイルベースのロボット操作のための大規模なベンチマークである。
MobileManiBenchには、2つのモバイルプラットフォーム(パラレルグリッパーとデキソラスハンドロボット)、2つの同期カメラ(頭と右手首)、630のオブジェクト(オープン、クローズ、プル、プッシュ、ピック)、5つのスキル(オープン、クローズ、プッシュ、ピック)、100以上のタスクが現実的なシーンで実行される。
論文 参考訳(メタデータ) (2026-02-05T02:49:52Z) - MOTION: ML-Assisted On-Device Low-Latency Motion Recognition [5.0385144315892925]
WeBe Bandは、強力なMCUを備えたマルチセンサーウェアラブルデバイスで、ジェスチャ認識を完全にデバイス上で効果的に行う。
ニューラルネットワークは、正確性、レイテンシ、メモリ使用の最良のバランスを提供します。
以上の結果から,WeBe Bandではリアルタイムなジェスチャー認識が可能であり,リアルタイムな医療モニタリングソリューションの可能性も大きいことが示唆された。
論文 参考訳(メタデータ) (2025-10-14T01:15:47Z) - Novel Human Machine Interface via Robust Hand Gesture Recognition System using Channel Pruned YOLOv5s Model [4.0194015554916644]
本稿では,チャネル型YOLOv5sモデルを用いた手動作検出と分類モデルを提案する。
提案手法は,リアルタイムなジェスチャコマンドベースのHCIを実現するために,プルーニングされたYOLOv5sモデルをデプロイする方法を舗装する。
提案システムの平均検出速度は60フレーム/秒 (fps) 以上に達している。
論文 参考訳(メタデータ) (2024-07-02T18:10:20Z) - Agile gesture recognition for capacitive sensing devices: adapting
on-the-job [55.40855017016652]
本システムでは, コンデンサセンサからの信号を手の動き認識器に組み込んだ手動作認識システムを提案する。
コントローラは、着用者5本の指それぞれからリアルタイム信号を生成する。
機械学習技術を用いて時系列信号を解析し,500ms以内で5本の指を表現できる3つの特徴を同定する。
論文 参考訳(メタデータ) (2023-05-12T17:24:02Z) - ViTPose++: Vision Transformer for Generic Body Pose Estimation [70.86760562151163]
様々な側面から身体ポーズ推定を行うため, プレーン・ビジョン・トランスフォーマーの驚くほど優れた特性を示す。
ViTPoseは、特徴をエンコードするエンコーダと、ボディキーポイントをデコードする軽量デコーダとして、平らで非階層的な視覚変換器を使用している。
実験により,大規模なViTPoseモデルの知識は,簡単な知識トークンによって簡単に小さなものに伝達できることが実証された。
論文 参考訳(メタデータ) (2022-12-07T12:33:28Z) - HaGRID - HAnd Gesture Recognition Image Dataset [79.21033185563167]
本稿では,ハンドジェスチャ認識システム構築のための巨大なデータセットであるHaGRIDを紹介し,それを管理するデバイスとのインタラクションに着目した。
ジェスチャーは静的だが、特にいくつかの動的ジェスチャーを設計する能力のために拾われた。
HaGRIDには54,800の画像とジェスチャーラベル付きバウンディングボックスアノテーションが含まれており、手検出とジェスチャー分類のタスクを解決している。
論文 参考訳(メタデータ) (2022-06-16T14:41:32Z) - WaveGlove: Transformer-based hand gesture recognition using multiple
inertial sensors [0.0]
近年、慣性データに基づく手のジェスチャー認識(HGR)が大幅に増加しています。
本研究では,複数の慣性センサを利用するメリットを検討する。
論文 参考訳(メタデータ) (2021-05-04T20:50:53Z) - A Prototype-Based Generalized Zero-Shot Learning Framework for Hand
Gesture Recognition [5.992264231643021]
ハンドジェスチャ認識のためのエンドツーエンドのプロトタイプベースのフレームワークを提案する。
最初のブランチは、ジェスチャー表現を学習するプロトタイプベースの検出器である。
2番目のブランチはゼロショットラベル予測器で、目に見えないクラスの機能を入力として取り、予測を出力する。
論文 参考訳(メタデータ) (2020-09-29T12:18:35Z) - Gaze-Sensing LEDs for Head Mounted Displays [73.88424800314634]
仮想現実(VR)アプリケーションのための低消費電力の視線トラッカーを作成するために,LEDのセンサ機能を利用する。
我々は,視線推定法が複雑な次元削減技術を必要としないことを示した。
論文 参考訳(メタデータ) (2020-03-18T23:03:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。