論文の概要: Sticky-Glance: Robust Intent Recognition for Human Robot Collaboration via Single-Glance
- arxiv url: http://arxiv.org/abs/2603.06121v1
- Date: Fri, 06 Mar 2026 10:27:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.98631
- Title: Sticky-Glance: Robust Intent Recognition for Human Robot Collaboration via Single-Glance
- Title(参考訳): Sticky-Glance: シングルランスによるロボット協調のためのロバストインテント認識
- Authors: Yuzhi Lai, Shenghai Yuan, Peizheng Li, Andreas Zell,
- Abstract要約: 本研究では,物体中心の視線接地フレームワークを提案する。
推測された意図は、最小3つの視線サンプルを持つ短い視線の下でも、対象物に固定されている。
動的トラッキング、マルチパースペクティブアライメント、ベースライン比較、ユーザスタディ、アブレーション研究にわたる実験は、堅牢性、効率性、作業負荷の削減を実証している。
- 参考スコア(独自算出の注目度): 24.0711921276237
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Gaze is a valuable means of communication for impaired people with extremely limited motor capabilities. However, robust gaze-based intent recognition in multi-object environments is challenging due to gaze noise, micro-saccades, viewpoint changes, and dynamic objects. To address this, we propose an object-centric gaze grounding framework that stabilizes intent through a sticky-glance algorithm, jointly modeling geometric distance and direction trends. The inferred intent remains anchored to the object even under short glances with minimal 3 gaze samples, achieving a tracking rate of 0.94 for dynamic targets and selection accuracy of 0.98 for static targets. We further introduce a continuous shared control and multi-modal interaction paradigm, enabling high-readiness control and human-in-loop feedback, thereby reducing task duration for nearly 10 \%. Experiments across dynamic tracking, multi-perspective alignment, a baseline comparison, user studies, and ablation studies demonstrate improved robustness, efficiency, and reduced workload compared to representative baselines.
- Abstract(参考訳): Gazeは、非常に限られた運動能力を持つ障害のある人々にとって、貴重なコミュニケーション手段である。
しかし、マルチオブジェクト環境における頑健な視線に基づく意図認識は、視線ノイズ、マイクロサケード、視点変化、動的物体によって困難である。
そこで本研究では,物体中心の視線接地フレームワークを提案する。
推測された意図は、最小3つの視線サンプルで短い視線下でもオブジェクトに固定され、動的目標に対する追跡率は0.94、静的目標に対する選択精度は0.98である。
さらに,マルチモーダル・インタラクション・パラダイムを導入し,高可読性制御とヒューマン・イン・ループフィードバックを実現し,タスク時間の10%近くを短縮する。
動的トラッキング、多視点アライメント、ベースライン比較、ユーザスタディ、アブレーションスタディにわたる実験は、代表ベースラインと比較してロバスト性、効率、作業負荷の低減を実証している。
関連論文リスト
- ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - Delving into Dynamic Scene Cue-Consistency for Robust 3D Multi-Object Tracking [16.366398265001422]
3D多目的追跡は、自動運転分野において重要かつ困難な課題である。
本稿では,この原理を実現するために動的シーンCue-Consistency Tracker(DSC-Track)を提案する。
論文 参考訳(メタデータ) (2025-08-15T08:48:13Z) - DINO-CoDT: Multi-class Collaborative Detection and Tracking with Vision Foundation Models [11.34839442803445]
道路利用者を対象とした多クラス協調検出・追跡フレームワークを提案する。
まず,大域的空間注意融合(GSAF)モジュールを用いた検出器を提案する。
次に,視覚基盤モデルを用いた視覚的セマンティクスを活用し,IDSW(ID SWitch)エラーを効果的に低減するトラックレットRe-IDentification(REID)モジュールを提案する。
論文 参考訳(メタデータ) (2025-06-09T02:49:10Z) - Open-World Drone Active Tracking with Goal-Centered Rewards [62.21394499788672]
Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。
DATは,世界初となるエア・ツー・グラウンド・トラッキング・ベンチマークである。
また,複雑なシナリオにおけるドローン追跡目標の性能向上を目的としたGC-VATを提案する。
論文 参考訳(メタデータ) (2024-12-01T09:37:46Z) - Interpretable Dynamic Graph Neural Networks for Small Occluded Object Detection and Tracking [0.0]
本稿では,動的グラフニューラルネットワーク(DGNN)とYOLO11を統合し,制約に対処する新しいフレームワークであるDGNN-YOLOを紹介する。
標準のGNNとは異なり、DGNNはグラフ構造をリアルタイムで動的に更新する優れた能力のために選択される。
このフレームワークはグラフ表現を構築し、定期的に更新し、ノードとしてオブジェクトをキャプチャし、エッジとして相互作用する。
論文 参考訳(メタデータ) (2024-11-26T09:29:27Z) - MotionTrack: Learning Robust Short-term and Long-term Motions for
Multi-Object Tracking [56.92165669843006]
本研究では,短時間から長期間の軌跡を関連づける統合フレームワークで,堅牢な短期・長期動作を学習するMotionTrackを提案する。
密集した群集に対して,各ターゲットの複雑な動きを推定できる,短時間の軌跡から相互作用認識動作を学習するための新しい対話モジュールを設計する。
極端なオクルージョンのために、ターゲットの履歴軌跡から信頼できる長期動作を学習するための新しいRefind Moduleを構築し、中断された軌跡とそれに対応する検出とを関連付けることができる。
論文 参考訳(メタデータ) (2023-03-18T12:38:33Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z) - Learning Global Structure Consistency for Robust Object Tracking [57.736915865309165]
この作品は、シーン全体の即時的なバリエーションを考慮に入れている。
本稿では,グローバルな構造的一貫性を短時間で活用する方法を学習する,効率的かつ効率的な短期モデルを提案する。
提案したトラッカーが2つの挑戦シナリオに対処し,大規模ベンチマークで検証できることを実証的に検証する。
論文 参考訳(メタデータ) (2020-08-26T19:12:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。