論文の概要: Face versus Body Tracking for Human-Robot Interaction: An Egocentric Dataset
- arxiv url: http://arxiv.org/abs/2606.03694v1
- Date: Tue, 02 Jun 2026 14:15:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:05.060351
- Title: Face versus Body Tracking for Human-Robot Interaction: An Egocentric Dataset
- Title(参考訳): 人間とロボットのインタラクションのための顔対身体追跡:エゴセントリックなデータセット
- Authors: Jessica Wenninger, Gabriel Skantze,
- Abstract要約: 最先端のコンピュータビジョンモデルは、監視や自動運転に非常に最適化されている。
社会ロボットは、人間が跳ね返ったり、お互いを妨害したり、フレームを離れたりといった、異なる自我中心の課題に直面します。
我々は、Furhatロボットを介して収集された、新しい、カスタムアノテーション付きエゴセントリックデータセットを導入し、複雑な社会的ダイナミクスを捉える。
- 参考スコア(独自算出の注目度): 7.3852311170912905
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To enable meaningful human-robot interaction (HRI), a robot must continuously assess engagement by consistently tracking users over time. State-of-the-art computer vision models, however, are heavily optimized for surveillance or autonomous driving. A social robot faces distinct egocentric challenges, such as humans bouncing, obstructing each other, or leaving the frame. Frequent identity switches (IDSW) cause the robot to lose its footing mid-conversation. To address this, we introduce a novel, custom-annotated egocentric dataset collected via the Furhat robot to capture complex social dynamics. We present a systematic evaluation isolating detection errors from tracking logic, comparing face versus body tracking, and assessing the impact of extended spatial memory and appearance re-identification (ReID). Results indicate that increasing spatial memory mitigates prolonged occlusions but fails on complex dynamic events. Integrating ReID resolves complex switches but exhibits opposing effects: it substantially improves body tracking stability, yet causes facial IDSW to spike due to profile angle sensitivity. Ultimately, our optimized pipeline reduces IDSW by 49\%, mitigating interaction breakdowns. Because standard benchmarks lack dense, close-quarter occlusions, this work highlights the critical need for natively captured social dynamics to truly validate HRI perception models.
- Abstract(参考訳): 有意義な人間-ロボットインタラクション(HRI)を実現するには、ロボットは時間の経過とともにユーザーを追跡することによって、エンゲージメントを継続的に評価する必要がある。
しかし、最先端のコンピュータービジョンモデルは、監視や自動運転に非常に最適化されている。
社会ロボットは、人間が跳ね返ったり、お互いを妨害したり、フレームを離れたりといった、異なる自我中心の課題に直面します。
頻繁なアイデンティティスイッチ(IDSW)により、ロボットは会話の最中に足を失います。
これを解決するために、Furhatロボットを介して収集された、カスタムアノテートされたエゴセントリックなデータセットを導入し、複雑な社会的ダイナミクスを捉える。
本稿では,トラッキングロジックから検出エラーを分離し,顔と身体の追跡を比較し,空間記憶と外観再識別(ReID)の影響を評価する。
その結果、空間記憶の増大は長期の閉塞を緩和するが、複雑な動的事象では失敗することが示された。
ReIDの統合は複雑なスイッチを解消するが、反対の効果を示す: 身体追跡の安定性を大幅に改善するが、プロファイル角の感度によって顔 IDSW がスパイクする。
最終的に、最適化されたパイプラインはIDSWを49 %削減し、インタラクションのブレークダウンを軽減します。
この研究は、HRIの認識モデルを真に検証するために、ネイティブにキャプチャされた社会的ダイナミクスが重要な必要性を浮き彫りにしている。
関連論文リスト
- SocialMirror: Reconstructing 3D Human Interaction Behaviors from Monocular Videos with Semantic and Geometric Guidance [49.69016078147708]
密接な相互作用シナリオにおける人間の行動の正確な再構築は、拡張現実における現実的な仮想インタラクションの実現に不可欠である。
本稿では,これらの問題に効果的に対処するための意味的および幾何学的手がかりを統合する拡散ベースのフレームワークであるSocialMirrorを提案する。
SocialMirrorはインタラクティブなヒューマンメッシュを再構築する上で,最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-04-15T07:41:52Z) - From Obstacles to Etiquette: Robot Social Navigation with VLM-Informed Path Selection [57.74400052368147]
本稿では,幾何学的計画と文脈的社会的推論を統合した社会ロボットナビゲーションフレームワークを提案する。
このシステムはまず障害物や人間の力学を抽出し、幾何学的に実現可能な候補経路を生成し、次に細調整された視覚言語モデル(VLM)を利用してこれらの経路を評価する。
4つのソーシャルナビゲーション環境における実験により, 生活空間違反の最小期間, 歩行者面の最小時間, 社会ゾーンの侵入がない場合に, ベストな総合的なパフォーマンスを達成できることが実証された。
論文 参考訳(メタデータ) (2026-02-09T18:46:12Z) - Learning Whole-Body Human-Humanoid Interaction from Human-Human Demonstrations [63.80827184637476]
D-STAR(D-STAR)は,行動すべき場所から行動すべき場所を乱す階層的な政策である。
広範かつ厳密なシミュレーションを通じて、我々のフレームワークを検証する。
論文 参考訳(メタデータ) (2026-01-14T14:37:06Z) - Real-Time Human-Robot Interaction Intent Detection Using RGB-based Pose and Emotion Cues with Cross-Camera Model Generalization [0.8839687029212673]
公共空間におけるサービスロボットは、自然な相互作用のための人間の行動意図をリアルタイムに理解する必要がある。
モノクラーRGBビデオから抽出した2次元骨格ポーズと顔の感情特徴を融合したフレーム精度の人-ロボットインタラクション意図検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-18T08:44:22Z) - HHI-Assist: A Dataset and Benchmark of Human-Human Interaction in Physical Assistance Scenario [63.77482302352545]
HHI-Assist(ヒヒ・アシスト)は、人間の介助作業における人間のインタラクションのモーションキャプチャークリップからなるデータセットである。
私たちの研究は、ロボット支援ポリシーを大幅に強化する可能性がある。
論文 参考訳(メタデータ) (2025-09-12T09:38:17Z) - Siamese Network with Dual Attention for EEG-Driven Social Learning: Bridging the Human-Robot Gap in Long-Tail Autonomous Driving [0.0]
本研究では脳波信号の分類を行う脳-コンピュータインタフェース(BCI)フレームワークを提案する。
タイムリーかつモチベーションの高いコロボティックエンジニアリングアプリケーションとして、準自律ロボット運転における危険事象を警告するために、人間とループのシナリオをシミュレートする。
本稿では,脳波を符号化した信号表現を生成するために,ダイナミック・タイム・ワーピング・バリーセンタ平均化手法と組み合わせた二重アテンション・シームズ畳み込みネットワークを提案する。
論文 参考訳(メタデータ) (2025-04-14T15:06:17Z) - IA-LSTM: Interaction-Aware LSTM for Pedestrian Trajectory Prediction [1.3597551064547502]
群衆シナリオにおける歩行者の軌道予測は、自動運転車や自律移動ロボットの分野において不可欠である。
従来の研究者は人間と人間の相互作用をモデル化する方法に重点を置いていたが、相互作用の相対的重要性を無視した。
人間の相互作用の相対的重要性を測定するために、コレントロピーに基づく新しいメカニズムが導入された。
論文 参考訳(メタデータ) (2023-11-26T05:17:11Z) - Occlusion-Robust Multi-Sensory Posture Estimation in Physical
Human-Robot Interaction [10.063075560468798]
1台のカメラ上でのOpenPoseからの2D姿勢と、人間がタスクを実行している間に対話するロボットの軌道。
1台のカメラ上でのOpenPoseからの2D姿勢と、人間がタスクを実行している間に対話するロボットの軌道を利用する。
本研究は,OpenPoseのみを用いた姿勢推定や,ロボットの軌道のみを用いた姿勢推定よりも,人間の体力の冗長性を解消できることを示す。
論文 参考訳(メタデータ) (2022-08-12T20:41:09Z) - RobustFusion: Robust Volumetric Performance Reconstruction under
Human-object Interactions from Monocular RGBD Stream [27.600873320989276]
現実のシナリオでは、さまざまなオブジェクトと複雑な相互作用を持つ人間のパフォーマンスの高品質の4D再構築が不可欠です。
近年の進歩は、信頼性の高い性能回復には至っていない。
人間と物体のインタラクションシナリオのための堅牢なボリュームパフォーマンス再構築システムであるRobustFusionを提案する。
論文 参考訳(メタデータ) (2021-04-30T08:41:45Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z) - Online Body Schema Adaptation through Cost-Sensitive Active Learning [63.84207660737483]
この作業は、icubロボットシミュレータの7dofアームを使用して、シミュレーション環境で実行された。
コストに敏感な能動学習手法は最適な関節構成を選択するために用いられる。
その結果,コスト依存型能動学習は標準的な能動学習手法と同等の精度を示し,実行運動の約半分を減らした。
論文 参考訳(メタデータ) (2021-01-26T16:01:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。