論文の概要: Gaze Estimation for Human-Robot Interaction: Analysis Using the NICO Platform
- arxiv url: http://arxiv.org/abs/2509.24001v2
- Date: Wed, 08 Oct 2025 08:13:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 19:00:13.13568
- Title: Gaze Estimation for Human-Robot Interaction: Analysis Using the NICO Platform
- Title(参考訳): 人とロボットのインタラクションのための視線推定:NICOプラットフォームを用いた解析
- Authors: Matej Palider, Omar Eldardeer, Viktor Kocur,
- Abstract要約: 本稿では,HRIコンテキストにおける現在の視線推定手法について述べる。
我々はNICOロボットプラットフォームで収集された新しい注釈付きデータセットを紹介する。
- 参考スコア(独自算出の注目度): 3.8961828230212823
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper evaluates the current gaze estimation methods within an HRI context of a shared workspace scenario. We introduce a new, annotated dataset collected with the NICO robotic platform. We evaluate four state-of-the-art gaze estimation models. The evaluation shows that the angular errors are close to those reported on general-purpose benchmarks. However, when expressed in terms of distance in the shared workspace the best median error is 16.48 cm quantifying the practical limitations of current methods. We conclude by discussing these limitations and offering recommendations on how to best integrate gaze estimation as a modality in HRI systems.
- Abstract(参考訳): 本稿では,共有ワークスペースシナリオのHRIコンテキストにおける現在の視線推定手法について述べる。
我々はNICOロボットプラットフォームで収集された新しい注釈付きデータセットを紹介する。
我々は4つの最先端の視線推定モデルを評価する。
評価の結果,角誤差は汎用ベンチマークで報告したものに近いことがわかった。
しかし、共有ワークスペース内の距離で表される場合、最も中央値な誤差は16.48cmであり、現在の手法の実用的限界を定量化している。
我々は、これらの制限について議論し、HRIシステムにおいて視線推定をモダリティとして最もうまく統合する方法を推奨することで、結論付けた。
関連論文リスト
- A Renderer-Enabled Framework for Computing Parameter Estimation Lower Bounds in Plenoptic Imaging Systems [0.7305790059386769]
本研究は, Plenoptic imaging system におけるシーンパラメータ推定における情報理論的限界を評価することに焦点を当てる。
雑音の反射光観測からパラメータ推定誤差の下位境界を計算するための一般的な枠組みを示す。
論文 参考訳(メタデータ) (2026-01-30T15:47:58Z) - Exploring Zero-Shot ACSA with Unified Meaning Representation in Chain-of-Thought Prompting [4.14197005718384]
Aspect-Category Sentiment Analysis (ACSA)は、レビュー内の特定のテーマと関連する感情を識別することによって、詳細な洞察を提供する。
ゼロショット設定で大規模言語モデル(LLM)を活用することは、データアノテーションのリソースが制限される実用的な代替手段である、と我々は主張する。
本稿では、中間的統一意味表現(UMR)を利用してACSAタスクの推論プロセスを構築する新しいChain-of-Thought(CoT)プロンプト手法を提案する。
論文 参考訳(メタデータ) (2025-12-22T18:23:37Z) - You Only Estimate Once: Unified, One-stage, Real-Time Category-level Articulated Object 6D Pose Estimation for Robotic Grasping [119.41166438439313]
YOEOは、エンドツーエンドでインスタンスセグメンテーションとNPCS表現を出力する単一ステージのメソッドである。
我々は、統一ネットワークを使用してポイントワイズセマンティックラベルとセントロイドオフセットを生成し、同じパートインスタンスのポイントが同じセントロイドに投票できるようにする。
また,合成学習したモデルを実環境に展開し,200Hzでリアルタイムな視覚フィードバックを提供する。
論文 参考訳(メタデータ) (2025-06-06T03:49:20Z) - ODExAI: A Comprehensive Object Detection Explainable AI Evaluation [1.338174941551702]
本稿では、オブジェクト検出におけるXAI手法を評価するために、Object Detection Explainable AI Evaluation (ODExAI)を導入する。
我々は、広く使われている2つのオブジェクト検出器と標準データセットにまたがる一連のXAI手法をベンチマークする。
論文 参考訳(メタデータ) (2025-04-27T14:16:14Z) - Modeling State Shifting via Local-Global Distillation for Event-Frame Gaze Tracking [61.44701715285463]
本稿では,イベントデータとフレームデータの両方を用いた受動的視線推定の問題に取り組む。
我々は、現在の状態からいくつかの事前登録されたアンカー状態に移行する状態の定量化として、視線推定を再構成する。
大規模視線推定ネットワークを直接学習する代わりに,地域の専門家グループと学生ネットワークを連携させることにより,一般化能力の向上を図る。
論文 参考訳(メタデータ) (2024-03-31T03:30:37Z) - C-PMI: Conditional Pointwise Mutual Information for Turn-level Dialogue
Evaluation [68.59356746305255]
本稿では,システムとユーザ間のターンレベルインタラクションを測定するための,モデルに依存しない新しいアプローチを提案する。
提案手法は,既存の評価システムと比較して,人間の判断との相関性を大幅に改善する。
論文 参考訳(メタデータ) (2023-06-27T06:58:03Z) - Evaluate & Evaluation on the Hub: Better Best Practices for Data and
Model Measurements [167.73134600289603]
Assessmentは、データとモデルの計測、メトリクス、比較のためのベストプラクティスをサポートするライブラリである。
ハブの評価は、75,000モデルと11,000データセットの大規模評価を可能にするプラットフォームである。
論文 参考訳(メタデータ) (2022-09-30T18:35:39Z) - Reliable Evaluations for Natural Language Inference based on a Unified
Cross-dataset Benchmark [54.782397511033345]
クラウドソースの自然言語推論(NLI)データセットは、アノテーションアーティファクトのような重大なバイアスに悩まされる可能性がある。
14のNLIデータセットと9つの広く使用されているニューラルネットワークベースのNLIモデルを再評価した、新しいクロスデータセットベンチマークを提案する。
提案した評価手法と実験ベースラインは,将来信頼性の高いNLI研究を刺激する基盤となる可能性がある。
論文 参考訳(メタデータ) (2020-10-15T11:50:12Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - Neural Estimators for Conditional Mutual Information Using Nearest
Neighbors Sampling [36.35382677479192]
サンプルの集合から相互情報(MI)または条件相互情報(CMI)を推定することは、長年の課題である。
最近の研究は、ニューラルネットワークの近似能力を活用し、従来の手法よりも改善されている。
サンプル平均値に高信頼濃度境界を導出し, 再サンプリングを行うため, k 隣人 (k-NN) に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-06-12T14:30:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。