論文の概要: ERR@HRI 2.0 Challenge: Multimodal Detection of Errors and Failures in Human-Robot Conversations
- arxiv url: http://arxiv.org/abs/2507.13468v1
- Date: Thu, 17 Jul 2025 18:21:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-21 20:43:26.109017
- Title: ERR@HRI 2.0 Challenge: Multimodal Detection of Errors and Failures in Human-Robot Conversations
- Title(参考訳): ERR@HRI 2.0チャレンジ:人間とロボットの会話におけるエラーと失敗のマルチモーダル検出
- Authors: Shiye Cao, Maia Stiber, Amama Mahmood, Maria Teresa Parreira, Wendy Ju, Micol Spitale, Hatice Gunes, Chien-Ming Huang,
- Abstract要約: ERR@HRI 2.0 Challengeは、人間とロボットの会話中の会話ロボットの失敗のデータセットを提供する。
データセットには、顔、スピーチ、頭の動きを取り入れた16時間の人-ロボットインタラクションが含まれている。
参加者はチームを作り、マルチモーダルデータを使用してこれらの障害を検出する機械学習モデルを開発するために招待される。
- 参考スコア(独自算出の注目度): 15.140345369639215
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The integration of large language models (LLMs) into conversational robots has made human-robot conversations more dynamic. Yet, LLM-powered conversational robots remain prone to errors, e.g., misunderstanding user intent, prematurely interrupting users, or failing to respond altogether. Detecting and addressing these failures is critical for preventing conversational breakdowns, avoiding task disruptions, and sustaining user trust. To tackle this problem, the ERR@HRI 2.0 Challenge provides a multimodal dataset of LLM-powered conversational robot failures during human-robot conversations and encourages researchers to benchmark machine learning models designed to detect robot failures. The dataset includes 16 hours of dyadic human-robot interactions, incorporating facial, speech, and head movement features. Each interaction is annotated with the presence or absence of robot errors from the system perspective, and perceived user intention to correct for a mismatch between robot behavior and user expectation. Participants are invited to form teams and develop machine learning models that detect these failures using multimodal data. Submissions will be evaluated using various performance metrics, including detection accuracy and false positive rate. This challenge represents another key step toward improving failure detection in human-robot interaction through social signal analysis.
- Abstract(参考訳): 対話ロボットへの大型言語モデル(LLM)の統合により、人間とロボットの会話はよりダイナミックになった。
しかし、LLMを利用した会話ロボットは、ユーザー意図を誤解したり、早めにユーザーを中断させたり、全く反応しなかったりといった間違いをしがちだ。
これらの障害の検出と対処は、会話の破壊を防ぎ、タスクの中断を回避し、ユーザの信頼を維持するために重要である。
この問題を解決するために、ERR@HRI 2.0 Challengeは、人間とロボットの会話中にLLMを利用する会話ロボット障害のマルチモーダルデータセットを提供する。
データセットには、顔、スピーチ、頭の動きといった特徴を取り入れた16時間の人-ロボットインタラクションが含まれている。
各インタラクションには、システムの観点からのロボットエラーの有無、およびロボットの動作とユーザ期待とのミスマッチを修正しようとするユーザの意図が注釈付けされる。
参加者はチームを作り、マルチモーダルデータを使用してこれらの障害を検出する機械学習モデルを開発するために招待される。
サブミッションは、検出精度や偽陽性率など、さまざまなパフォーマンス指標を使用して評価される。
この課題は、社会信号分析を通じて人間とロボットの相互作用における障害検出を改善するための重要なステップである。
関連論文リスト
- Why Robots Are Bad at Detecting Their Mistakes: Limitations of Miscommunication Detection in Human-Robot Dialogue [0.6118899177909359]
本研究では,ロボット対話における誤通信検出における機械学習モデルの有効性を評価する。
会話の各ターンの後、ユーザーはエラーを認識したかどうかについてのフィードバックを提供し、モデルがロボットの誤りを正確に検出する能力の分析を可能にした。
論文 参考訳(メタデータ) (2025-06-25T09:25:04Z) - Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.55156507635286]
脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。
現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。
本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文 参考訳(メタデータ) (2024-07-02T21:00:30Z) - Human-Robot Interaction and Perceived Irrationality: A Study of Trust Dynamics and Error Acknowledgment [0.0]
本研究では,ロボットの故障に対する人間の反応を解析し,信頼のダイナミクスとシステム設計を体系的に検討する。
我々は,人間とロボットのインタラクションを通じて,信頼がどのように進化するかを調査する4段階の調査を行った。
その結果,ロボットの誤りや限界を認識すると,ロボットシステムの信頼性は著しく向上した。
論文 参考訳(メタデータ) (2024-03-21T11:00:11Z) - ROS-Causal: A ROS-based Causal Analysis Framework for Human-Robot Interaction Applications [3.8625803348911774]
本稿では,人間とロボットの空間的相互作用における因果発見の枠組みであるROS-Causalを紹介する。
ROSと統合されたアドホックシミュレータは、アプローチの有効性を示している。
論文 参考訳(メタデータ) (2024-02-25T11:37:23Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - Ain't Misbehavin' -- Using LLMs to Generate Expressive Robot Behavior in
Conversations with the Tabletop Robot Haru [9.2526849536751]
本稿では,大規模言語モデル(LLM)を利用して,表現行動を伴うロボット応答を生成する,完全自動会話システムを提案する。
提案したシステムを用いて,ボランティアが社会ロボットとチャットし,そのフィードバックを分析し,チャットテキストの厳密な誤り解析を行う。
最も否定的なフィードバックは、会話に限られた影響を及ぼす自動音声認識(ASR)エラーによるものだった。
論文 参考訳(メタデータ) (2024-02-18T12:35:52Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - Real-time Addressee Estimation: Deployment of a Deep-Learning Model on
the iCub Robot [52.277579221741746]
住所推定は、社会ロボットが人間とスムーズに対話するために必要なスキルである。
人間の知覚スキルにインスパイアされたディープラーニングモデルは、iCubロボットに設計、訓練、デプロイされる。
本研究では,人間-ロボットのリアルタイムインタラクションにおいて,そのような実装の手順とモデルの性能について述べる。
論文 参考訳(メタデータ) (2023-11-09T13:01:21Z) - Continuous ErrP detections during multimodal human-robot interaction [2.5199066832791535]
我々は,シミュレーションロボットが音声やジェスチャーを通じて人間とコミュニケーションする,マルチモーダルなヒューマンロボットインタラクション(HRI)シナリオを実装した。
人間のパートナーは、ロボットが選択した動作(ポインティングジェスチャー)とロボットの口頭発表(意図)が一致しているかを評価する。
脳波で明らかな、人間によるロボット行動の本質的な評価は、リアルタイムで記録され、オンラインで連続的にセグメンテーションされ、非同期に分類された。
論文 参考訳(メタデータ) (2022-07-25T15:39:32Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z) - Joint Inference of States, Robot Knowledge, and Human (False-)Beliefs [90.20235972293801]
本稿では,人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)の認知能力が,ロボットとの相互作用にどのように影響するかを理解するために,対象状態,ロボット知識,人間(時間的)の認知能力の表現にグラフィカルモデルを採用することを提案する。
推論アルゴリズムは、複数のビューにまたがる全てのロボットから個別のpgを融合し、単一のビューから発生したエラーを克服するより効果的な推論能力を得る。
論文 参考訳(メタデータ) (2020-04-25T23:02:04Z) - An Attention Transfer Model for Human-Assisted Failure Avoidance in
Robot Manipulations [2.745883395089022]
ロボット操作の誤りを識別する新しいヒューマン・ロボット・アテンション・トランスファー法(textittextbfH2R-AT)を開発した。
textittextbfH2R-ATは、アテンションマッピング機構を新しい積み重ねニューラルネットワークモデルに融合して開発された。
この方法の有効性は、転送注意における7,3.68%の高精細さと、故障の把握を避けるための6,6.86%の高精細さによって検証された。
論文 参考訳(メタデータ) (2020-02-11T07:58:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。