論文の概要: REI-Bench: Can Embodied Agents Understand Vague Human Instructions in Task Planning?
- arxiv url: http://arxiv.org/abs/2505.10872v2
- Date: Mon, 19 May 2025 17:21:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:10.668333
- Title: REI-Bench: Can Embodied Agents Understand Vague Human Instructions in Task Planning?
- Title(参考訳): REI-Bench: エージェントはタスクプランニングにおける悪質な人間の指示に耐えられるか?
- Authors: Chenxi Jiang, Chuhao Zhou, Jianfei Yang,
- Abstract要約: 言語学者は、そのような曖昧さは表現(RE)を参照することからしばしば生じることを示唆している。
本稿では,人間の指示におけるREsの不明瞭さがLLMに基づくロボットタスク計画にどのように影響するかを考察する。
本稿では,あいまいなRE(REI-Bench)を用いた最初のロボットタスク計画ベンチマークを提案する。
- 参考スコア(独自算出の注目度): 12.490512012911635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robot task planning decomposes human instructions into executable action sequences that enable robots to complete a series of complex tasks. Although recent large language model (LLM)-based task planners achieve amazing performance, they assume that human instructions are clear and straightforward. However, real-world users are not experts, and their instructions to robots often contain significant vagueness. Linguists suggest that such vagueness frequently arises from referring expressions (REs), whose meanings depend heavily on dialogue context and environment. This vagueness is even more prevalent among the elderly and children, who robots should serve more. This paper studies how such vagueness in REs within human instructions affects LLM-based robot task planning and how to overcome this issue. To this end, we propose the first robot task planning benchmark with vague REs (REI-Bench), where we discover that the vagueness of REs can severely degrade robot planning performance, leading to success rate drops of up to 77.9%. We also observe that most failure cases stem from missing objects in planners. To mitigate the REs issue, we propose a simple yet effective approach: task-oriented context cognition, which generates clear instructions for robots, achieving state-of-the-art performance compared to aware prompt and chains of thought. This work contributes to the research community of human-robot interaction (HRI) by making robot task planning more practical, particularly for non-expert users, e.g., the elderly and children.
- Abstract(参考訳): ロボットタスクプランニングは、人間の指示を実行可能なアクションシーケンスに分解することで、ロボットが一連の複雑なタスクを完了できるようにする。
最近の大規模言語モデル(LLM)ベースのタスクプランナは素晴らしいパフォーマンスを達成しているが、人間の指示は明確で簡単であると仮定している。
しかし、現実世界のユーザーは専門家ではなく、ロボットへの指示には大きな曖昧さが伴うことが多い。
言語学者は、このような曖昧さはしばしば、対話の文脈や環境に大きく依存する表現(RE)を参照することから生じることを示唆している。
この曖昧さは、ロボットがより役に立てるべき高齢者や子供の間でさらに一般的である。
本稿では,人間の指示におけるREの曖昧さがLLMベースのロボットタスク計画にどのように影響するか,その克服方法について検討する。
この目的のために,あいまいなRE(REI-Bench)を用いた最初のロボットタスク計画ベンチマークを提案し,REsの曖昧さがロボット計画性能を著しく低下させ,77.9%の成功率の低下を招いた。
また、ほとんどの障害ケースは、プランナーの欠落したオブジェクトから来ています。
タスク指向のコンテキスト認識は,ロボットに対して明確な指示を発生させ,意識的なプロンプトや思考の連鎖に対して,最先端のパフォーマンスを達成する。
本研究は,ロボットのタスクプランニングをより実用的なものにすることで,人間-ロボットインタラクション(HRI)の研究コミュニティに貢献する。
関連論文リスト
- RoBridge: A Hierarchical Architecture Bridging Cognition and Execution for General Robotic Manipulation [90.81956345363355]
RoBridgeは、一般的なロボット操作のための階層的なインテリジェントアーキテクチャである。
大規模事前学習型視覚言語モデル(VLM)に基づくハイレベル認知プランナー(HCP)で構成されている。
強化学習の手続き的スキルを解き放ち、認知と実行のギャップを効果的に埋める。
論文 参考訳(メタデータ) (2025-05-03T06:17:18Z) - REMAC: Self-Reflective and Self-Evolving Multi-Agent Collaboration for Long-Horizon Robot Manipulation [57.628771707989166]
本稿では,ReMACと呼ばれる適応型マルチエージェント計画フレームワークを提案する。
ReMACには2つの重要なモジュールが組み込まれており、ループ内で事前条件と後条件チェックを実行し、進捗と計画の洗練を評価する。
論文 参考訳(メタデータ) (2025-03-28T03:51:40Z) - COHERENT: Collaboration of Heterogeneous Multi-Robot System with Large Language Models [49.24666980374751]
COHERENTは、異種マルチロボットシステムの協調のための新しいLCMベースのタスク計画フレームワークである。
提案-実行-フィードバック-調整機構は,個々のロボットに対して動作を分解・割り当てするように設計されている。
実験の結果,我々の研究は,成功率と実行効率の面で,従来の手法をはるかに上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2024-09-23T15:53:41Z) - Probabilistically Correct Language-based Multi-Robot Planning using Conformal Prediction [11.614036749291216]
本稿では,S-ATLAS for Safe plAnning for Teams of Language-instructed Agentsを提案する。
提案したプランナは,計画実行が成功すると仮定して,ユーザ指定のタスク成功率を達成可能であることを示す。
我々は,本手法が計算効率が高く,ヘルプレートが低いことを示す関連研究との比較実験を行った。
論文 参考訳(メタデータ) (2024-02-23T15:02:44Z) - Enabling human-like task identification from natural conversation [7.00597813134145]
我々は,NLPエンジンとプランナを組み合わせた非自明な手法を提案し,ロボットがタスクと関連するパラメータをすべて識別し,タスクの正確な計画を生成する。
この研究は、ロボットにおける人間のようなタスク理解能力の実現に向けて、大きな一歩を踏み出した。
論文 参考訳(メタデータ) (2020-08-23T17:19:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。