論文の概要: Distill: Uncovering the True Intent behind Human-Robot Communication
- arxiv url: http://arxiv.org/abs/2605.14262v1
- Date: Thu, 14 May 2026 02:05:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.576048
- Title: Distill: Uncovering the True Intent behind Human-Robot Communication
- Title(参考訳): Distill:人間とロボットのコミュニケーションの背後にある真の存在を発見
- Authors: Ting Li, David Porfirio,
- Abstract要約: 本稿では,人間とロボットのコミュニケーションインタフェースに対するDistillアプローチを提案する。
タスク仕様が与えられた場合、Distillは不要なステップを取り除き、個々のステップの背後にある意味を一般化し、ステップ間の制約の順序付けを緩和する。
我々はWebインターフェース上でDistillを実装し、クラウドソーシング調査を通じて、初期タスク仕様からユーザ意図を抽出し、洗練する能力を実証した。
- 参考スコア(独自算出の注目度): 3.8732212038055827
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As robots become increasingly integrated into everyday environments, intuitive communication paradigms such as natural language and end-user programming have become indispensable for specifying autonomous robot behavior. However, these mechanisms are ineffective at fully capturing user intent: natural language is imprecise and ambiguous, whereas end-user programming can be overly specific. As a result, understanding what users truly mean when they interact with robots remains a central challenge for human-AI communication systems. To address this issue, we propose the Distill approach for human-robot communication interfaces. Given a task specification provided by the user, Distill (1) removes unnecessary steps; (2) generalizes the meaning behind individual steps; and (3) relaxes ordering constraints between steps. We implemented Distill on a web interface and, through a crowdsourcing study, demonstrated its ability to elicit and refine user intent from initial task specifications.
- Abstract(参考訳): ロボットが日常環境に統合されるにつれて、自然言語やエンドユーザプログラミングといった直感的なコミュニケーションパラダイムは、自律的なロボット行動を特定する上で欠かせないものになっている。
自然言語は不正確で曖昧だが、エンドユーザープログラミングは過度に具体化されている。
結果として、ロボットと対話する際にユーザーが本当に意味を持つものを理解することは、人間とAIのコミュニケーションシステムにとって重要な課題である。
この問題に対処するために,人間のロボット通信インタフェースに対するDistillアプローチを提案する。
ユーザが提供するタスク仕様が与えられた場合、Distill(1)は不要なステップを削除し、(2)個々のステップの背後にある意味を一般化し、(3)ステップ間の制約の順序付けを緩和する。
我々はWebインターフェース上でDistillを実装し、クラウドソーシング調査を通じて、初期タスク仕様からユーザ意図を抽出し、洗練する能力を実証した。
関連論文リスト
- Intuitive Programming, Adaptive Task Planning, and Dynamic Role Allocation in Human-Robot Collaboration [28.96294944351617]
このレビューでは、人間とロボット間の直感的な情報交換とスキル伝達を可能にする重要なコンポーネントを特定し、接続する。
マルチモーダル入力をロボットに理解可能な表現に変換する人間とロボットのコミュニケーションブリッジから、完全なインタラクションパイプラインについて検討する。
論文 参考訳(メタデータ) (2025-11-11T19:49:30Z) - Interpretable Robot Control via Structured Behavior Trees and Large Language Models [0.14990005092937678]
本稿では,自然言語理解とロボット実行を橋渡しする新しい枠組みを提案する。
提案手法は実世界のシナリオでは実用的であり、平均的な認識と実行の精度は約94%である。
論文 参考訳(メタデータ) (2025-08-13T08:53:13Z) - Bootstrapping Human-Like Planning via LLMs [0.873811641236639]
2つの共通エンドユーザープログラミングパラダイムには、ドラッグ・アンド・ドロップインタフェースと自然言語プログラミングがある。
我々は,自然言語を入力として受け入れる大規模言語モデル (LLM) ベースのパイプラインを構築し,人間の動作シーケンスを出力として生成する。
以上の結果から,人間の行動系列の生成において,より大型のモデルの方が,より小型のモデルよりも優れていることが示されたが,それにもかかわらず,より小型のモデルでは良好な性能が得られている。
論文 参考訳(メタデータ) (2025-06-27T20:00:51Z) - Real-time Addressee Estimation: Deployment of a Deep-Learning Model on
the iCub Robot [52.277579221741746]
住所推定は、社会ロボットが人間とスムーズに対話するために必要なスキルである。
人間の知覚スキルにインスパイアされたディープラーニングモデルは、iCubロボットに設計、訓練、デプロイされる。
本研究では,人間-ロボットのリアルタイムインタラクションにおいて,そのような実装の手順とモデルの性能について述べる。
論文 参考訳(メタデータ) (2023-11-09T13:01:21Z) - HandMeThat: Human-Robot Communication in Physical and Social
Environments [73.91355172754717]
HandMeThatは、物理的および社会的環境における命令理解とフォローの総合評価のためのベンチマークである。
HandMeThatには、人間とロボットの対話の1万エピソードが含まれている。
オフラインとオンラインの強化学習アルゴリズムはHandMeThatでは性能が良くないことを示す。
論文 参考訳(メタデータ) (2023-10-05T16:14:46Z) - Open-World Object Manipulation using Pre-trained Vision-Language Models [72.87306011500084]
ロボットが人からの指示に従うためには、人間の語彙の豊かな意味情報を繋げなければならない。
我々は、事前学習された視覚言語モデルを利用して、オブジェクト識別情報を抽出するシンプルなアプローチを開発する。
実際の移動マニピュレータにおける様々な実験において、MOOはゼロショットを様々な新しいオブジェクトカテゴリや環境に一般化する。
論文 参考訳(メタデータ) (2023-03-02T01:55:10Z) - "No, to the Right" -- Online Language Corrections for Robotic
Manipulation via Shared Autonomy [70.45420918526926]
LILACは、実行中に自然言語の修正をオンラインで実施し、適応するためのフレームワークである。
LILACは人間とロボットを個別にターンテイクする代わりに、人間とロボットの間にエージェンシーを分割する。
提案手法は,タスク完了率が高く,ユーザによって主観的に好まれることを示す。
論文 参考訳(メタデータ) (2023-01-06T15:03:27Z) - Whither the Priors for (Vocal) Interactivity? [6.709659274527638]
音声に基づくコミュニケーションは、人間とロボットが対話する最も自然な方法の1つとしてしばしば引用される。
それにもかかわらず、結果として生じる相互作用は自然に他ならない」。
このようなコミュニケーションの失敗は、より深い誤認の兆候である、とここでは主張されている。
論文 参考訳(メタデータ) (2022-03-16T12:06:46Z) - Learning Language-Conditioned Robot Behavior from Offline Data and
Crowd-Sourced Annotation [80.29069988090912]
本研究では,ロボットインタラクションの大規模なオフラインデータセットから視覚に基づく操作タスクを学習する問題について検討する。
クラウドソースの自然言語ラベルを用いたオフラインロボットデータセットの活用を提案する。
提案手法は目標画像仕様と言語条件付き模倣技術の両方を25%以上上回っていることがわかった。
論文 参考訳(メタデータ) (2021-09-02T17:42:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。