論文の概要: Users and Wizards in Conversations: How WoZ Interface Choices Define Human-Robot Interactions
- arxiv url: http://arxiv.org/abs/2603.28338v1
- Date: Mon, 30 Mar 2026 12:09:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.377337
- Title: Users and Wizards in Conversations: How WoZ Interface Choices Define Human-Robot Interactions
- Title(参考訳): 会話におけるユーザとウィザード:WoZインタフェースが人間とロボットのインタラクションをどのように定義するか
- Authors: Ekaterina Torubarova, Jura Miniota, Andre Pereira,
- Abstract要約: ユーザとウィザードの両方の観点から,WoZインタフェースの選択がロボットとのコミュニケーションに与える影響について検討した。
また,VRインタフェースを介するインタラクションは,ロボット機能や社会的存在感の観点から,ユーザが好んでいることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we investigated how the choice of a Wizard-of-Oz (WoZ) interface affects communication with a robot from both the user's and the wizard's perspective. In a conversational setting, we used three WoZ interfaces with varying levels of dialogue input and output restrictions: a) a restricted perception GUI that showed fixed-view video and ASR transcripts and let the wizard trigger pre-scripted utterances and gestures; b) an unrestricted perception GUI that added real-time audio from the participant and the robot c) a VR telepresence interface that streamed immersive stereo video and audio to the wizard and forwarded the wizard's spontaneous speech, gaze and facial expressions to the robot. We found that the interaction mediated by the VR interface was preferred by users in terms of robot features and perceived social presence. For the wizards, the VR condition turned out to be the most demanding but elicited a higher social connection with the users. VR interface also induced the most connected interaction in terms of inter-speaker gaps and overlaps, while Restricted GUI induced the least connected flow and the largest silences. Given these results, we argue for more WoZ studies using telepresence interfaces. These studies better reflect the robots of tomorrow and offer a promising path to automation based on naturalistic contextualized verbal and non-verbal behavioral data.
- Abstract(参考訳): 本稿では,Wizard-of-Oz(WoZ)インタフェースの選択が,ユーザとウィザードの両方の観点からロボットとのコミュニケーションに与える影響について検討した。
会話設定では、3つのWoZインタフェースを使用し、対話入力と出力制限のレベルが異なる。
a) 固定視ビデオ及びASR文字起こしを示し、ウィザードに予め記述された発声及びジェスチャーをトリガーさせる制限された知覚GUI
ロ 参加者及びロボットからのリアルタイム音声を付加した制限のない知覚GUI
c)没入型ステレオビデオと音声をウィザードに流し、ウィザードの自然発声、視線、表情をロボットに転送するVRテレプレゼンスインターフェース。
また,VRインタフェースを介するインタラクションは,ロボット機能や社会的存在感の観点から,ユーザが好んでいることがわかった。
ウィザードにとって、VRの条件は最も要求が多かったが、ユーザーとのソーシャルなつながりが強かった。
また、VRインターフェースはスピーカー間のギャップとオーバーラップの観点から最も接続されたインタラクションを誘導し、Restricted GUIは最も接続の少ないフローと最大のサイレントを誘導した。
これらの結果から, テレプレゼンスインタフェースを用いたWoZ研究の進展を論じる。
これらの研究は、明日のロボットをよりよく反映し、自然主義的な文脈化言語と非言語行動データに基づく自動化への有望な道を提供する。
関連論文リスト
- Interface-Aware Trajectory Reconstruction of Limited Demonstrations for Robot Learning [0.4199844472131921]
本稿では,ロボットの完全な制御空間にデモを持ち込む軌道再構成アルゴリズムを提案する。
本研究では,2次元ジョイスティックと1次元シップ・アンド・パフ制御インタフェースを用いて,ADLにインスパイアされたタスクの現実的な実演によるアプローチの評価を行った。
論文 参考訳(メタデータ) (2026-02-26T18:01:25Z) - SARAH: Spatially Aware Real-time Agentic Humans [58.32612596034656]
ストリーミングVRヘッドセット上に展開可能な空間認識型対話動作のための,初のリアルタイム完全因果的手法を提案する。
ユーザの位置とダイアディックな音声を考慮に入れたアプローチでは,エージェントの向きをユーザに応じて調整しながら,ジェスチャーを音声と整列させる全体動作を生成する。
実写VRシステムに対する我々のアプローチを検証し,空間認識型対話エージェントをリアルタイム展開に適用する。
論文 参考訳(メタデータ) (2026-02-20T18:59:35Z) - Explainable OOHRI: Communicating Robot Capabilities and Limitations as Augmented Reality Affordances [5.363623643280699]
本稿では,ロボットの動作可能性と制約を伝達する拡張現実(AR)インターフェースであるX-OOHRIを提案する。
本システムは,視覚言語モデルを用いてオブジェクト特性とロボットの限界をオブジェクト指向構造にエンコードする。
エンド・ツー・エンドのパイプラインを物理ロボットと統合し、低レベルのピック・アンド・プレイスから高レベルの命令まで多様なユースケースを示す。
論文 参考訳(メタデータ) (2026-01-21T01:53:47Z) - XR$^3$: An Extended Reality Platform for Social-Physical Human-Robot Interaction [7.5509967369489965]
提案するXR$3$は、HRI研究のための、共位置演算子と隠れたデュアルVRヘッドセットプラットフォームである。
ロボットの上半身の動き、頭と目の動き、表情は、操作者の追跡された手足と顔信号からマッピングされる。
システム設計とキャリブレーションを詳述し、タッチベースのWizard-of-Oz研究でそのプラットフォームを実証する。
論文 参考訳(メタデータ) (2026-01-18T13:11:41Z) - Bidirectional Human-Robot Communication for Physical Human-Robot Interaction [13.222878560524896]
BRIDGEは、物理的支援における双方向の人間ロボット通信システムである。
提案手法では,自然言語を用いてロボットの計画軌道をリアルタイムで修正することができる。
本システムでは, ユーザに対して, 結果の変化の確認や, 明確な疑問の呈示など, 言葉によるフィードバックを提供する。
論文 参考訳(メタデータ) (2026-01-15T19:01:02Z) - RoboOmni: Proactive Robot Manipulation in Omni-modal Context [165.09049429566238]
我々は,音声対話や環境音,視覚的手がかりから意図を導出する,クロスモーダルな文脈指示を導入する。
目的認識,インタラクション確認,アクション実行を統一する,エンドツーエンドのOmni-Modal LLMに基づくフレームワークであるRoboOmniを提案する。
シミュレーションと実世界の設定の実験では、Robo OmniはテキストベースとASRベースのベースラインを越え、成功率、推論速度、意図認識、積極的に支援している。
論文 参考訳(メタデータ) (2025-10-27T18:49:03Z) - Generative Interfaces for Language Models [70.25765232527762]
ユーザインタフェース(UI)を積極的に生成することにより,大規模言語モデル(LLM)がユーザクエリに応答するパラダイムを提案する。
本フレームワークは,ユーザクエリをタスク固有のUIに変換するために,構造化インターフェース固有の表現と反復的洗練を活用している。
その結果、生成的インタフェースは人間の嗜好を最大72%改善し、会話的インタフェースよりも一貫して優れていた。
論文 参考訳(メタデータ) (2025-08-26T17:43:20Z) - Ain't Misbehavin' -- Using LLMs to Generate Expressive Robot Behavior in
Conversations with the Tabletop Robot Haru [9.2526849536751]
本稿では,大規模言語モデル(LLM)を利用して,表現行動を伴うロボット応答を生成する,完全自動会話システムを提案する。
提案したシステムを用いて,ボランティアが社会ロボットとチャットし,そのフィードバックを分析し,チャットテキストの厳密な誤り解析を行う。
最も否定的なフィードバックは、会話に限られた影響を及ぼす自動音声認識(ASR)エラーによるものだった。
論文 参考訳(メタデータ) (2024-02-18T12:35:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。