論文の概要: Legible and Intuitive Multi-modal Robot State and Intent Communication Validated in Online and Real-world Studies
- arxiv url: http://arxiv.org/abs/2606.24445v1
- Date: Tue, 23 Jun 2026 11:27:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.916496
- Title: Legible and Intuitive Multi-modal Robot State and Intent Communication Validated in Online and Real-world Studies
- Title(参考訳): オンラインおよび実世界研究における正当かつ直感的な多モードロボットの状態と意図的コミュニケーションの検証
- Authors: Tim Schreiter, Jens V. Rüppel, Andrey Rudenko, Martin Magnusson, Achim J. Lilienthal,
- Abstract要約: 本研究では,移動型非ヒューマノイドロボットにおける既存のコミュニケーション戦略の体系的,大規模比較検証を行う。
我々は,旋回意図,注意要求,エラー状況,ロボットが立ち往生しているかどうか,正常に機能しているかどうかを解析する。
高度に表現力のあるマルチモーダル通信が,LEDを用いたコミュニケーションよりも正確で直感的なコミュニケーションであると認識されるという強い証拠が得られている。
- 参考スコア(独自算出の注目度): 6.912665639713635
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Effective robot-to-human communication can increase transparency and trust, reduce uncertainty, and contribute to safer collaboration in shared workspaces. Designing and validating an effective robot communication strategy is challenging due to the varying and often limited communication modalities across robots, differences in how diverse recipients interpret messages, and the underexplored virtual-to-real gap in studies of communication legibility. We present a systematic, large-scale comparative validation of existing communication strategies for a mobile non-humanoid robot across message types and settings (online and in-person). Based on the prescribed message types in the existing standards for industrial robots, we realize and compare a low-expressive, unimodal LED-based strategy with a highly expressive, multimodal one that leverages robotic gaze, gestures, and voice. For each strategy, we analyze the communication of a turning intention, an attention request, error status, whether the robot is stuck, and whether it is functioning normally. We evaluate these strategies in replicated online and in-person experiments. We find strong evidence that highly expressive multimodal communication is perceived as more legible and intuitive than unimodal LED-based communication. Comparing the online and real-world study findings, we observe a notable decrease in overall legibility, particularly for signaling with LEDs. Similarly, confidence in message interpretation decreases during the real-world evaluation.
- Abstract(参考訳): 効果的なロボット間コミュニケーションは、透明性と信頼を高め、不確実性を低減し、共有ワークスペースにおけるより安全なコラボレーションに寄与する。
効果的なロボットコミュニケーション戦略の設計と検証は、ロボット間のコミュニケーションのモダリティが多様で制限されていること、受信者がメッセージの解釈方法の違い、そしてコミュニケーションの正当性の研究における未調査の仮想対現実のギャップによって困難である。
本研究では,メッセージタイプや設定(オンライン,対人)にまたがる移動型非ヒューマノイドロボットにおける既存のコミュニケーション戦略の体系的,大規模比較検証を行う。
産業用ロボットの既存の標準における所定のメッセージタイプに基づいて、ロボットの視線、ジェスチャー、音声を利用した、表現力の低い、単調なLEDベースの戦略と、高度に表現力のあるマルチモーダルな戦略を実現し、比較する。
各戦略について,旋回意図,注意要求,エラー状況,ロボットが立ち往生しているかどうか,正常に機能しているかどうかを解析する。
再現されたオンラインおよび対人実験において,これらの戦略を評価する。
高度に表現力のあるマルチモーダル通信が,LEDを用いたコミュニケーションよりも正確で直感的なコミュニケーションであると認識されるという強い証拠が得られている。
オンラインおよび実世界の研究結果と比較すると、特にLEDによる信号処理において、全体の可視性は顕著に低下している。
同様に、実世界の評価において、メッセージ解釈の信頼性は低下する。
関連論文リスト
- HyLaT: Efficient Multi-Agent Communication via Hybrid Latent-Text Protocol [54.411053382333996]
HyLaTは、遅延チャネルを介して詳細な認知信号を伝達し、効率を上げるためのハイブリッド潜在テキスト通信プロトコルである。
エージェントがハイブリッドメッセージを生成・解釈できるように、シングルエージェントハイブリッド生成学習とマルチエージェントインタラクティブコトレーニングを組み合わせた2段階のトレーニングフレームワークを提案する。
実験により、HyLaTは、多様な設定で強力な一般化と堅牢性を持って、競争力のあるタスク性能を維持しながら、通信オーバーヘッドを著しく低減することが示された。
論文 参考訳(メタデータ) (2026-05-25T04:50:15Z) - Do Robots Need Body Language? Comparing Communication Modalities for Legible Motion Intent in Human-Shared Spaces [22.039354879428497]
ハイDoFロボットは、人々が意図的、意図的に読み取る動きを示しており、そのような手がかりがどのように認識されているかを理解することが重要である。
我々は,四足歩行ロボットの今後のナビゲーション動作を理解する能力について,さまざまなシグナリング・モダリティ,表現運動,光,テキスト,音声などを評価するオンラインビデオスタディを提案する。
論文 参考訳(メタデータ) (2026-04-03T20:53:05Z) - Learning to Generate Pointing Gestures in Situated Embodied Conversational Agents [19.868403110796105]
本稿では,模倣と強化学習を組み合わせることで,具体的エージェントのポインティングジェスチャーを生成する枠組みを提案する。
我々は,客観的指標と仮想空間的参照ゲームの両方において,教師付き学習と検索のベースラインに対するアプローチを評価する。
論文 参考訳(メタデータ) (2025-09-15T23:15:15Z) - Beyond Sight: Finetuning Generalist Robot Policies with Heterogeneous Sensors via Language Grounding [85.63710017456792]
FuSeは、不均一なセンサのモダリティに対する微調整型ビズモータ一般政策を可能にする新しいアプローチである。
FuSeは視覚,触覚,音などのモーダル性に対して共同で推論を必要とする挑戦的なタスクを実行できることを示す。
実世界での実験では、FuSeisはすべての基準ラインと比較して成功率を20%以上引き上げることができた。
論文 参考訳(メタデータ) (2025-01-08T18:57:33Z) - Over-communicate no more: Situated RL agents learn concise communication
protocols [78.28898217947467]
互いに効果的に効率的にコミュニケーションできる人工エージェントをいかに設計するかは、不明である。
強化学習(RL)を用いたコミュニケーションの出現に関する研究
エージェントがコミュニケーションを行うための環境行為を強制しなければならない多段階タスクにおける位置的コミュニケーションについて検討する。
テストされたすべてのプレッシャーは過剰なコミュニケーションを阻害する可能性があるが、位置通信は最も効果的であり、努力のコストとは異なり、発生に悪影響を及ぼさない。
論文 参考訳(メタデータ) (2022-11-02T21:08:14Z) - Multimodal Emotion Recognition using Transfer Learning from Speaker
Recognition and BERT-based models [53.31917090073727]
本稿では,音声とテキストのモダリティから,伝達学習モデルと微調整モデルとを融合したニューラルネットワークによる感情認識フレームワークを提案する。
本稿では,対話型感情的モーションキャプチャー・データセットにおけるマルチモーダル・アプローチの有効性を評価する。
論文 参考訳(メタデータ) (2022-02-16T00:23:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。