論文の概要: ExpressMM: Expressive Mobile Manipulation Behaviors in Human-Robot Interactions
- arxiv url: http://arxiv.org/abs/2604.05320v2
- Date: Fri, 10 Apr 2026 21:40:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 14:47:45.588395
- Title: ExpressMM: Expressive Mobile Manipulation Behaviors in Human-Robot Interactions
- Title(参考訳): ExpressMM:人間とロボットのインタラクションにおける高速移動操作行動
- Authors: Souren Pashangpour, Haitong Wang, Matthew Lisondra, Goldie Nejat,
- Abstract要約: 我々は,人間とロボットの相互作用において,表現力のあるロボット行動を生成するための新しいExpressMMフレームワークを開発した。
協調組立シナリオにおいて,人間を支援する移動マニピュレータ上でExpressMMを実演する。
その結果,ExpressMMによる表現行動は,ロボットの行動や意図を明確に解釈するのに役立つことがわかった。
- 参考スコア(独自算出の注目度): 3.7698603952231777
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mobile manipulators are increasingly deployed in human-centered environments to perform tasks. While completing such tasks, they should also be able to communicate their intent to the people around them using expressive robot behaviors. Prior work on expressive robot behaviors has used preprogrammed or learning-from-demonstration- based expressive motions and large language model generated high-level interactions. The majority of these existing approaches have not considered human-robot interactions (HRI) where users may interrupt, modify, or redirect a robot's actions during task execution. In this paper, we develop the novel ExpressMM framework that integrates a high-level language-guided planner based on a vision-language model for perception and conversational reasoning with a low-level vision-language-action policy to generate expressive robot behaviors during collaborative HRI tasks. Furthermore, ExpressMM supports interruptible interactions to accommodate updated or redirecting instructions by users. We demonstrate ExpressMM on a mobile manipulator assisting a human in a collaborative assembly scenario and conduct audience-based evaluation of live HRI demonstrations. Questionnaire results show that the ExpressMM-enabled expressive behaviors helped observers clearly interpret the robot's actions and intentions while supporting socially appropriate and understandable interactions. Participants also reported that the robot was useful for collaborative tasks and behaved in a predictable and safe manner during the demonstrations, fostering positive perceptions of the robot's usefulness, safety, and predictability during the collaborative tasks.
- Abstract(参考訳): モバイルマニピュレータは、タスクを実行するために人間中心の環境にますますデプロイされる。
このようなタスクを完了している間に、表現力のあるロボットの振る舞いを使って周囲の人々に意思を伝えることもできる。
表現型ロボットの動作に関するこれまでの研究は、事前にプログラムされた、あるいは、実証に基づく表現型動作と、大規模言語モデルによって高レベルな相互作用が生み出されてきた。
これらの既存のアプローチのほとんどは、タスク実行中にロボットの動作を中断、修正、リダイレクトできるヒューマンロボットインタラクション(HRI)を考慮していない。
本稿では,ハイレベルな言語誘導型プランナを低レベルな視覚・言語・行動ポリシーで認識・会話推論のための視覚・言語モデルに基づいて統合し,協調的HRI作業中に表現型ロボットの動作を生成する,新しいExpressMMフレームワークを開発する。
さらに、ExpressMMは、ユーザによる更新またはリダイレクト命令に対応するために、割り込み可能なインタラクションをサポートする。
我々は,協調的な組み立てシナリオにおいて,人間を支援する移動マニピュレータ上でExpressMMを実演し,ライブHRIデモのオーディエンスによる評価を行う。
質問紙調査の結果,ExpressMMによる表現行動は,ロボットの行動や意図を明確に解釈し,社会的に適切かつ理解可能な対話を支援するのに役立つことがわかった。
参加者はまた、ロボットは協調作業に有用であり、デモンストレーション中に予測可能かつ安全に行動し、協調作業中のロボットの有用性、安全性、予測可能性に対する肯定的な認識を育んだと報告した。
関連論文リスト
- Using Vision-Language Models as Proxies for Social Intelligence in Human-Robot Interaction [16.018759023223502]
我々は、人々が非言語的行動を通じて対話の準備ができていることを示す方法と、専門家ウィザードがエンゲージメントをガイドするためにこれらの手がかりをどのように利用するかを分析する。
本稿では,より重いビデオベース視覚言語モデル (VLM) クエリを選択的にトリガーするために,軽量な知覚検出器を用いた2段階パイプラインを提案する。
本研究は,VLMを社会的推論のプロキシとして選択的に使用することにより,社会的に応答するロボットの動作が可能であることを示唆している。
論文 参考訳(メタデータ) (2025-12-08T05:17:58Z) - RoboOmni: Proactive Robot Manipulation in Omni-modal Context [165.09049429566238]
我々は,音声対話や環境音,視覚的手がかりから意図を導出する,クロスモーダルな文脈指示を導入する。
目的認識,インタラクション確認,アクション実行を統一する,エンドツーエンドのOmni-Modal LLMに基づくフレームワークであるRoboOmniを提案する。
シミュレーションと実世界の設定の実験では、Robo OmniはテキストベースとASRベースのベースラインを越え、成功率、推論速度、意図認識、積極的に支援している。
論文 参考訳(メタデータ) (2025-10-27T18:49:03Z) - EMOTION: Expressive Motion Sequence Generation for Humanoid Robots with In-Context Learning [10.266351600604612]
本稿では,ヒューマノイドロボットにおける表現型動き列を生成するためのEMOTIONというフレームワークを提案する。
本研究では,EMOTIONが生成する動作の自然性と理解性を比較したオンラインユーザ研究を行い,その人間フィードバックバージョンであるEMOTION++について述べる。
論文 参考訳(メタデータ) (2024-10-30T17:22:45Z) - Comparing Apples to Oranges: LLM-powered Multimodal Intention Prediction in an Object Categorization Task [17.190635800969456]
本稿では,ロボットとの協調的な対象分類タスクにおいて,人間の意図を推定するために,Large Language Modelsを用いて検討する。
本研究では, ユーザの身振り, 身振り, 表情などの非言語的手がかりを, ユーザの意図を予測するために, 環境状態やユーザの言葉的手がかりと統合する, 新たなマルチモーダルアプローチを提案する。
論文 参考訳(メタデータ) (2024-04-12T12:15:14Z) - Real-time Addressee Estimation: Deployment of a Deep-Learning Model on
the iCub Robot [52.277579221741746]
住所推定は、社会ロボットが人間とスムーズに対話するために必要なスキルである。
人間の知覚スキルにインスパイアされたディープラーニングモデルは、iCubロボットに設計、訓練、デプロイされる。
本研究では,人間-ロボットのリアルタイムインタラクションにおいて,そのような実装の手順とモデルの性能について述べる。
論文 参考訳(メタデータ) (2023-11-09T13:01:21Z) - A ROS Architecture for Personalised HRI with a Bartender Social Robot [61.843727637976045]
BRILLOプロジェクトの目的は、自律的なロボットバーテンダーを作ることだ。
本稿では、異なる社会信号の処理を管理する知覚層と、多人数インタラクションを処理する意思決定層と、腕と顔からなる複雑なロボットの動作を制御する実行層を統合した3層ROSアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-03-13T11:33:06Z) - A MultiModal Social Robot Toward Personalized Emotion Interaction [1.2183405753834562]
本研究では,ロボットインタラクションポリシーを強化するために,強化学習を伴うマルチモーダルヒューマンロボットインタラクション(HRI)フレームワークを実証する。
目標は、ロボットがより自然で魅力的なHRIフレームワークを作れるように、このフレームワークを社会シナリオに適用することだ。
論文 参考訳(メタデータ) (2021-10-08T00:35:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。