Fugu-MT 論文翻訳(概要): Whom to Respond To? A Transformer-Based Model for Multi-Party Social Robot Interaction

論文の概要: Whom to Respond To? A Transformer-Based Model for Multi-Party Social Robot Interaction

arxiv url: http://arxiv.org/abs/2507.10960v1
Date: Tue, 15 Jul 2025 03:42:14 GMT
ステータス: 翻訳完了
システム内更新日: 2025-07-16 19:46:02.974318
Title: Whom to Respond To? A Transformer-Based Model for Multi-Party Social Robot Interaction
Title（参考訳）: 誰が応答するか? 多人数ソーシャルロボットインタラクションのためのトランスフォーマーベースモデル
Authors: He Zhu, Ryo Miyoshi, Yuki Okafuji,
Abstract要約: 社会ロボットの意思決定プロセスを改善するために,トランスフォーマーを用いたマルチタスク学習フレームワークを提案する。我々は、視線ずれなどの現実世界の複雑さを捉えた、新しい多人数HRIデータセットを構築した。本研究は,自然とコンテキストを意識した多人数インタラクションを実現できる社会知能型社会ロボットの開発に寄与する。
参考スコア（独自算出の注目度）: 4.276453870301421
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Prior human-robot interaction (HRI) research has primarily focused on single-user interactions, where robots do not need to consider the timing or recipient of their responses. However, in multi-party interactions, such as at malls and hospitals, social robots must understand the context and decide both when and to whom they should respond. In this paper, we propose a Transformer-based multi-task learning framework to improve the decision-making process of social robots, particularly in multi-user environments. Considering the characteristics of HRI, we propose two novel loss functions: one that enforces constraints on active speakers to improve scene modeling, and another that guides response selection towards utterances specifically directed at the robot. Additionally, we construct a novel multi-party HRI dataset that captures real-world complexities, such as gaze misalignment. Experimental results demonstrate that our model achieves state-of-the-art performance in respond decisions, outperforming existing heuristic-based and single-task approaches. Our findings contribute to the development of socially intelligent social robots capable of engaging in natural and context-aware multi-party interactions.
Abstract（参考訳）: HRI(Human-robot Interaction)研究は、ロボットが応答のタイミングや受信を考慮する必要のない、シングルユーザーインタラクションに主に焦点を当てている。しかし、ショッピングモールや病院のような多人数のインタラクションでは、社会ロボットは状況を理解し、いつ、どこで応答すべきかを判断する必要がある。本稿では,社会ロボット,特にマルチユーザ環境における意思決定プロセスを改善するために,トランスフォーマーに基づくマルチタスク学習フレームワークを提案する。 HRIの特徴を考慮し、シーンモデリングを改善するために能動的話者に制約を課す機能と、ロボットに特異的に指示された発話に対する応答選択を導く機能とを新たに提案する。さらに,視線ずれなどの実世界の複雑さを捉えた,新しい多人数HRIデータセットを構築した。実験の結果,既存のヒューリスティック・アプローチやシングルタスク・アプローチよりも優れた結果が得られた。本研究は,自然とコンテキストを意識した多人数インタラクションを実現できる社会知能型社会ロボットの開発に寄与する。

関連論文リスト

Recognizing Actions from Robotic View for Natural Human-Robot Interaction [52.00935005918032]
自然人-ロボットインタラクション(Natural Human-Robot Interaction, N-HRI)は、ロボット自身が動いているか静止しているかに関わらず、ロボットが様々な距離と状態で人間の行動を認識することを要求する。 N-HRIの既存のベンチマークは、限られたデータ、モダリティ、タスクカテゴリ、主題や環境の多様性のために、N-HRIのユニークな複雑さに対処できない。モバイルサービスロボットで広く使われている知覚中心ロボットビューのための大規模データセット(Action from Robotic View)を紹介する。
論文参考訳（メタデータ） (2025-07-30T09:48:34Z)
The Human Robot Social Interaction (HSRI) Dataset: Benchmarking Foundational Models' Social Reasoning [49.32390524168273]
本研究は,実世界のソーシャルインタラクションにおいて,人工知能(AI)エージェントの社会的推論を促進することを目的としている。我々は、言語モデル(LM)と基礎モデル(FM)の能力をベンチマークするために、大規模な実世界のヒューマンロボット社会インタラクション(HSRI)データセットを導入する。私たちのデータセットは、400以上の現実世界の人間のソーシャルロボットインタラクションビデオと10K以上のアノテーションで構成され、ロボットの社会的エラー、能力、合理性、修正行動の詳細を記述しています。
論文参考訳（メタデータ） (2025-04-07T06:27:02Z)
HARMONIC: Cognitive and Control Collaboration in Human-Robotic Teams [2.6627293764668902]
本稿では,人間ロボットチーム(HRT)に適用された汎用ロボット制御システムと,OntoAgent認知フレームワークを統合した認知ロボティックアーキテクチャについて述べる。 Harmonicはメタ認知、意味のある自然言語通信、HRTの相互信頼開発に必要な説明可能性を備えている。
論文参考訳（メタデータ） (2024-09-26T16:48:21Z)
Robot Interaction Behavior Generation based on Social Motion Forecasting for Human-Robot Interaction [9.806227900768926]
本稿では,共有ロボット表現空間における社会的動き予測のモデル化を提案する。 ECHOは上記の共有空間で活動し、社会的シナリオで遭遇したエージェントの将来の動きを予測する。我々は,多対人動作予測タスクにおけるモデルの評価を行い,最先端の性能を大きなマージンで獲得する。
論文参考訳（メタデータ） (2024-02-07T11:37:14Z)
Real-time Addressee Estimation: Deployment of a Deep-Learning Model on the iCub Robot [52.277579221741746]
住所推定は、社会ロボットが人間とスムーズに対話するために必要なスキルである。人間の知覚スキルにインスパイアされたディープラーニングモデルは、iCubロボットに設計、訓練、デプロイされる。本研究では,人間-ロボットのリアルタイムインタラクションにおいて,そのような実装の手順とモデルの性能について述べる。
論文参考訳（メタデータ） (2023-11-09T13:01:21Z)
Proceeding of the 1st Workshop on Social Robots Personalisation At the crossroads between engineering and humanities (CONCATENATE) [37.838596863193565]
本ワークショップは,ロボット工学におけるパーソナライゼーションに関する学際的な議論を提起することを目的としている。異なる分野の研究者を集結させ、パーソナライズのためのガイドラインを提案することを目的としている。
論文参考訳（メタデータ） (2023-07-10T11:11:24Z)
Data-driven emotional body language generation for social robotics [58.88028813371423]
社会ロボティクスでは、人間型ロボットに感情の身体的表現を生成する能力を与えることで、人間とロボットの相互作用とコラボレーションを改善することができる。我々は、手作業で設計されたいくつかの身体表現から学習する深層学習データ駆動フレームワークを実装した。評価実験の結果, 生成した表現の人間同型とアニマシーは手作りの表現と異なる認識が得られなかった。
論文参考訳（メタデータ） (2022-05-02T09:21:39Z)
Human-Robot Collaboration and Machine Learning: A Systematic Review of Recent Research [69.48907856390834]
人間ロボットコラボレーション(Human-robot collaboration、HRC)とは、人間とロボットの相互作用を探索する手法である。本稿では,HRCの文脈における機械学習技術の利用に関する詳細な文献レビューを提案する。
論文参考訳（メタデータ） (2021-10-14T15:14:33Z)
A MultiModal Social Robot Toward Personalized Emotion Interaction [1.2183405753834562]
本研究では,ロボットインタラクションポリシーを強化するために,強化学習を伴うマルチモーダルヒューマンロボットインタラクション(HRI)フレームワークを実証する。目標は、ロボットがより自然で魅力的なHRIフレームワークを作れるように、このフレームワークを社会シナリオに適用することだ。
論文参考訳（メタデータ） (2021-10-08T00:35:44Z)
Cognitive architecture aided by working-memory for self-supervised multi-modal humans recognition [54.749127627191655]
人間パートナーを認識する能力は、パーソナライズされた長期的な人間とロボットの相互作用を構築するための重要な社会的スキルです。ディープラーニングネットワークは最先端の結果を達成し,そのような課題に対処するための適切なツールであることが実証された。 1つの解決策は、ロボットに自己スーパービジョンで直接の感覚データから学習させることである。
論文参考訳（メタデータ） (2021-03-16T13:50:24Z)
Controlling the Sense of Agency in Dyadic Robot Interaction: An Active Inference Approach [6.421670116083633]
変形型繰り返しニューラルネットワークモデルを用いて,ロボットのダイアディック模倣相互作用を検討する。トレーニング中の自由エネルギーを最小化する複雑性項の制御が,ネットワークの動的特性をいかに決定するかを検討した。
論文参考訳（メタデータ） (2021-03-03T02:38:09Z)
Affect-Driven Modelling of Robot Personality for Collaborative Human-Robot Interactions [16.40684407420441]
協調的な相互作用は、人間の感情的行動のダイナミクスに適応するために社会ロボットを必要とする。社会ロボットにおける人格駆動行動生成のための新しい枠組みを提案する。
論文参考訳（メタデータ） (2020-10-14T16:34:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。