論文の概要: User Experience Estimation in Human-Robot Interaction Via Multi-Instance Learning of Multimodal Social Signals
- arxiv url: http://arxiv.org/abs/2507.23544v1
- Date: Thu, 31 Jul 2025 13:34:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 17:19:09.824576
- Title: User Experience Estimation in Human-Robot Interaction Via Multi-Instance Learning of Multimodal Social Signals
- Title(参考訳): マルチモーダル社会信号のマルチインスタンス学習による人間-ロボットインタラクションのユーザエクスペリエンス推定
- Authors: Ryo Miyoshi, Yuki Okafuji, Takuya Iwamoto, Junya Nakanishi, Jun Baba,
- Abstract要約: 本研究では,マルチモーダルな社会信号を利用したヒューマンロボットインタラクション(HRI)のUX推定手法を提案する。
時間的観測に依存する従来のモデルとは異なり、我々のアプローチは短期と長期の両方の相互作用パターンをキャプチャする。
実験結果から,UX推定において,本手法は第三者による評価よりも優れていることが示された。
- 参考スコア(独自算出の注目度): 2.7138092972120766
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, the demand for social robots has grown, requiring them to adapt their behaviors based on users' states. Accurately assessing user experience (UX) in human-robot interaction (HRI) is crucial for achieving this adaptability. UX is a multi-faceted measure encompassing aspects such as sentiment and engagement, yet existing methods often focus on these individually. This study proposes a UX estimation method for HRI by leveraging multimodal social signals. We construct a UX dataset and develop a Transformer-based model that utilizes facial expressions and voice for estimation. Unlike conventional models that rely on momentary observations, our approach captures both short- and long-term interaction patterns using a multi-instance learning framework. This enables the model to capture temporal dynamics in UX, providing a more holistic representation. Experimental results demonstrate that our method outperforms third-party human evaluators in UX estimation.
- Abstract(参考訳): 近年, 社会ロボットの需要が増加し, ユーザの状況に応じて行動に適応する必要が生じた。
ヒューマンロボットインタラクション(HRI)におけるユーザエクスペリエンス(UX)の正確な評価は、この適応性を実現する上で重要である。
UXは感情やエンゲージメントといった側面を包含する多面的尺度だが、既存の手法は個々の側面にフォーカスすることが多い。
本研究では,マルチモーダル社会信号を利用したHRIのUX推定手法を提案する。
UXデータセットを構築し,表情と音声を推定に用いるTransformerベースのモデルを開発した。
時間的観測に依存する従来のモデルとは異なり,本手法は複数インスタンス学習フレームワークを用いて,短期的および長期的相互作用パターンをキャプチャする。
これにより、モデルがUX内の時間的ダイナミクスをキャプチャし、より包括的な表現を提供することができる。
実験の結果,この手法はUX推定において,第三者による評価よりも優れていた。
関連論文リスト
- MoVEInt: Mixture of Variational Experts for Learning Human-Robot Interactions from Demonstrations [19.184155232662995]
我々は,人間-ロボットインタラクション(HRI)のための共有潜在空間表現学習のための新しいアプローチを提案する。
本研究では,情報的潜在空間を用いて,ロボットの動きを正規化するための変分オートエンコーダ(VAE)を訓練する。
VAEにおける人間の観察に先立って情報的MDNを使用するアプローチは,より正確なロボットの動きを生成する。
論文 参考訳(メタデータ) (2024-07-10T13:16:12Z) - RealDex: Towards Human-like Grasping for Robotic Dexterous Hand [64.33746404551343]
本稿では,人間の行動パターンを取り入れた手の動きを正確に把握する先駆的データセットであるRealDexを紹介する。
RealDexは、現実のシナリオにおける認識、認識、操作を自動化するためのヒューマノイドロボットを進化させる上で、大きな可能性を秘めている。
論文 参考訳(メタデータ) (2024-02-21T14:59:46Z) - Enhancing HOI Detection with Contextual Cues from Large Vision-Language Models [56.257840490146]
ConCueは、HOI検出における視覚的特徴抽出を改善するための新しいアプローチである。
コンテクストキューをインスタンスと相互作用検出器の両方に統合するマルチトウワーアーキテクチャを用いたトランスフォーマーベースの特徴抽出モジュールを開発した。
論文 参考訳(メタデータ) (2023-11-26T09:11:32Z) - Versatile User Identification in Extended Reality using Pretrained Similarity-Learning [16.356961801884562]
類似性学習モデルを開発し、“Who Is Alyx?”データセットで事前学習する。
従来の分類学習ベースラインと比較して,本モデルは優れた性能を示す。
本手法は,実運用XRシステムにおける事前学習した動きに基づく識別モデルの容易な統合方法である。
論文 参考訳(メタデータ) (2023-02-15T08:26:24Z) - Predicting the long-term collective behaviour of fish pairs with deep learning [52.83927369492564]
本研究では,魚種Hemigrammus rhodostomusの社会的相互作用を評価するための深層学習モデルを提案する。
我々は、ディープラーニングのアプローチの結果と実験結果と、最先端の分析モデルの結果を比較した。
機械学習モデルにより、ソーシャルインタラクションは、微妙な実験的観測可能な解析的相互作用と直接競合できることを実証する。
論文 参考訳(メタデータ) (2023-02-14T05:25:03Z) - Multi-Timescale Modeling of Human Behavior [0.18199355648379031]
本稿では,行動情報を複数の時間スケールで処理し,将来の行動を予測するLSTMネットワークアーキテクチャを提案する。
我々は、仮想Minecraftベースのテストベッドでシミュレーションした都市検索・救助シナリオで収集したデータに基づいて、アーキテクチャを評価する。
論文 参考訳(メタデータ) (2022-11-16T15:58:57Z) - Comparison of Spatio-Temporal Models for Human Motion and Pose
Forecasting in Face-to-Face Interaction Scenarios [47.99589136455976]
本稿では,行動予測のための最新手法の体系的比較を行った。
UDIVA v0.5の最先端性能を実現するのに最も注意を払っているアプローチである。
短期的に訓練された手法で未来を自動回帰予測することで、かなり長期にわたってベースラインを上回ります。
論文 参考訳(メタデータ) (2022-03-07T09:59:30Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。