論文の概要: Real-time Addressee Estimation: Deployment of a Deep-Learning Model on
the iCub Robot
- arxiv url: http://arxiv.org/abs/2311.05334v1
- Date: Thu, 9 Nov 2023 13:01:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-10 15:15:28.020727
- Title: Real-time Addressee Estimation: Deployment of a Deep-Learning Model on
the iCub Robot
- Title(参考訳): リアルタイム出席者推定:iCubロボットにおける深層学習モデルの展開
- Authors: Carlo Mazzola, Francesco Rea, Alessandra Sciutti
- Abstract要約: 住所推定は、社会ロボットが人間とスムーズに対話するために必要なスキルである。
人間の知覚スキルにインスパイアされたディープラーニングモデルは、iCubロボットに設計、訓練、デプロイされる。
本研究では,人間-ロボットのリアルタイムインタラクションにおいて,そのような実装の手順とモデルの性能について述べる。
- 参考スコア(独自算出の注目度): 52.277579221741746
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Addressee Estimation is the ability to understand to whom a person is
talking, a skill essential for social robots to interact smoothly with humans.
In this sense, it is one of the problems that must be tackled to develop
effective conversational agents in multi-party and unstructured scenarios. As
humans, one of the channels that mainly lead us to such estimation is the
non-verbal behavior of speakers: first of all, their gaze and body pose.
Inspired by human perceptual skills, in the present work, a deep-learning model
for Addressee Estimation relying on these two non-verbal features is designed,
trained, and deployed on an iCub robot. The study presents the procedure of
such implementation and the performance of the model deployed in real-time
human-robot interaction compared to previous tests on the dataset used for the
training.
- Abstract(参考訳): 宛先推定とは、相手が話している相手を理解する能力であり、社会ロボットが人間とスムーズに対話するために必要なスキルである。
この意味では、マルチパーティや非構造化のシナリオにおいて効果的な会話エージェントを開発するために取り組まなければならない問題の1つです。
人間として、このような推定を主に導くチャネルの1つは、話者の非言語的行動である: まず、その視線と身体のポーズ。
人間の知覚的スキルに触発されて,本研究では,これら2つの非言語的特徴に依拠して,icubロボットを設計,訓練,展開する,問答者推定のための深層学習モデルについて述べる。
本研究は, 実時間人間-ロボットインタラクションに展開されたモデルの実装手順と性能を, トレーニングに用いるデータセットの以前のテストと比較した。
関連論文リスト
- Human-Robot Mutual Learning through Affective-Linguistic Interaction and Differential Outcomes Training [Pre-Print] [0.3811184252495269]
本研究では,感情言語コミュニケーションが人間ロボットの文脈における相互学習にどのように影響するかを検証する。
児童介護のダイナミックスからインスピレーションを得て、私たちの人間とロボットのインタラクションのセットアップは、内部的、ホメオスタティックに制御されたニーズのコミュニケーション方法を学ぶための(シミュレートされた)ロボットで構成されています。
論文 参考訳(メタデータ) (2024-07-01T13:35:08Z) - A Multi-Modal Explainability Approach for Human-Aware Robots in Multi-Party Conversation [39.87346821309096]
本稿では,従来のSOTAと比較して性能が向上したアドレス推定モデルを提案する。
また、上記のアーキテクチャに説明可能性と透明性を組み込むいくつかの方法を提案する。
論文 参考訳(メタデータ) (2024-05-20T13:09:32Z) - HandMeThat: Human-Robot Communication in Physical and Social
Environments [73.91355172754717]
HandMeThatは、物理的および社会的環境における命令理解とフォローの総合評価のためのベンチマークである。
HandMeThatには、人間とロボットの対話の1万エピソードが含まれている。
オフラインとオンラインの強化学習アルゴリズムはHandMeThatでは性能が良くないことを示す。
論文 参考訳(メタデータ) (2023-10-05T16:14:46Z) - Towards a Real-time Measure of the Perception of Anthropomorphism in
Human-robot Interaction [5.112850258732114]
我々は,オンラインの人間とロボットのインタラクション実験を,教育現場で実施した。
この研究には43人の英語話者が参加した。
その結果,擬人化の主観的・客観的知覚の程度は,音響・韻律的エントレメントと正の相関が認められた。
論文 参考訳(メタデータ) (2022-01-24T11:10:37Z) - Few-Shot Visual Grounding for Natural Human-Robot Interaction [0.0]
本稿では,人間ユーザによって音声で示される,混み合ったシーンから対象物を分割するソフトウェアアーキテクチャを提案する。
システムのコアでは、視覚的な接地のためにマルチモーダルディープニューラルネットワークを使用します。
公開シーンデータセットから収集した実RGB-Dデータに対して,提案モデルの性能を評価する。
論文 参考訳(メタデータ) (2021-03-17T15:24:02Z) - Cognitive architecture aided by working-memory for self-supervised
multi-modal humans recognition [54.749127627191655]
人間パートナーを認識する能力は、パーソナライズされた長期的な人間とロボットの相互作用を構築するための重要な社会的スキルです。
ディープラーニングネットワークは最先端の結果を達成し,そのような課題に対処するための適切なツールであることが実証された。
1つの解決策は、ロボットに自己スーパービジョンで直接の感覚データから学習させることである。
論文 参考訳(メタデータ) (2021-03-16T13:50:24Z) - Joint Mind Modeling for Explanation Generation in Complex Human-Robot
Collaborative Tasks [83.37025218216888]
本稿では,人間とロボットのコラボレーションにおいて,人間のようなコミュニケーションを実現するための新しい説明可能なAI(XAI)フレームワークを提案する。
ロボットは、人間のユーザの階層的なマインドモデルを構築し、コミュニケーションの一形態として自身のマインドの説明を生成する。
その結果,提案手法はロボットの協調動作性能とユーザ認識を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2020-07-24T23:35:03Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z) - Human Grasp Classification for Reactive Human-to-Robot Handovers [50.91803283297065]
本稿では,ロボットが人間に遭遇するロボットのハンドオーバに対するアプローチを提案する。
対象物をさまざまな手形やポーズで保持する典型的な方法をカバーする,人間の把握データセットを収集する。
本稿では,検出した把握位置と手の位置に応じて人手から対象物を取り出す計画実行手法を提案する。
論文 参考訳(メタデータ) (2020-03-12T19:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。