論文の概要: Comparison of Spatio-Temporal Models for Human Motion and Pose
Forecasting in Face-to-Face Interaction Scenarios
- arxiv url: http://arxiv.org/abs/2203.03245v1
- Date: Mon, 7 Mar 2022 09:59:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-08 23:29:04.849850
- Title: Comparison of Spatio-Temporal Models for Human Motion and Pose
Forecasting in Face-to-Face Interaction Scenarios
- Title(参考訳): 対面インタラクションシナリオにおける人の動きと姿勢予測の時空間モデルの比較
- Authors: German Barquero and Johnny N\'u\~nez and Zhen Xu and Sergio Escalera
and Wei-Wei Tu and Isabelle Guyon and Cristina Palmero
- Abstract要約: 本稿では,行動予測のための最新手法の体系的比較を行った。
UDIVA v0.5の最先端性能を実現するのに最も注意を払っているアプローチである。
短期的に訓練された手法で未来を自動回帰予測することで、かなり長期にわたってベースラインを上回ります。
- 参考スコア(独自算出の注目度): 47.99589136455976
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human behavior forecasting during human-human interactions is of utmost
importance to provide robotic or virtual agents with social intelligence. This
problem is especially challenging for scenarios that are highly driven by
interpersonal dynamics. In this work, we present the first systematic
comparison of state-of-the-art approaches for behavior forecasting. To do so,
we leverage whole-body annotations (face, body, and hands) from the very
recently released UDIVA v0.5, which features face-to-face dyadic interactions.
Our best attention-based approaches achieve state-of-the-art performance in
UDIVA v0.5. We show that by autoregressively predicting the future with methods
trained for the short-term future (<400ms), we outperform the baselines even
for a considerably longer-term future (up to 2s). We also show that this
finding holds when highly noisy annotations are used, which opens new horizons
towards the use of weakly-supervised learning. Combined with large-scale
datasets, this may help boost the advances in this field.
- Abstract(参考訳): 人間と人間の相互作用における人間の行動予測は、ロボットや仮想エージェントに社会知性を提供する上で最も重要である。
この問題は、対人ダイナミクスによって高度に駆動されるシナリオでは特に難しい。
本稿では,行動予測のための最先端手法の体系的比較を行った。
そのために私たちは、最近リリースされたudiva v0.5から全身アノテーション(顔、体、手)を活用しています。
UDIVA v0.5の最先端性能を実現する。
短期的な未来(400ms)で訓練された手法で未来を自動回帰予測することで、かなり長期的な未来(最大2秒)でもベースラインを上回ります。
また,この傾向は,非常にノイズの多いアノテーションが使用される場合にも現れ,弱い教師付き学習の利用への新たな道筋を開く。
大規模なデータセットと組み合わせることで、この分野の進歩を促進することができる。
関連論文リスト
- Learning Manipulation by Predicting Interaction [85.57297574510507]
本稿では,インタラクションを予測して操作を学習する一般的な事前学習パイプラインを提案する。
実験の結果,MPIは従来のロボットプラットフォームと比較して10%から64%向上していることがわかった。
論文 参考訳(メタデータ) (2024-06-01T13:28:31Z) - Closely Interactive Human Reconstruction with Proxemics and Physics-Guided Adaption [64.07607726562841]
既存の人間再建アプローチは主に、正確なポーズの回復や侵入を避けることに焦点を当てている。
本研究では,モノクロ映像から密に対話的な人間を再構築する作業に取り組む。
本稿では,視覚情報の欠如を補うために,確率的行動や物理からの知識を活用することを提案する。
論文 参考訳(メタデータ) (2024-04-17T11:55:45Z) - Social-Transmotion: Promptable Human Trajectory Prediction [65.80068316170613]
Social-Transmotionは、多種多様な視覚的手がかりを利用して人間の行動を予測する、汎用トランスフォーマーベースのモデルである。
提案手法は,JTA,JRDB,歩行者,道路交通のサイクリスト,ETH-UCYなど,複数のデータセットで検証されている。
論文 参考訳(メタデータ) (2023-12-26T18:56:49Z) - Real-time Addressee Estimation: Deployment of a Deep-Learning Model on
the iCub Robot [52.277579221741746]
住所推定は、社会ロボットが人間とスムーズに対話するために必要なスキルである。
人間の知覚スキルにインスパイアされたディープラーニングモデルは、iCubロボットに設計、訓練、デプロイされる。
本研究では,人間-ロボットのリアルタイムインタラクションにおいて,そのような実装の手順とモデルの性能について述べる。
論文 参考訳(メタデータ) (2023-11-09T13:01:21Z) - Qualitative Prediction of Multi-Agent Spatial Interactions [5.742409080817885]
我々は,密集シーンにおけるマルチエージェントインタラクションをモデル化し,予測するための3つの新しいアプローチを提示し,ベンチマークする。
提案手法は、個々の相互作用を予測する静的および動的コンテキストを考慮したものである。
彼らはインプット・アンド・タイムアテンション・メカニズムを利用し、中・長期の地平線でテストされる。
論文 参考訳(メタデータ) (2023-06-30T18:08:25Z) - Multi-Timescale Modeling of Human Behavior [0.18199355648379031]
本稿では,行動情報を複数の時間スケールで処理し,将来の行動を予測するLSTMネットワークアーキテクチャを提案する。
我々は、仮想Minecraftベースのテストベッドでシミュレーションした都市検索・救助シナリオで収集したデータに基づいて、アーキテクチャを評価する。
論文 参考訳(メタデータ) (2022-11-16T15:58:57Z) - Using Features at Multiple Temporal and Spatial Resolutions to Predict
Human Behavior in Real Time [2.955419572714387]
本研究では,高分解能・低分解能な空間情報と時間情報を統合し,人間の行動をリアルタイムで予測する手法を提案する。
本モデルでは,3つのネットワークが同時にトレーニングされた動作予測のためのニューラルネットワークを用いて,高分解能・低分解能特徴抽出のためのニューラルネットワークを構成する。
論文 参考訳(メタデータ) (2022-11-12T18:41:33Z) - Data-Efficient Reinforcement Learning with Self-Predictive
Representations [21.223069189953037]
我々はエージェントに、未来への複数のステップを予測させるように訓練する。
この将来の予測目標は, 試料効率の高い深部RLの先行手法よりも優れている。
今後の予測とデータ拡張を組み合わせた完全な自己監督目標が,アタリにおける人間正規化スコアの0.415を達成している。
論文 参考訳(メタデータ) (2020-07-12T07:38:15Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。