論文の概要: Using Features at Multiple Temporal and Spatial Resolutions to Predict
Human Behavior in Real Time
- arxiv url: http://arxiv.org/abs/2211.06721v1
- Date: Sat, 12 Nov 2022 18:41:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 16:28:30.138808
- Title: Using Features at Multiple Temporal and Spatial Resolutions to Predict
Human Behavior in Real Time
- Title(参考訳): 複数の時空間分解能における特徴を用いたリアルタイムの人間の行動予測
- Authors: Liang Zhang, Justin Lieffers, Adarsh Pyarelal
- Abstract要約: 本研究では,高分解能・低分解能な空間情報と時間情報を統合し,人間の行動をリアルタイムで予測する手法を提案する。
本モデルでは,3つのネットワークが同時にトレーニングされた動作予測のためのニューラルネットワークを用いて,高分解能・低分解能特徴抽出のためのニューラルネットワークを構成する。
- 参考スコア(独自算出の注目度): 2.955419572714387
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: When performing complex tasks, humans naturally reason at multiple temporal
and spatial resolutions simultaneously. We contend that for an artificially
intelligent agent to effectively model human teammates, i.e., demonstrate
computational theory of mind (ToM), it should do the same. In this paper, we
present an approach for integrating high and low-resolution spatial and
temporal information to predict human behavior in real time and evaluate it on
data collected from human subjects performing simulated urban search and rescue
(USAR) missions in a Minecraft-based environment. Our model composes neural
networks for high and low-resolution feature extraction with a neural network
for behavior prediction, with all three networks trained simultaneously. The
high-resolution extractor encodes dynamically changing goals robustly by taking
as input the Manhattan distance difference between the humans' Minecraft
avatars and candidate goals in the environment for the latest few actions,
computed from a high-resolution gridworld representation. In contrast, the
low-resolution extractor encodes participants' historical behavior using a
historical state matrix computed from a low-resolution graph representation.
Through supervised learning, our model acquires a robust prior for human
behavior prediction, and can effectively deal with long-term observations. Our
experimental results demonstrate that our method significantly improves
prediction accuracy compared to approaches that only use high-resolution
information.
- Abstract(参考訳): 複雑なタスクを行う場合、人間は自然に複数の時間的および空間的解像度を同時に判断する。
我々は、人間のチームメイトを効果的にモデル化する人工知能エージェント、すなわち計算的心の理論(tom)は、同じことをすべきであると主張する。
本稿では,人間の行動を予測するために,高分解能と低分解能の空間情報と時間情報を統合し,マインクラフト型環境における都市探索・救助(usar)ミッションのシミュレーションを行った被験者から収集したデータに基づいて評価する手法を提案する。
本モデルでは,3つのネットワークが同時にトレーニングされた動作予測のためのニューラルネットワークを用いて,高分解能特徴抽出のためのニューラルネットワークを構成する。
高分解能抽出器は、マンハッタンと人間のマインクラフトアバターの距離差を入力として、高分解能グリッドワールド表現から計算された最新の少数の行動に対して動的に変化する目標をエンコードする。
対照的に、低分解能抽出器は、低分解能グラフ表現から計算された歴史的状態行列を用いて、参加者の歴史的挙動を符号化する。
教師付き学習により,人間の行動予測のためのロバストな事前情報を取得し,長期的な観察を効果的に処理する。
実験の結果,高分解能情報のみを用いる手法に比べて予測精度は有意に向上した。
関連論文リスト
- Learning Human Action Recognition Representations Without Real Humans [66.61527869763819]
そこで本研究では,仮想人間を含む合成データを用いて,実世界の映像を活用してモデルを事前学習するベンチマークを提案する。
次に、このデータに基づいて学習した表現を、下流行動認識ベンチマークの様々なセットに転送可能であるかを評価する。
私たちのアプローチは、以前のベースラインを最大5%上回ります。
論文 参考訳(メタデータ) (2023-11-10T18:38:14Z) - AnyPose: Anytime 3D Human Pose Forecasting via Neural Ordinary
Differential Equations [2.7195102129095003]
AnyPoseは、ニューラルネットワークの常微分方程式で人間の振る舞いをモデル化する軽量な連続時間ニューラルネットワークアーキテクチャである。
これらの結果から,AnyPoseは将来予測の精度が高く,計算時間も従来の手法よりもかなり低いことがわかった。
論文 参考訳(メタデータ) (2023-09-09T16:59:57Z) - Multi-Timescale Modeling of Human Behavior [0.18199355648379031]
本稿では,行動情報を複数の時間スケールで処理し,将来の行動を予測するLSTMネットワークアーキテクチャを提案する。
我々は、仮想Minecraftベースのテストベッドでシミュレーションした都市検索・救助シナリオで収集したデータに基づいて、アーキテクチャを評価する。
論文 参考訳(メタデータ) (2022-11-16T15:58:57Z) - Learn to Predict How Humans Manipulate Large-sized Objects from
Interactive Motions [82.90906153293585]
本稿では,動きデータと動的記述子を融合させるグラフニューラルネットワークHO-GCNを提案する。
動的記述子を消費するネットワークは、最先端の予測結果が得られ、未確認オブジェクトへのネットワークの一般化に役立つことを示す。
論文 参考訳(メタデータ) (2022-06-25T09:55:39Z) - SATBench: Benchmarking the speed-accuracy tradeoff in object recognition
by humans and dynamic neural networks [0.45438205344305216]
人々はスピードと正確さの間の柔軟なトレードオフを示しています。
ImageNet画像の認識において、SAT(Speed-accuracy Tradeoff)の最初の大規模データセットを示す。
我々は,曲線適合誤差,カテゴリー相関,曲線急勾配について,人とのネットワークを比較した。
論文 参考訳(メタデータ) (2022-06-16T20:03:31Z) - Comparison of Spatio-Temporal Models for Human Motion and Pose
Forecasting in Face-to-Face Interaction Scenarios [47.99589136455976]
本稿では,行動予測のための最新手法の体系的比較を行った。
UDIVA v0.5の最先端性能を実現するのに最も注意を払っているアプローチである。
短期的に訓練された手法で未来を自動回帰予測することで、かなり長期にわたってベースラインを上回ります。
論文 参考訳(メタデータ) (2022-03-07T09:59:30Z) - Investigating Pose Representations and Motion Contexts Modeling for 3D
Motion Prediction [63.62263239934777]
歴史的ポーズシーケンスから人間の動きを予測することは、機械が人間と知的な相互作用を成功させるために不可欠である。
本研究では,様々なポーズ表現に関する詳細な研究を行い,その動作予測課題に対する効果に着目した。
AHMR(Attentive Hierarchical Motion Recurrent Network)と呼ばれる新しいRNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-30T10:45:22Z) - Development of Human Motion Prediction Strategy using Inception Residual
Block [1.0705399532413613]
Inception Residual Block (IRB) を提案する。
我々の主な貢献は、事前に観測されたポーズと次の予測されたポーズの間に連続性を持つように、入力と開始ブロックの出力の間の残差接続を提案することである。
提案したアーキテクチャでは、人間のポーズに関する事前知識をよりよく学習し、論文で詳述したよりはるかに高い予測精度を達成する。
論文 参考訳(メタデータ) (2021-08-09T12:49:48Z) - STAR: Sparse Transformer-based Action Recognition [61.490243467748314]
本研究は,空間的次元と時間的次元に細かな注意を払っている新しいスケルトンに基づく人間行動認識モデルを提案する。
実験により、トレーニング可能なパラメータをはるかに少なくし、トレーニングや推論の高速化を図りながら、モデルが同等のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-07-15T02:53:11Z) - DRG: Dual Relation Graph for Human-Object Interaction Detection [65.50707710054141]
人-物間相互作用(HOI)検出の課題に対処する。
既存の方法は、人間と物体の対の相互作用を独立に認識するか、複雑な外観に基づく共同推論を行う。
本稿では,抽象的空間意味表現を活用して,各対象対を記述し,二重関係グラフを用いてシーンの文脈情報を集約する。
論文 参考訳(メタデータ) (2020-08-26T17:59:40Z) - Wavelet-based temporal models of human activity for anomaly detection in
smart robot-assisted environments [2.299866262521074]
本稿では,スマートホームセンサを用いた長期人間の活動の時間的モデリング手法を提案する。
このモデルはウェーブレット変換に基づいており、スマートセンサーデータの予測に使われ、人間の環境における予期せぬ事象を検出するための時間的前兆を提供する。
論文 参考訳(メタデータ) (2020-02-26T14:08:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。