論文の概要: Using Features at Multiple Temporal and Spatial Resolutions to Predict
Human Behavior in Real Time
- arxiv url: http://arxiv.org/abs/2211.06721v1
- Date: Sat, 12 Nov 2022 18:41:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 16:28:30.138808
- Title: Using Features at Multiple Temporal and Spatial Resolutions to Predict
Human Behavior in Real Time
- Title(参考訳): 複数の時空間分解能における特徴を用いたリアルタイムの人間の行動予測
- Authors: Liang Zhang, Justin Lieffers, Adarsh Pyarelal
- Abstract要約: 本研究では,高分解能・低分解能な空間情報と時間情報を統合し,人間の行動をリアルタイムで予測する手法を提案する。
本モデルでは,3つのネットワークが同時にトレーニングされた動作予測のためのニューラルネットワークを用いて,高分解能・低分解能特徴抽出のためのニューラルネットワークを構成する。
- 参考スコア(独自算出の注目度): 2.955419572714387
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: When performing complex tasks, humans naturally reason at multiple temporal
and spatial resolutions simultaneously. We contend that for an artificially
intelligent agent to effectively model human teammates, i.e., demonstrate
computational theory of mind (ToM), it should do the same. In this paper, we
present an approach for integrating high and low-resolution spatial and
temporal information to predict human behavior in real time and evaluate it on
data collected from human subjects performing simulated urban search and rescue
(USAR) missions in a Minecraft-based environment. Our model composes neural
networks for high and low-resolution feature extraction with a neural network
for behavior prediction, with all three networks trained simultaneously. The
high-resolution extractor encodes dynamically changing goals robustly by taking
as input the Manhattan distance difference between the humans' Minecraft
avatars and candidate goals in the environment for the latest few actions,
computed from a high-resolution gridworld representation. In contrast, the
low-resolution extractor encodes participants' historical behavior using a
historical state matrix computed from a low-resolution graph representation.
Through supervised learning, our model acquires a robust prior for human
behavior prediction, and can effectively deal with long-term observations. Our
experimental results demonstrate that our method significantly improves
prediction accuracy compared to approaches that only use high-resolution
information.
- Abstract(参考訳): 複雑なタスクを行う場合、人間は自然に複数の時間的および空間的解像度を同時に判断する。
我々は、人間のチームメイトを効果的にモデル化する人工知能エージェント、すなわち計算的心の理論(tom)は、同じことをすべきであると主張する。
本稿では,人間の行動を予測するために,高分解能と低分解能の空間情報と時間情報を統合し,マインクラフト型環境における都市探索・救助(usar)ミッションのシミュレーションを行った被験者から収集したデータに基づいて評価する手法を提案する。
本モデルでは,3つのネットワークが同時にトレーニングされた動作予測のためのニューラルネットワークを用いて,高分解能特徴抽出のためのニューラルネットワークを構成する。
高分解能抽出器は、マンハッタンと人間のマインクラフトアバターの距離差を入力として、高分解能グリッドワールド表現から計算された最新の少数の行動に対して動的に変化する目標をエンコードする。
対照的に、低分解能抽出器は、低分解能グラフ表現から計算された歴史的状態行列を用いて、参加者の歴史的挙動を符号化する。
教師付き学習により,人間の行動予測のためのロバストな事前情報を取得し,長期的な観察を効果的に処理する。
実験の結果,高分解能情報のみを用いる手法に比べて予測精度は有意に向上した。
関連論文リスト
- RTify: Aligning Deep Neural Networks with Human Behavioral Decisions [10.510746720313303]
霊長類視覚の現在のニューラルネットワークモデルは、行動精度の全体的なレベルを複製することに焦点を当てている。
我々は、リカレントニューラルネットワークの時間的ダイナミクスを人間の反応時間(RT)に合わせることを学ぶことによって、人間の行動選択のダイナミクスをモデル化する新しい計算フレームワークを導入する。
本稿では,この近似を用いて「理想オブザーバ」RNNモデルを最適化し,人間データなしで速度と精度の最適なトレードオフを実現できることを示す。
論文 参考訳(メタデータ) (2024-11-06T03:04:05Z) - StackFLOW: Monocular Human-Object Reconstruction by Stacked Normalizing Flow with Offset [56.71580976007712]
本研究では,人間のメッシュと物体メッシュの表面から密にサンプリングされたアンカー間の人物体オフセットを用いて,人物体空間関係を表現することを提案する。
この表現に基づいて、画像から人・物間の空間関係の後方分布を推定するスタック正規化フロー(StackFLOW)を提案する。
最適化段階では、サンプルの可能性を最大化することにより、人体ポーズと物体6Dポーズを微調整する。
論文 参考訳(メタデータ) (2024-07-30T04:57:21Z) - Learning Human Action Recognition Representations Without Real Humans [66.61527869763819]
そこで本研究では,仮想人間を含む合成データを用いて,実世界の映像を活用してモデルを事前学習するベンチマークを提案する。
次に、このデータに基づいて学習した表現を、下流行動認識ベンチマークの様々なセットに転送可能であるかを評価する。
私たちのアプローチは、以前のベースラインを最大5%上回ります。
論文 参考訳(メタデータ) (2023-11-10T18:38:14Z) - AnyPose: Anytime 3D Human Pose Forecasting via Neural Ordinary
Differential Equations [2.7195102129095003]
AnyPoseは、ニューラルネットワークの常微分方程式で人間の振る舞いをモデル化する軽量な連続時間ニューラルネットワークアーキテクチャである。
これらの結果から,AnyPoseは将来予測の精度が高く,計算時間も従来の手法よりもかなり低いことがわかった。
論文 参考訳(メタデータ) (2023-09-09T16:59:57Z) - Multi-Timescale Modeling of Human Behavior [0.18199355648379031]
本稿では,行動情報を複数の時間スケールで処理し,将来の行動を予測するLSTMネットワークアーキテクチャを提案する。
我々は、仮想Minecraftベースのテストベッドでシミュレーションした都市検索・救助シナリオで収集したデータに基づいて、アーキテクチャを評価する。
論文 参考訳(メタデータ) (2022-11-16T15:58:57Z) - Learn to Predict How Humans Manipulate Large-sized Objects from
Interactive Motions [82.90906153293585]
本稿では,動きデータと動的記述子を融合させるグラフニューラルネットワークHO-GCNを提案する。
動的記述子を消費するネットワークは、最先端の予測結果が得られ、未確認オブジェクトへのネットワークの一般化に役立つことを示す。
論文 参考訳(メタデータ) (2022-06-25T09:55:39Z) - Investigating Pose Representations and Motion Contexts Modeling for 3D
Motion Prediction [63.62263239934777]
歴史的ポーズシーケンスから人間の動きを予測することは、機械が人間と知的な相互作用を成功させるために不可欠である。
本研究では,様々なポーズ表現に関する詳細な研究を行い,その動作予測課題に対する効果に着目した。
AHMR(Attentive Hierarchical Motion Recurrent Network)と呼ばれる新しいRNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-30T10:45:22Z) - Development of Human Motion Prediction Strategy using Inception Residual
Block [1.0705399532413613]
Inception Residual Block (IRB) を提案する。
我々の主な貢献は、事前に観測されたポーズと次の予測されたポーズの間に連続性を持つように、入力と開始ブロックの出力の間の残差接続を提案することである。
提案したアーキテクチャでは、人間のポーズに関する事前知識をよりよく学習し、論文で詳述したよりはるかに高い予測精度を達成する。
論文 参考訳(メタデータ) (2021-08-09T12:49:48Z) - STAR: Sparse Transformer-based Action Recognition [61.490243467748314]
本研究は,空間的次元と時間的次元に細かな注意を払っている新しいスケルトンに基づく人間行動認識モデルを提案する。
実験により、トレーニング可能なパラメータをはるかに少なくし、トレーニングや推論の高速化を図りながら、モデルが同等のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-07-15T02:53:11Z) - DRG: Dual Relation Graph for Human-Object Interaction Detection [65.50707710054141]
人-物間相互作用(HOI)検出の課題に対処する。
既存の方法は、人間と物体の対の相互作用を独立に認識するか、複雑な外観に基づく共同推論を行う。
本稿では,抽象的空間意味表現を活用して,各対象対を記述し,二重関係グラフを用いてシーンの文脈情報を集約する。
論文 参考訳(メタデータ) (2020-08-26T17:59:40Z) - Wavelet-based temporal models of human activity for anomaly detection in
smart robot-assisted environments [2.299866262521074]
本稿では,スマートホームセンサを用いた長期人間の活動の時間的モデリング手法を提案する。
このモデルはウェーブレット変換に基づいており、スマートセンサーデータの予測に使われ、人間の環境における予期せぬ事象を検出するための時間的前兆を提供する。
論文 参考訳(メタデータ) (2020-02-26T14:08:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。