論文の概要: Hierarchical Graph-RNNs for Action Detection of Multiple Activities
- arxiv url: http://arxiv.org/abs/2101.08581v1
- Date: Thu, 21 Jan 2021 12:50:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-21 07:54:38.442035
- Title: Hierarchical Graph-RNNs for Action Detection of Multiple Activities
- Title(参考訳): マルチアクティビティの動作検出のための階層グラフ-RNN
- Authors: Sovan Biswas, Yaser Souri and Juergen Gall
- Abstract要約: 本稿では,複数の活動を同時に行うことができる映像フレーム内の活動を空間的に局所化する手法を提案する。
本手法は,検出者の行動の時間的文脈と関係を考慮に入れたものである。
- 参考スコア(独自算出の注目度): 20.645887084027443
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose an approach that spatially localizes the activities
in a video frame where each person can perform multiple activities at the same
time. Our approach takes the temporal scene context as well as the relations of
the actions of detected persons into account. While the temporal context is
modeled by a temporal recurrent neural network (RNN), the relations of the
actions are modeled by a graph RNN. Both networks are trained together and the
proposed approach achieves state of the art results on the AVA dataset.
- Abstract(参考訳): 本稿では,複数の人物が同時に複数の活動を行うことのできる映像フレーム内のアクティビティを空間的に局所化する手法を提案する。
本手法は,検出者の行動の時間的文脈と関係を考慮に入れたものである。
時間的コンテキストは時間的リカレントニューラルネットワーク(RNN)によってモデル化されるが、アクションの関係はグラフRNNによってモデル化される。
どちらのネットワークも一緒にトレーニングされており、提案手法はAVAデータセットのアート結果の状態を達成している。
関連論文リスト
- Dynamic Relation Discovery and Utilization in Multi-Entity Time Series
Forecasting [92.32415130188046]
多くの現実世界のシナリオでは、実体の間に決定的かつ暗黙的な関係が存在する可能性がある。
本稿では,自動グラフ学習(A2GNN)を用いたマルチグラフニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2022-02-18T11:37:04Z) - Modelling Neighbor Relation in Joint Space-Time Graph for Video
Correspondence Learning [53.74240452117145]
本稿では、ラベルなしビデオから信頼できる視覚対応を学習するための自己教師付き手法を提案する。
接続時空間グラフでは,ノードがフレームからサンプリングされたグリッドパッチであり,2種類のエッジによってリンクされる。
学習した表現は、様々な視覚的タスクにおいて最先端の自己監督手法よりも優れています。
論文 参考訳(メタデータ) (2021-09-28T05:40:01Z) - Learning Dual Dynamic Representations on Time-Sliced User-Item
Interaction Graphs for Sequential Recommendation [62.30552176649873]
シーケンシャルレコメンデーションのための動的表現学習モデル(DRL-SRe)を考案する。
両面から動的に特徴付けるためのユーザ・イテム相互作用をモデル化するため,提案モデルでは,時間スライス毎にグローバルなユーザ・イテム相互作用グラフを構築した。
モデルが微粒な時間情報を捕捉することを可能にするため,連続時間スライス上での補助的時間予測タスクを提案する。
論文 参考訳(メタデータ) (2021-09-24T07:44:27Z) - Spot What Matters: Learning Context Using Graph Convolutional Networks
for Weakly-Supervised Action Detection [0.0]
ビデオにおける人間の行動検出を改善するために,自己注意と畳み込みネットワークに基づくアーキテクチャを導入する。
我々のモデルは、学習したコンテキストを注意マップとして可視化することで、トレーニング中に見つからないアクションやオブジェクトに対しても説明しやすくする。
実験結果から, 文脈的アプローチはビデオ・mAPの2点以上で, ベースライン動作検出手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-07-28T21:37:18Z) - Interaction-GCN: a Graph Convolutional Network based framework for
social interaction recognition in egocentric videos [6.708125191843434]
我々は、エゴセントリックなビデオにおけるソーシャルインタラクションを分類する新しいフレームワーク、InteractionGCNを提案する。
本手法はフレームレベルで関係的および非関係的手がかりのパターンを抽出し、グラフ畳み込みネットワークに基づくアプローチにより相互作用的文脈を推定する関係グラフを構築する。
論文 参考訳(メタデータ) (2021-04-28T20:25:40Z) - Modeling long-term interactions to enhance action recognition [81.09859029964323]
本稿では,フレームレベルと時間レベルの両方でオブジェクト間の相互作用のセマンティクスを利用する,エゴセントリックなビデオのアンダースタンドアクションに対する新しいアプローチを提案する。
ユーザの手とほぼ対応するプライマリ領域と、相互作用するオブジェクトに対応する可能性のあるセカンダリ領域のセットを入力として、領域ベースのアプローチを使用する。
提案手法は, 標準ベンチマークの動作認識において, 最先端技術よりも優れている。
論文 参考訳(メタデータ) (2021-04-23T10:08:15Z) - Multiple Object Tracking with Correlation Learning [16.959379957515974]
本研究では,局所相関モジュールを用いて,対象と周辺環境のトポロジカルな関係をモデル化する。
具体的には,各空間の位置とその文脈の密接な対応を確立し,自己教師付き学習を通じて相関量を明確に制約する。
提案手法は, 相関学習と優れた性能の相関学習の有効性を示し, MOT17では76.5%, IDF1では73.6%の最先端MOTAが得られる。
論文 参考訳(メタデータ) (2021-04-08T06:48:02Z) - Unified Graph Structured Models for Video Understanding [93.72081456202672]
リレーショナル・テンポラル関係を明示的にモデル化するメッセージパッシンググラフニューラルネットワークを提案する。
本手法は,シーン内の関連エンティティ間の関係をより効果的にモデル化できることを示す。
論文 参考訳(メタデータ) (2021-03-29T14:37:35Z) - Learning Asynchronous and Sparse Human-Object Interaction in Videos [56.73059840294019]
Asynchronous-Sparse Interaction Graph Networks(ASSIGN)は、ビデオシーン内のエンティティに関連するインタラクションイベントの構造を自動的に検出します。
ASSIGNは人間と物体の相互作用認識において試験され、人間のサブアクティビティのセグメンテーションおよびラベル付けにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-03-03T23:43:55Z) - A Two-stream Neural Network for Pose-based Hand Gesture Recognition [23.50938160992517]
近年,ポーズに基づくジェスチャー認識が広く研究されている。
本稿では,グラフ畳み込みネットワーク(sagcn)を1ストリームとする2ストリームニューラルネットワークを提案する。
残差接続強化Bi-IndRNNは、時間モデリングのための双方向処理機能を備えたIndRNNを拡張する。
論文 参考訳(メタデータ) (2021-01-22T03:22:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。