Fugu-MT 論文翻訳(概要): Hierarchical Graph-RNNs for Action Detection of Multiple Activities

論文の概要: Hierarchical Graph-RNNs for Action Detection of Multiple Activities

arxiv url: http://arxiv.org/abs/2101.08581v1
Date: Thu, 21 Jan 2021 12:50:02 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-21 07:54:38.442035
Title: Hierarchical Graph-RNNs for Action Detection of Multiple Activities
Title（参考訳）: マルチアクティビティの動作検出のための階層グラフ-RNN
Authors: Sovan Biswas, Yaser Souri and Juergen Gall
Abstract要約: 本稿では,複数の活動を同時に行うことができる映像フレーム内の活動を空間的に局所化する手法を提案する。本手法は,検出者の行動の時間的文脈と関係を考慮に入れたものである。
参考スコア（独自算出の注目度）: 20.645887084027443
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we propose an approach that spatially localizes the activities in a video frame where each person can perform multiple activities at the same time. Our approach takes the temporal scene context as well as the relations of the actions of detected persons into account. While the temporal context is modeled by a temporal recurrent neural network (RNN), the relations of the actions are modeled by a graph RNN. Both networks are trained together and the proposed approach achieves state of the art results on the AVA dataset.
Abstract（参考訳）: 本稿では,複数の人物が同時に複数の活動を行うことのできる映像フレーム内のアクティビティを空間的に局所化する手法を提案する。本手法は,検出者の行動の時間的文脈と関係を考慮に入れたものである。時間的コンテキストは時間的リカレントニューラルネットワーク(RNN)によってモデル化されるが、アクションの関係はグラフRNNによってモデル化される。どちらのネットワークも一緒にトレーニングされており、提案手法はAVAデータセットのアート結果の状態を達成している。

関連論文リスト

Hierarchical Relation-augmented Representation Generalization for Few-shot Action Recognition [53.02634128715853]
Few-shot Action Recognition (FSAR) は、新しいアクションカテゴリーをほとんど見ない形で認識することを目的としている。 FSARのための階層的関係強化表現一般化フレームワークHR2G-shotを提案する。 3種類の関係モデリング(フレーム間、ビデオ間、タスク間)を統合し、全体的視点からタスク固有の時間パターンを学習する。
論文参考訳（メタデータ） (2025-04-14T10:23:22Z)
Pairwise Spatiotemporal Partial Trajectory Matching for Co-movement Analysis [1.0942776587291776]
ペアワイズ・ムーブメント・アナリティクス(Pairwise movement analysis)は、特定の時間枠内で個人を特定することを含む。本稿では,時間ウィンドウに基づいてデータを解釈可能な画像に変換する部分時間マッチング手法を提案する。我々は,コウォーキング分類タスクにおける手法の評価を行い,その効果を新しいコ行動識別アプリケーションで実証した。このアプローチは、時間的行動分析のための強力で解釈可能なフレームワークを提供し、社会行動研究、都市計画、医療に潜在的な応用をもたらす。
論文参考訳（メタデータ） (2024-12-03T22:25:44Z)
A Hybrid Graph Network for Complex Activity Detection in Video [40.843533889724924]
複雑なアクティビティ検出(CompAD)は、分析を長期的なアクティビティに拡張する。本稿では,局所的な(短期的な)動的シーンを符号化したグラフに適用した注目と,全体の長期的活動をモデル化した時間グラフを組み合わせたハイブリッドグラフニューラルネットワークを提案する。
論文参考訳（メタデータ） (2023-10-26T15:49:35Z)
TempGNN: Temporal Graph Neural Networks for Dynamic Session-Based Recommendations [5.602191038593571]
テンポラルグラフニューラルネットワーク(TempGNN)は、複雑なアイテム遷移における構造的・時間的ダイナミクスを捉えるための一般的なフレームワークである。 TempGNNは、2つの現実世界のEコマースデータセットで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2023-10-20T03:13:10Z)
Spatio-Temporal Joint Graph Convolutional Networks for Traffic Forecasting [75.10017445699532]
近年、時間グラフモデリング問題として交通予測の定式化に焦点が移っている。本稿では,道路網における交通予測の精度向上のための新しい手法を提案する。
論文参考訳（メタデータ） (2021-11-25T08:45:14Z)
Learning Dual Dynamic Representations on Time-Sliced User-Item Interaction Graphs for Sequential Recommendation [62.30552176649873]
シーケンシャルレコメンデーションのための動的表現学習モデル(DRL-SRe)を考案する。両面から動的に特徴付けるためのユーザ・イテム相互作用をモデル化するため,提案モデルでは,時間スライス毎にグローバルなユーザ・イテム相互作用グラフを構築した。モデルが微粒な時間情報を捕捉することを可能にするため,連続時間スライス上での補助的時間予測タスクを提案する。
論文参考訳（メタデータ） (2021-09-24T07:44:27Z)
Modeling long-term interactions to enhance action recognition [81.09859029964323]
本稿では,フレームレベルと時間レベルの両方でオブジェクト間の相互作用のセマンティクスを利用する,エゴセントリックなビデオのアンダースタンドアクションに対する新しいアプローチを提案する。ユーザの手とほぼ対応するプライマリ領域と、相互作用するオブジェクトに対応する可能性のあるセカンダリ領域のセットを入力として、領域ベースのアプローチを使用する。提案手法は, 標準ベンチマークの動作認識において, 最先端技術よりも優れている。
論文参考訳（メタデータ） (2021-04-23T10:08:15Z)
Unified Graph Structured Models for Video Understanding [93.72081456202672]
リレーショナル・テンポラル関係を明示的にモデル化するメッセージパッシンググラフニューラルネットワークを提案する。本手法は,シーン内の関連エンティティ間の関係をより効果的にモデル化できることを示す。
論文参考訳（メタデータ） (2021-03-29T14:37:35Z)
Learning Asynchronous and Sparse Human-Object Interaction in Videos [56.73059840294019]
Asynchronous-Sparse Interaction Graph Networks(ASSIGN)は、ビデオシーン内のエンティティに関連するインタラクションイベントの構造を自動的に検出します。 ASSIGNは人間と物体の相互作用認識において試験され、人間のサブアクティビティのセグメンテーションおよびラベル付けにおいて優れた性能を示す。
論文参考訳（メタデータ） (2021-03-03T23:43:55Z)
A Two-stream Neural Network for Pose-based Hand Gesture Recognition [23.50938160992517]
近年,ポーズに基づくジェスチャー認識が広く研究されている。本稿では,グラフ畳み込みネットワーク(sagcn)を1ストリームとする2ストリームニューラルネットワークを提案する。残差接続強化Bi-IndRNNは、時間モデリングのための双方向処理機能を備えたIndRNNを拡張する。
論文参考訳（メタデータ） (2021-01-22T03:22:26Z)
A Graph-based Interactive Reasoning for Human-Object Interaction Detection [71.50535113279551]
本稿では,HOIを推論するインタラクティブグラフ(Interactive Graph, in-Graph)という,グラフに基づくインタラクティブ推論モデルを提案する。 In-GraphNet と呼ばれる HOI を検出するための新しいフレームワークを構築した。私たちのフレームワークはエンドツーエンドのトレーニングが可能で、人間のポーズのような高価なアノテーションはありません。
論文参考訳（メタデータ） (2020-07-14T09:29:03Z)
Understanding Dynamic Scenes using Graph Convolution Networks [22.022759283770377]
本稿では,移動カメラが捉えた時間順のフレーム列から道路車両の挙動をモデル化する新しい枠組みを提案する。微調整に頼らずに複数のデータセットへの学習のシームレスな移行を示す。このような振る舞い予測手法は,様々なナビゲーションタスクにおいて即時関連性を見出す。
論文参考訳（メタデータ） (2020-05-09T13:05:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。