論文の概要: Hunting Group Clues with Transformers for Social Group Activity
Recognition
- arxiv url: http://arxiv.org/abs/2207.05254v1
- Date: Tue, 12 Jul 2022 01:46:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-13 13:52:49.771163
- Title: Hunting Group Clues with Transformers for Social Group Activity
Recognition
- Title(参考訳): ソーシャルグループ活動認識のためのトランスフォーマーを用いたハンティンググループクルー
- Authors: Masato Tamura, Rahul Vishwakarma, Ravigopal Vennelakanti
- Abstract要約: 社会的グループ活動認識には、複数のサブグループ活動を認識し、グループメンバーを特定する必要がある。
既存のほとんどのメソッドは、リージョンの機能を精錬し、それらをアクティビティのフィーチャにまとめることで、両方のタスクに取り組みます。
我々は,効果的なソーシャルグループ機能を生成するために,トランスフォーマーのアテンションモジュールを活用することを提案する。
本手法は,アテンションモジュールが社会的グループ活動に関連する特徴を識別し,集約するように設計されている。
- 参考スコア(独自算出の注目度): 3.1061678033205635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel framework for social group activity recognition.
As an expanded task of group activity recognition, social group activity
recognition requires recognizing multiple sub-group activities and identifying
group members. Most existing methods tackle both tasks by refining region
features and then summarizing them into activity features. Such heuristic
feature design renders the effectiveness of features susceptible to incomplete
person localization and disregards the importance of scene contexts.
Furthermore, region features are sub-optimal to identify group members because
the features may be dominated by those of people in the regions and have
different semantics. To overcome these drawbacks, we propose to leverage
attention modules in transformers to generate effective social group features.
Our method is designed in such a way that the attention modules identify and
then aggregate features relevant to social group activities, generating an
effective feature for each social group. Group member information is embedded
into the features and thus accessed by feed-forward networks. The outputs of
feed-forward networks represent groups so concisely that group members can be
identified with simple Hungarian matching between groups and individuals.
Experimental results show that our method outperforms state-of-the-art methods
on the Volleyball and Collective Activity datasets.
- Abstract(参考訳): 本稿では,社会集団活動認識のための新しい枠組みを提案する。
グループ活動認識のタスクとして、社会集団活動認識は複数のサブグループ活動を認識し、グループメンバーを識別する必要がある。
既存のメソッドのほとんどは、リージョンフィーチャを洗練し、アクティビティ機能にまとめることで、両方のタスクに取り組みます。
このようなヒューリスティックな特徴設計は、不完全な人物のローカライゼーションに影響を受けやすい特徴の有効性を示し、シーンコンテキストの重要性を無視する。
さらに、地域の特徴は、地域の人々によって支配され、異なる意味を持つため、グループメンバーを特定するのに最適である。
これらの欠点を克服するために,トランスフォーマーのアテンションモジュールを活用して,効果的なソーシャルグループ機能を生成することを提案する。
本手法は,アテンションモジュールがソーシャルグループ活動に関連する特徴を識別・集約し,各ソーシャルグループに有効な特徴を生成するように設計されている。
グループメンバー情報は機能に組み込まれ、フィードフォワードネットワークによってアクセスされる。
フィードフォワードネットワークの出力は、グループメンバーがグループと個人の間の単純なハンガリー語マッチングで識別できるほど簡潔にグループを表す。
実験の結果,本手法はVolleyball and Collective Activityデータセットの最先端手法よりも優れていた。
関連論文リスト
- Design and Analysis of Efficient Attention in Transformers for Social Group Activity Recognition [3.75292409381511]
本稿では,変圧器のアテンションモジュールを利用してソーシャルグループ機能を生成することを提案する。
複数の埋め込みは、ソーシャルグループの特徴を集約するために使用され、それぞれが重複せずにグループメンバーに割り当てられる。
提案手法は最先端の性能を達成し,提案手法が社会集団の行動認識に極めて有効であることを検証した。
論文 参考訳(メタデータ) (2024-04-15T17:40:23Z) - Towards More Practical Group Activity Detection: A New Benchmark and Model [61.39427407758131]
グループアクティビティ検出(グループアクティビティ検出、英: Group Activity Detection、GAD)は、ビデオにおいて、各グループのメンバを特定し、同時にグループのアクティビティを分類するタスクである。
私たちはCaf'eと呼ばれる新しいデータセットを提示し、より実用的なシナリオとメトリクスを提示します。
また、未知数のグループと潜在グループメンバーを効率的に効率的に扱う新しいGADモデルを提案する。
論文 参考訳(メタデータ) (2023-12-05T16:48:17Z) - Group Activity Recognition in Computer Vision: A Comprehensive Review,
Challenges, and Future Perspectives [0.0]
グループ活動認識はコンピュータビジョンにおけるホットトピックである。
グループ関係を通じた活動の認識はグループ活動認識において重要な役割を担っている。
本研究は,グループ活動の認識における技術進歩について考察する。
論文 参考訳(メタデータ) (2023-07-25T14:44:41Z) - Ranking-based Group Identification via Factorized Attention on Social
Tripartite Graph [68.08590487960475]
グループ識別のための文脈的要因認識(CFAG)という,GNNに基づく新しいフレームワークを提案する。
我々は3部グラフ畳み込み層を考案し、ユーザ、グループ、アイテム間の異なる種類の近隣からの情報を集約する。
データ疎度問題に対処するため,提案した因子化注意機構に基づく新しい伝搬増強層を考案した。
論文 参考訳(メタデータ) (2022-11-02T01:42:20Z) - Attentive pooling for Group Activity Recognition [23.241686027269928]
グループ活動認識では、個人とそれに対応するグループの関係を表現するために階層的枠組みが広く採用されている。
そこで我々は,個人行動からグループ活動への重み付け情報移行を可能にする,新しいコンテキストプーリング手法,attentive poolingを提案する。
論文 参考訳(メタデータ) (2022-08-31T13:26:39Z) - Towards Group Robustness in the presence of Partial Group Labels [61.33713547766866]
入力サンプルとターゲットラベルの間に 急激な相関関係がある ニューラルネットワークの予測を誤った方向に導く
本稿では,制約セットから最悪のグループ割り当てを最適化するアルゴリズムを提案する。
グループ間で総合的な集計精度を維持しつつ,少数集団のパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-01-10T22:04:48Z) - Learning Multi-Attention Context Graph for Group-Based Re-Identification [214.84551361855443]
オーバーラップしていないカメラシステムを介して人々のグループを再識別または取得することを学ぶことは、ビデオ監視において重要なアプリケーションです。
本研究では,グループre-idというグループを識別するためのコンテキスト情報の利用を検討する。
本研究では,グループベースリドタスクを同時に処理するグラフニューラルネットワークに基づく新しい統合フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-29T09:57:47Z) - Overcoming Data Sparsity in Group Recommendation [52.00998276970403]
グループレコメンデータシステムは、ユーザの個人的な好みだけでなく、嗜好集約戦略も正確に学習できなければならない。
本稿では,BGEM(Bipartite Graphding Model)とGCN(Graph Convolutional Networks)を基本構造として,グループとユーザ表現を統一的に学習する。
論文 参考訳(メタデータ) (2020-10-02T07:11:19Z) - Social Adaptive Module for Weakly-supervised Group Activity Recognition [143.68241396839062]
本稿では、弱教師付きグループ活動認識(GAR)と呼ばれる新しいタスクを提案する。
従来のGARタスクとは違い、ビデオレベルラベルのみが利用可能であるが、トレーニングデータにおいても、各フレーム内の重要人物は提供されない。
これにより、大規模なNBAデータセットの収集とアノテートが容易になり、GARに新たな課題が生まれます。
論文 参考訳(メタデータ) (2020-07-18T16:40:55Z) - Joint Learning of Social Groups, Individuals Action and Sub-group
Activities in Videos [23.15064911470468]
ソーシャルタスクのためのエンドツーエンドのトレーニング可能なフレームワークを提案する。
提案手法は,従来のグループ認識活動タスクに広く採用されている2つのベンチマークに,最先端の成果をセットする。
論文 参考訳(メタデータ) (2020-07-06T10:42:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。