論文の概要: Design and Analysis of Efficient Attention in Transformers for Social Group Activity Recognition
- arxiv url: http://arxiv.org/abs/2404.09964v1
- Date: Mon, 15 Apr 2024 17:40:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-17 21:27:57.931073
- Title: Design and Analysis of Efficient Attention in Transformers for Social Group Activity Recognition
- Title(参考訳): 社会集団活動認識のための変圧器の効率よい注意力の設計と解析
- Authors: Masato Tamura,
- Abstract要約: 本稿では,変圧器のアテンションモジュールを利用してソーシャルグループ機能を生成することを提案する。
複数の埋め込みは、ソーシャルグループの特徴を集約するために使用され、それぞれが重複せずにグループメンバーに割り当てられる。
提案手法は最先端の性能を達成し,提案手法が社会集団の行動認識に極めて有効であることを検証した。
- 参考スコア(独自算出の注目度): 3.75292409381511
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Social group activity recognition is a challenging task extended from group activity recognition, where social groups must be recognized with their activities and group members. Existing methods tackle this task by leveraging region features of individuals following existing group activity recognition methods. However, the effectiveness of region features is susceptible to person localization and variable semantics of individual actions. To overcome these issues, we propose leveraging attention modules in transformers to generate social group features. In this method, multiple embeddings are used to aggregate features for a social group, each of which is assigned to a group member without duplication. Due to this non-duplicated assignment, the number of embeddings must be significant to avoid missing group members and thus renders attention in transformers ineffective. To find optimal attention designs with a large number of embeddings, we explore several design choices of queries for feature aggregation and self-attention modules in transformer decoders. Extensive experimental results show that the proposed method achieves state-of-the-art performance and verify that the proposed attention designs are highly effective on social group activity recognition.
- Abstract(参考訳): 社会集団活動認識は、グループ活動認識から拡張された課題であり、社会集団は、その活動とグループメンバーによって認識されなければならない。
既存手法は,既存のグループ活動認識手法に従って,個人の地域的特徴を活用することで,この課題に対処する。
しかし、地域特徴の有効性は、個人の局所化や個人行動の変動意味論に影響を受けやすい。
これらの課題を克服するために,トランスフォーマーのアテンションモジュールを利用してソーシャルグループ機能を生成することを提案する。
この方法では、複数の埋め込みを用いてソーシャルグループの特徴を集約し、それぞれが重複なくグループメンバーに割り当てられる。
この非重複的な割り当てのため、グループメンバーの欠如を避けるために埋め込みの数が重要でなければならないため、トランスフォーマーに注意を向けることができない。
多数の埋め込みを含む最適注意設計を求めるため,変換器デコーダにおける特徴集約と自己注意モジュールに対するクエリの設計選択について検討する。
大規模実験の結果,提案手法は最先端の性能を達成し,提案手法が社会集団の行動認識に極めて有効であることを検証した。
関連論文リスト
- The Research of Group Re-identification from Multiple Cameras [0.4955551943523977]
グループ再識別は、従来の再識別タスクにおいて、視点や人間のポーズのバリエーションによって妨げられているだけでなく、非常に難しい。
本稿では,グループ内の多粒度情報を活用してグループ再同定を容易にする手法を提案する。
論文 参考訳(メタデータ) (2024-07-19T18:28:13Z) - AdaFPP: Adapt-Focused Bi-Propagating Prototype Learning for Panoramic Activity Recognition [51.24321348668037]
パノラマ活動認識(PAR)は、パノラマシーンにおいて複数の人が行う多粒度行動を特定することを目的としている。
以前の方法は、トレーニングと推論において手動で注釈付き検出ボックスに依存しており、より実用的なデプロイメントを妨げる。
本研究では,パノラマ活動シーンにおける個人,グループ,グローバルな活動を共同で認識するための,適応型バイプロパゲーティング・プロトタイプ学習(AdaFPP)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-04T01:53:22Z) - Robust Zero-Shot Crowd Counting and Localization With Adaptive Resolution SAM [55.93697196726016]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - Ranking-based Group Identification via Factorized Attention on Social
Tripartite Graph [68.08590487960475]
グループ識別のための文脈的要因認識(CFAG)という,GNNに基づく新しいフレームワークを提案する。
我々は3部グラフ畳み込み層を考案し、ユーザ、グループ、アイテム間の異なる種類の近隣からの情報を集約する。
データ疎度問題に対処するため,提案した因子化注意機構に基づく新しい伝搬増強層を考案した。
論文 参考訳(メタデータ) (2022-11-02T01:42:20Z) - Attentive pooling for Group Activity Recognition [23.241686027269928]
グループ活動認識では、個人とそれに対応するグループの関係を表現するために階層的枠組みが広く採用されている。
そこで我々は,個人行動からグループ活動への重み付け情報移行を可能にする,新しいコンテキストプーリング手法,attentive poolingを提案する。
論文 参考訳(メタデータ) (2022-08-31T13:26:39Z) - Hunting Group Clues with Transformers for Social Group Activity
Recognition [3.1061678033205635]
社会的グループ活動認識には、複数のサブグループ活動を認識し、グループメンバーを特定する必要がある。
既存のほとんどのメソッドは、リージョンの機能を精錬し、それらをアクティビティのフィーチャにまとめることで、両方のタスクに取り組みます。
我々は,効果的なソーシャルグループ機能を生成するために,トランスフォーマーのアテンションモジュールを活用することを提案する。
本手法は,アテンションモジュールが社会的グループ活動に関連する特徴を識別し,集約するように設計されている。
論文 参考訳(メタデータ) (2022-07-12T01:46:46Z) - Towards Group Robustness in the presence of Partial Group Labels [61.33713547766866]
入力サンプルとターゲットラベルの間に 急激な相関関係がある ニューラルネットワークの予測を誤った方向に導く
本稿では,制約セットから最悪のグループ割り当てを最適化するアルゴリズムを提案する。
グループ間で総合的な集計精度を維持しつつ,少数集団のパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-01-10T22:04:48Z) - GroupFormer: Group Activity Recognition with Clustered Spatial-Temporal
Transformer [16.988878921451484]
GroupFormerは、個人とグループ表現を増強するために、空間的・時間的コンテキスト情報を共同でキャプチャする。
提案するフレームワークは,VolleyballデータセットとCollective Activityデータセットの最先端メソッドよりも優れている。
論文 参考訳(メタデータ) (2021-08-28T11:24:36Z) - Overcoming Data Sparsity in Group Recommendation [52.00998276970403]
グループレコメンデータシステムは、ユーザの個人的な好みだけでなく、嗜好集約戦略も正確に学習できなければならない。
本稿では,BGEM(Bipartite Graphding Model)とGCN(Graph Convolutional Networks)を基本構造として,グループとユーザ表現を統一的に学習する。
論文 参考訳(メタデータ) (2020-10-02T07:11:19Z) - Randomized Entity-wise Factorization for Multi-Agent Reinforcement
Learning [59.62721526353915]
実世界のマルチエージェント設定は、エージェントや非エージェントエンティティのタイプや量が異なるタスクを伴うことが多い。
我々の方法は、これらの共通点を活用することを目的としており、「観察対象のランダムに選択されたサブグループのみを考えるとき、各エージェントが期待する効用は何か?」という問いを投げかける。
論文 参考訳(メタデータ) (2020-06-07T18:28:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。