論文の概要: Group Activity Recognition in Computer Vision: A Comprehensive Review,
Challenges, and Future Perspectives
- arxiv url: http://arxiv.org/abs/2307.13541v1
- Date: Tue, 25 Jul 2023 14:44:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-26 16:36:48.442396
- Title: Group Activity Recognition in Computer Vision: A Comprehensive Review,
Challenges, and Future Perspectives
- Title(参考訳): コンピュータビジョンにおけるグループ活動認識:包括的レビュー,課題,今後の展望
- Authors: Chuanchuan Wang, Ahmad Sufril Azlan Mohamed
- Abstract要約: グループ活動認識はコンピュータビジョンにおけるホットトピックである。
グループ関係を通じた活動の認識はグループ活動認識において重要な役割を担っている。
本研究は,グループ活動の認識における技術進歩について考察する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Group activity recognition is a hot topic in computer vision. Recognizing
activities through group relationships plays a vital role in group activity
recognition. It holds practical implications in various scenarios, such as
video analysis, surveillance, automatic driving, and understanding social
activities. The model's key capabilities encompass efficiently modeling
hierarchical relationships within a scene and accurately extracting distinctive
spatiotemporal features from groups. Given this technology's extensive
applicability, identifying group activities has garnered significant research
attention. This work examines the current progress in technology for
recognizing group activities, with a specific focus on global interactivity and
activities. Firstly, we comprehensively review the pertinent literature and
various group activity recognition approaches, from traditional methodologies
to the latest methods based on spatial structure, descriptors, non-deep
learning, hierarchical recurrent neural networks (HRNN), relationship models,
and attention mechanisms. Subsequently, we present the relational network and
relational architectures for each module. Thirdly, we investigate methods for
recognizing group activity and compare their performance with state-of-the-art
technologies. We summarize the existing challenges and provide comprehensive
guidance for newcomers to understand group activity recognition. Furthermore,
we review emerging perspectives in group activity recognition to explore new
directions and possibilities.
- Abstract(参考訳): グループ活動認識はコンピュータビジョンにおけるホットトピックである。
グループ関係を通じた活動の認識はグループ活動認識において重要な役割を担っている。
ビデオ分析、監視、自動運転、社会活動の理解など、様々なシナリオにおいて実践的な意味を持つ。
モデルの主要な機能は、シーン内の階層的関係を効率的にモデル化し、グループから特有の時空間的特徴を正確に抽出する。
この技術の広範な適用性を考えると、グループ活動の特定は大きな研究の注目を集めている。
本研究は,グローバルな対話性と活動に焦点をあて,グループ活動の認識技術の現状を考察する。
まず,従来の手法から,空間構造,記述子,非深層学習,階層的リカレントニューラルネットワーク(HRNN),関係モデル,アテンション機構に基づく最新の手法に至るまで,関連する文献やグループ活動認識アプローチを網羅的にレビューする。
次に,各モジュールのリレーショナルネットワークとリレーショナルアーキテクチャについて述べる。
第3に,グループ活動の認識手法を調査し,その性能を最先端技術と比較する。
既存の課題を要約し,グループ活動認識を理解するための包括的ガイダンスを提供する。
さらに,グループ活動認識における新たな視点を考察し,新たな方向性と可能性を探る。
関連論文リスト
- Visual-Geometric Collaborative Guidance for Affordance Learning [63.038406948791454]
本稿では,視覚的・幾何学的手がかりを取り入れた視覚・幾何学的協調学習ネットワークを提案する。
本手法は,客観的指標と視覚的品質の代表的なモデルより優れている。
論文 参考訳(メタデータ) (2024-10-15T07:35:51Z) - On the Element-Wise Representation and Reasoning in Zero-Shot Image Recognition: A Systematic Survey [82.49623756124357]
ゼロショット画像認識(ZSIR)は、目に見えない領域の認識と推論をモデルに与えることを目的としている。
本稿では,近年の素子ワイドZSIRの進歩について概説する。
まず、オブジェクト認識、合成認識、基礎モデルに基づくオープンワールド認識という3つの基本的なZSIRタスクを、統一された要素的視点に統合する。
論文 参考訳(メタデータ) (2024-08-09T05:49:21Z) - CogNarr Ecosystem: Facilitating Group Cognition at Scale [0.0]
本稿では,大規模なグループ設定における機能認知を促進するために設計されたCogNarrエコシステムを提案する。
重要な視点は、あるグループがある種の認知アーキテクチャを使って世界を感知する有機体であると考えることである。
論文 参考訳(メタデータ) (2024-07-11T08:59:17Z) - Open Problem: Active Representation Learning [0.0]
本稿では,部分的に観察可能な環境下での探索学習と表現学習を両立させる新しい課題のクラスである,能動表現学習の概念を紹介する。
我々は、能動的局所化とマッピング(能動SLAM)からアイデアを拡張し、それを適応顕微鏡で実証した科学的発見問題に変換する。
論文 参考訳(メタデータ) (2024-06-06T08:23:22Z) - Graph Enhanced Reinforcement Learning for Effective Group Formation in Collaborative Problem Solving [3.392758494801288]
本研究では,協調的問題解決環境における効果的なグループ形成の課題について論じる。
本稿では,グラフ理論と強化学習を活用した新しい手法を提案する。
論文 参考訳(メタデータ) (2024-03-15T04:04:40Z) - Homomorphism Autoencoder -- Learning Group Structured Representations from Observed Transitions [51.71245032890532]
本研究では,世界に作用するエージェントが,それを修飾する動作と整合した感覚情報の内部表現を学習できるようにする手法を提案する。
既存の作業とは対照的に、我々のアプローチはグループの事前の知識を必要とせず、エージェントが実行可能なアクションのセットを制限しない。
論文 参考訳(メタデータ) (2022-07-25T11:22:48Z) - Co-Located Human-Human Interaction Analysis using Nonverbal Cues: A
Survey [71.43956423427397]
本研究の目的は,非言語的キューと計算手法を同定し,効果的な性能を実現することである。
この調査は、最も広い範囲の社会現象と相互作用設定を巻き込むことによって、相手と異なる。
もっともよく使われる非言語キュー、計算方法、相互作用環境、センシングアプローチは、それぞれマイクとカメラを備えた3,4人で構成される会話活動、ベクターマシンのサポート、ミーティングである。
論文 参考訳(メタデータ) (2022-07-20T13:37:57Z) - Hunting Group Clues with Transformers for Social Group Activity
Recognition [3.1061678033205635]
社会的グループ活動認識には、複数のサブグループ活動を認識し、グループメンバーを特定する必要がある。
既存のほとんどのメソッドは、リージョンの機能を精錬し、それらをアクティビティのフィーチャにまとめることで、両方のタスクに取り組みます。
我々は,効果的なソーシャルグループ機能を生成するために,トランスフォーマーのアテンションモジュールを活用することを提案する。
本手法は,アテンションモジュールが社会的グループ活動に関連する特徴を識別し,集約するように設計されている。
論文 参考訳(メタデータ) (2022-07-12T01:46:46Z) - Improving Facial Attribute Recognition by Group and Graph Learning [34.39507051712628]
属性間の関係を爆発させることは、顔属性認識を改善する上で重要な課題である。
本研究では,空間的関係と非空間的関係の2種類の相関関係について考察する。
マルチスケールグループとグラフネットワークという統合ネットワークを提案する。
論文 参考訳(メタデータ) (2021-05-28T13:36:28Z) - Unsupervised Discriminative Embedding for Sub-Action Learning in Complex
Activities [54.615003524001686]
本稿では,複雑な活動における教師なしサブアクション学習の新たなアプローチを提案する。
提案手法は,視覚表現と時間表現の両方を,サブアクションを識別的に学習する潜在空間にマッピングする。
視覚-時空間埋め込みと判別的潜在概念の組み合わせにより,教師なし設定でロバストな動作表現を学習できることを示す。
論文 参考訳(メタデータ) (2021-04-30T20:07:27Z) - Recent Progress in Appearance-based Action Recognition [73.6405863243707]
アクション認識は、ビデオ内の様々な人間の行動を特定するタスクである。
最近の外見に基づく手法は、正確な行動認識に向けて有望な進歩を遂げている。
論文 参考訳(メタデータ) (2020-11-25T10:18:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。