論文の概要: Group Activity Recognition in Computer Vision: A Comprehensive Review,
Challenges, and Future Perspectives
- arxiv url: http://arxiv.org/abs/2307.13541v1
- Date: Tue, 25 Jul 2023 14:44:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-26 16:36:48.442396
- Title: Group Activity Recognition in Computer Vision: A Comprehensive Review,
Challenges, and Future Perspectives
- Title(参考訳): コンピュータビジョンにおけるグループ活動認識:包括的レビュー,課題,今後の展望
- Authors: Chuanchuan Wang, Ahmad Sufril Azlan Mohamed
- Abstract要約: グループ活動認識はコンピュータビジョンにおけるホットトピックである。
グループ関係を通じた活動の認識はグループ活動認識において重要な役割を担っている。
本研究は,グループ活動の認識における技術進歩について考察する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Group activity recognition is a hot topic in computer vision. Recognizing
activities through group relationships plays a vital role in group activity
recognition. It holds practical implications in various scenarios, such as
video analysis, surveillance, automatic driving, and understanding social
activities. The model's key capabilities encompass efficiently modeling
hierarchical relationships within a scene and accurately extracting distinctive
spatiotemporal features from groups. Given this technology's extensive
applicability, identifying group activities has garnered significant research
attention. This work examines the current progress in technology for
recognizing group activities, with a specific focus on global interactivity and
activities. Firstly, we comprehensively review the pertinent literature and
various group activity recognition approaches, from traditional methodologies
to the latest methods based on spatial structure, descriptors, non-deep
learning, hierarchical recurrent neural networks (HRNN), relationship models,
and attention mechanisms. Subsequently, we present the relational network and
relational architectures for each module. Thirdly, we investigate methods for
recognizing group activity and compare their performance with state-of-the-art
technologies. We summarize the existing challenges and provide comprehensive
guidance for newcomers to understand group activity recognition. Furthermore,
we review emerging perspectives in group activity recognition to explore new
directions and possibilities.
- Abstract(参考訳): グループ活動認識はコンピュータビジョンにおけるホットトピックである。
グループ関係を通じた活動の認識はグループ活動認識において重要な役割を担っている。
ビデオ分析、監視、自動運転、社会活動の理解など、様々なシナリオにおいて実践的な意味を持つ。
モデルの主要な機能は、シーン内の階層的関係を効率的にモデル化し、グループから特有の時空間的特徴を正確に抽出する。
この技術の広範な適用性を考えると、グループ活動の特定は大きな研究の注目を集めている。
本研究は,グローバルな対話性と活動に焦点をあて,グループ活動の認識技術の現状を考察する。
まず,従来の手法から,空間構造,記述子,非深層学習,階層的リカレントニューラルネットワーク(HRNN),関係モデル,アテンション機構に基づく最新の手法に至るまで,関連する文献やグループ活動認識アプローチを網羅的にレビューする。
次に,各モジュールのリレーショナルネットワークとリレーショナルアーキテクチャについて述べる。
第3に,グループ活動の認識手法を調査し,その性能を最先端技術と比較する。
既存の課題を要約し,グループ活動認識を理解するための包括的ガイダンスを提供する。
さらに,グループ活動認識における新たな視点を考察し,新たな方向性と可能性を探る。
関連論文リスト
- Dynamic planning in hierarchical active inference [0.0]
人間の脳が認知決定に関連する運動軌跡を推論し、導入する能力について述べる。
この研究は、ニューラルネットワークと強化学習を中心とした従来の見解とは距離を置き、アクティブ推論においてまだ探索されていない方向に向かっている。
論文 参考訳(メタデータ) (2024-02-18T17:32:53Z) - Interactive Natural Language Processing [67.87925315773924]
対話型自然言語処理(iNLP)は,NLP分野における新しいパラダイムとして登場した。
本稿では,iNLPの概念の統一的定義と枠組みを提案することから,iNLPに関する包括的調査を行う。
論文 参考訳(メタデータ) (2023-05-22T17:18:29Z) - Deep Reinforcement Learning for Multi-Agent Interaction [14.532965827043254]
自律エージェント研究グループは、自律システム制御のための新しい機械学習アルゴリズムを開発した。
本稿では,現在進行中の研究ポートフォリオの概要を概説するとともに,今後の課題について論じる。
論文 参考訳(メタデータ) (2022-08-02T21:55:56Z) - Co-Located Human-Human Interaction Analysis using Nonverbal Cues: A
Survey [71.43956423427397]
本研究の目的は,非言語的キューと計算手法を同定し,効果的な性能を実現することである。
この調査は、最も広い範囲の社会現象と相互作用設定を巻き込むことによって、相手と異なる。
もっともよく使われる非言語キュー、計算方法、相互作用環境、センシングアプローチは、それぞれマイクとカメラを備えた3,4人で構成される会話活動、ベクターマシンのサポート、ミーティングである。
論文 参考訳(メタデータ) (2022-07-20T13:37:57Z) - Hunting Group Clues with Transformers for Social Group Activity
Recognition [3.1061678033205635]
社会的グループ活動認識には、複数のサブグループ活動を認識し、グループメンバーを特定する必要がある。
既存のほとんどのメソッドは、リージョンの機能を精錬し、それらをアクティビティのフィーチャにまとめることで、両方のタスクに取り組みます。
我々は,効果的なソーシャルグループ機能を生成するために,トランスフォーマーのアテンションモジュールを活用することを提案する。
本手法は,アテンションモジュールが社会的グループ活動に関連する特徴を識別し,集約するように設計されている。
論文 参考訳(メタデータ) (2022-07-12T01:46:46Z) - Self-Supervised Visual Representation Learning with Semantic Grouping [50.14703605659837]
我々は、未ラベルのシーン中心のデータから視覚表現を学習する問題に取り組む。
本研究では,データ駆動型セマンティックスロット,すなわちSlotConによる協調型セマンティックグルーピングと表現学習のためのコントラスト学習を提案する。
論文 参考訳(メタデータ) (2022-05-30T17:50:59Z) - Human-Robot Collaboration and Machine Learning: A Systematic Review of
Recent Research [69.48907856390834]
人間ロボットコラボレーション(Human-robot collaboration、HRC)とは、人間とロボットの相互作用を探索する手法である。
本稿では,HRCの文脈における機械学習技術の利用に関する詳細な文献レビューを提案する。
論文 参考訳(メタデータ) (2021-10-14T15:14:33Z) - Human-like Relational Models for Activity Recognition in Video [8.87742125296885]
ディープニューラルネットワークによるビデオアクティビティ認識は多くのクラスにとって印象的だ。
ディープニューラルネットワークは、重要な関係を効果的に学習するのに苦労する。
本稿では,映像を時系列的に解釈する,より人間的な行動認識手法を提案する。
我々は,この手法を何かのデータセットの挑戦的なサブセットに適用し,挑戦的なアクティビティに基づくニューラルネットワークのベースラインに対するより堅牢なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-07-12T11:13:17Z) - Improving Facial Attribute Recognition by Group and Graph Learning [34.39507051712628]
属性間の関係を爆発させることは、顔属性認識を改善する上で重要な課題である。
本研究では,空間的関係と非空間的関係の2種類の相関関係について考察する。
マルチスケールグループとグラフネットワークという統合ネットワークを提案する。
論文 参考訳(メタデータ) (2021-05-28T13:36:28Z) - Unsupervised Discriminative Embedding for Sub-Action Learning in Complex
Activities [54.615003524001686]
本稿では,複雑な活動における教師なしサブアクション学習の新たなアプローチを提案する。
提案手法は,視覚表現と時間表現の両方を,サブアクションを識別的に学習する潜在空間にマッピングする。
視覚-時空間埋め込みと判別的潜在概念の組み合わせにより,教師なし設定でロバストな動作表現を学習できることを示す。
論文 参考訳(メタデータ) (2021-04-30T20:07:27Z) - Recent Progress in Appearance-based Action Recognition [73.6405863243707]
アクション認識は、ビデオ内の様々な人間の行動を特定するタスクである。
最近の外見に基づく手法は、正確な行動認識に向けて有望な進歩を遂げている。
論文 参考訳(メタデータ) (2020-11-25T10:18:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。