論文の概要: Learning Group Activities from Skeletons without Individual Action
Labels
- arxiv url: http://arxiv.org/abs/2105.06754v1
- Date: Fri, 14 May 2021 10:31:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-17 12:42:15.432155
- Title: Learning Group Activities from Skeletons without Individual Action
Labels
- Title(参考訳): 個人行動ラベルのない骨格からの集団活動の学習
- Authors: Fabio Zappardino and Tiberio Uricchio and Lorenzo Seidenari and
Alberto Del Bimbo
- Abstract要約: 我々は,骨格データのみを用いて,グループ活動ラベルのみをシーケンスレベルで使用して,最先端の最先端システムを訓練できることを示す。
実験の結果,個別の行動監督なしに訓練したモデルの性能は低かった。
慎重に設計されたリーンポーズのみのアーキテクチャは、自己監督型であっても、より複雑なマルチモーダルアプローチに比べて高い競合性を示している。
- 参考スコア(独自算出の注目度): 32.60526967706986
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To understand human behavior we must not just recognize individual actions
but model possibly complex group activity and interactions. Hierarchical models
obtain the best results in group activity recognition but require fine grained
individual action annotations at the actor level. In this paper we show that
using only skeletal data we can train a state-of-the art end-to-end system
using only group activity labels at the sequence level. Our experiments show
that models trained without individual action supervision perform poorly. On
the other hand we show that pseudo-labels can be computed from any pre-trained
feature extractor with comparable final performance. Finally our carefully
designed lean pose only architecture shows highly competitive results versus
more complex multimodal approaches even in the self-supervised variant.
- Abstract(参考訳): 人間の行動を理解するためには、個々の行動を単に認識するだけでなく、複雑な集団活動や相互作用をモデル化する必要がある。
階層モデルはグループアクティビティ認識の最良の結果を得るが、アクターレベルでの個々のアクションアノテーションをきめ細かいものにする必要がある。
本稿では,骨格データのみを用いて,グループアクティビティラベルのみをシーケンスレベルで使用して,最先端の最先端システムをトレーニングできることを示す。
実験の結果,個別の行動監督なしに訓練したモデルの性能は低かった。
一方,擬似ラベルは任意の事前学習された特徴抽出器から計算可能であり,最終的な性能が同等であることを示す。
最後に、慎重に設計されたリーンポーズのみのアーキテクチャは、自己監督型であっても、より複雑なマルチモーダルアプローチに比べて高い競合性を示している。
関連論文リスト
- SOHES: Self-supervised Open-world Hierarchical Entity Segmentation [82.45303116125021]
この研究は、人間のアノテーションを必要としない新しいアプローチであるSOHES(Self-supervised Open World Hierarchical Entities)を提示する。
視覚的特徴クラスタリングにより高品質な擬似ラベルを生成し,教師同士の学習によって擬似ラベルの雑音を補正する。
学習データとして生画像を用いることにより,自己監督型オープンワールドセグメンテーションにおける前例のない性能を実現する。
論文 参考訳(メタデータ) (2024-04-18T17:59:46Z) - Group Activity Recognition using Unreliable Tracked Pose [8.592249538742527]
ビデオにおけるグループ活動認識は、ビデオ内のすべての個人の行動を認識するモデルが必要であるため、複雑なタスクである。
我々は、Rendered Pose based Group Activity Recognition System (RePGARS)と呼ばれる革新的な深層学習に基づくグループアクティビティ認識手法を導入する。
論文 参考訳(メタデータ) (2024-01-06T17:36:13Z) - Fast and Expressive Gesture Recognition using a Combination-Homomorphic
Electromyogram Encoder [21.25126610043744]
筋電図を用いたジェスチャー認識の課題について検討する。
方向成分と変調器成分を組み合わせたジェスチャーを定義する。
新しい被験者は単一のコンポーネントジェスチャしか示さない。
実際の単一のジェスチャーの特徴ベクトルを組み合わせて合成学習データを生成することで、見知らぬ組み合わせのジェスチャーに外挿する。
論文 参考訳(メタデータ) (2023-10-30T20:03:34Z) - Semi-supervised learning made simple with self-supervised clustering [65.98152950607707]
自己教師付き学習モデルは、人間のアノテーションを必要とせずにリッチな視覚表現を学習することが示されている。
本稿では,クラスタリングに基づく自己教師付き手法を半教師付き学習者へと変換する,概念的に単純だが経験的に強力な手法を提案する。
論文 参考訳(メタデータ) (2023-06-13T01:09:18Z) - Detector-Free Weakly Supervised Group Activity Recognition [41.344689949264335]
グループアクティビティ認識(グループアクティビティ認識)とは、ビデオの中で、グループ全体で行われるアクティビティを理解するタスクである。
本稿では,ボックスラベルにもオブジェクト検出にも依存しない,グループ活動認識のための新しいモデルを提案する。
トランスフォーマーに基づくモデルでは,アテンション機構を利用してグループアクティビティの部分的コンテキストをローカライズし,エンコードする。
論文 参考訳(メタデータ) (2022-04-05T12:05:04Z) - Unsupervised Action Segmentation with Self-supervised Feature Learning
and Co-occurrence Parsing [32.66011849112014]
時間的アクションセグメンテーションは、ビデオの各フレームをアクションラベルで分類するタスクである。
本研究では,ラベル付けされていないビデオのコーパスで動作する自己教師型手法を探索し,ビデオ全体にわたる時間的セグメントのセットを予測する。
我々は,行動の構造に基づくサブアクション間の相関を捉えるだけでなく,そのサブアクションの時間的軌跡を正確かつ一般的な方法で推定する,新しい共起動作解析アルゴリズムであるCAPを開発した。
論文 参考訳(メタデータ) (2021-05-29T00:29:40Z) - A Closer Look at Self-training for Zero-Label Semantic Segmentation [53.4488444382874]
トレーニング中に見られないクラスをセグメント化できることは、ディープラーニングにおいて重要な技術的課題です。
事前のゼロラベルセマンティクスセグメンテーションは、ビジュアル・セマンティクスの埋め込みや生成モデルを学ぶことによってこのタスクにアプローチする。
本研究では,同一画像の異なる増分から生じる擬似ラベルの交点を取り出し,ノイズの多い擬似ラベルをフィルタリングする整合性正規化器を提案する。
論文 参考訳(メタデータ) (2021-04-21T14:34:33Z) - CLASTER: Clustering with Reinforcement Learning for Zero-Shot Action
Recognition [52.66360172784038]
各インスタンスを個別に最適化するのではなく,すべてのトレーニングサンプルを同時に考慮したクラスタリングモデルを提案する。
提案手法をCLASTERと呼び,すべての標準データセットの最先端性を常に改善することを確認する。
論文 参考訳(メタデータ) (2021-01-18T12:46:24Z) - Naive-Student: Leveraging Semi-Supervised Learning in Video Sequences
for Urban Scene Segmentation [57.68890534164427]
本研究では,未ラベル映像シーケンスと追加画像の半教師付き学習を利用して,都市景観セグメンテーションの性能を向上させることができるかどうかを問う。
我々は単にラベルのないデータに対して擬似ラベルを予測し、人間の注釈付きデータと擬似ラベル付きデータの両方でその後のモデルを訓練する。
我々のNaive-Studentモデルは、このような単純で効果的な反復的半教師付き学習で訓練され、3つのCityscapesベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2020-05-20T18:00:05Z) - Improving Semantic Segmentation via Self-Training [75.07114899941095]
半教師付きアプローチ,特に自己学習パラダイムを用いて,最先端の成果を得ることができることを示す。
まず、ラベル付きデータに基づいて教師モデルを訓練し、次にラベルなしデータの大規模なセット上で擬似ラベルを生成する。
私たちの堅牢なトレーニングフレームワークは、人名と擬似ラベルを共同で消化し、Cityscapes、CamVid、KITTIデータセット上で最高のパフォーマンスを達成することができます。
論文 参考訳(メタデータ) (2020-04-30T17:09:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。