論文の概要: Iterate & Cluster: Iterative Semi-Supervised Action Recognition
- arxiv url: http://arxiv.org/abs/2006.06911v1
- Date: Fri, 12 Jun 2020 02:19:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 04:00:38.288853
- Title: Iterate & Cluster: Iterative Semi-Supervised Action Recognition
- Title(参考訳): Iterate & Cluster: Iterative Semi-Supervised Action Recognition
- Authors: Jingyuan Li, Eli Shlizerman
- Abstract要約: 動作中に追跡される機能の時系列を前提に、システムはそのシーケンスをアクションに集約します。
本システムでは,わずかなアノテーションで認識性能を向上できることを示す。
- 参考スコア(独自算出の注目度): 8.134961550216618
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel system for active semi-supervised feature-based action
recognition. Given time sequences of features tracked during movements our
system clusters the sequences into actions. Our system is based on
encoder-decoder unsupervised methods shown to perform clustering by
self-organization of their latent representation through the auto-regression
task. These methods were tested on human action recognition benchmarks and
outperformed non-feature based unsupervised methods and achieved comparable
accuracy to skeleton-based supervised methods. However, such methods rely on
K-Nearest Neighbours (KNN) associating sequences to actions, and general
features with no annotated data would correspond to approximate clusters which
could be further enhanced. Our system proposes an iterative semi-supervised
method to address this challenge and to actively learn the association of
clusters and actions. The method utilizes latent space embedding and clustering
of the unsupervised encoder-decoder to guide the selection of sequences to be
annotated in each iteration. Each iteration, the selection aims to enhance
action recognition accuracy while choosing a small number of sequences for
annotation. We test the approach on human skeleton-based action recognition
benchmarks assuming that only annotations chosen by our method are available
and on mouse movements videos recorded in lab experiments. We show that our
system can boost recognition performance with only a small percentage of
annotations. The system can be used as an interactive annotation tool to guide
labeling efforts for 'in the wild' videos of various objects and actions to
reach robust recognition.
- Abstract(参考訳): 本稿では,アクティブな半教師付き特徴に基づく行動認識システムを提案する。
動作中に追跡される機能の時系列を前提に、システムはそのシーケンスをアクションに集約します。
本システムは,自己回帰タスクによる潜在表現の自己組織化によるクラスタリングを行うために,教師なしのエンコーダデコーダに基づく。
これらの手法はヒトの行動認識ベンチマークおよび非機能ベースの教師なし手法より優れており、骨格に基づく教師付き手法と同等の精度を達成できた。
しかし、このような手法はK-Nearest Neighbours (KNN) のアクション関連配列に依存しており、注釈付きデータを持たない一般的な特徴は、さらに拡張可能な近似クラスタに対応する。
本システムでは,この課題に対処し,クラスタとアクションの関連を積極的に学習するための反復的半教師付き手法を提案する。
この方法は、教師なしエンコーダデコーダの遅延空間埋め込みとクラスタリングを利用して、各イテレーションで注釈付けされるシーケンスの選択を誘導する。
各イテレーションは、アノテーションの少数のシーケンスを選択しながら、アクション認識の精度を高めることを目的としている。
我々は,本手法で選択したアノテーションのみを利用できると仮定し,ヒト骨格に基づく行動認識ベンチマークを用いてアプローチを検証した。
本システムでは,わずかなアノテーションで認識性能を向上させることができる。
このシステムは、さまざまなオブジェクトやアクションの"in the wild"ビデオのラベル付け作業をガイドし、堅牢な認識を達成するためのインタラクティブなアノテーションツールとして使用できる。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - FinePseudo: Improving Pseudo-Labelling through Temporal-Alignablity for Semi-Supervised Fine-Grained Action Recognition [57.17966905865054]
実生活における行動認識の応用は、しばしば微妙な動きのきめ細かい理解を必要とする。
既存の半教師ありアクション認識は主に粗いアクション認識に焦点を当てている。
そこで我々は,微粒なアクションペアの識別を効果的に行うための,アライナビリティ検証に基づくメトリック学習手法を提案する。
論文 参考訳(メタデータ) (2024-09-02T20:08:06Z) - An Information Compensation Framework for Zero-Shot Skeleton-based Action Recognition [49.45660055499103]
ゼロショットの人間の骨格に基づく行動認識は、トレーニング中に見られるカテゴリ外の行動を認識するモデルを構築することを目的としている。
従来の研究では、シーケンスの視覚的空間分布と意味的空間分布の整合性に焦点が当てられていた。
強固で頑健な表現を得るために,新たな損失関数サンプリング手法を提案する。
論文 参考訳(メタデータ) (2024-06-02T06:53:01Z) - Proposal-based Temporal Action Localization with Point-level Supervision [29.98225940694062]
ポイントレベルの時間的行動ローカライゼーション(PTAL)は、未トリミングビデオにおけるアクションの認識とローカライズを目的としている。
そこで本研究では,フレキシブル期間のアクション提案を生成し,評価することで,アクションをローカライズする手法を提案する。
実験の結果,提案手法は最先端手法の競争力や性能に優れることがわかった。
論文 参考訳(メタデータ) (2023-10-09T08:27:05Z) - Neighbour Consistency Guided Pseudo-Label Refinement for Unsupervised
Person Re-Identification [80.98291772215154]
教師なしの人物再識別(ReID)は、アノテーションを使わずに人物検索のための識別的アイデンティティの特徴を学習することを目的としている。
近年の進歩はクラスタリングに基づく擬似ラベルを活用することで実現されている。
本稿では, Pseudo Label Refinement フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-30T09:39:57Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Sparse Semi-Supervised Action Recognition with Active Learning [10.558951653323286]
骨格に基づく行動認識の最先端の手法は、ラベルに依存して管理されている。
本稿では,骨格に基づく行動認識のための新しい手法であるSESARを提案する。
本研究の結果は, 単独骨格を用いた教師付きクラスタ識別と, スパースラベル標本に適用した場合のアクティブラーニング手法に優れていた。
論文 参考訳(メタデータ) (2020-12-03T07:48:31Z) - Self-supervised Video Object Segmentation [76.83567326586162]
本研究の目的は、半教師付きビデオオブジェクトセグメンテーション(高密度トラッキング)の解決を目的とした自己教師付き表現学習である。
i) 従来の自己教師型アプローチを改善すること、(ii) オンライン適応モジュールによる自己教師型アプローチの強化により、空間的時間的不連続性によるトラッカーのドリフトを緩和すること、(iv) DAVIS-2017とYouTubeの自己教師型アプローチで最先端の結果を示すこと、などが提案されている。
論文 参考訳(メタデータ) (2020-06-22T17:55:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。