論文の概要: Towards Micro-Action Recognition with Limited Annotations: An Asynchronous Pseudo Labeling and Training Approach
- arxiv url: http://arxiv.org/abs/2504.07785v1
- Date: Thu, 10 Apr 2025 14:22:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-18 17:05:12.268876
- Title: Towards Micro-Action Recognition with Limited Annotations: An Asynchronous Pseudo Labeling and Training Approach
- Title(参考訳): 限定アノテーションを用いたマイクロアクション認識に向けて:非同期擬似ラベリングとトレーニングアプローチ
- Authors: Yan Zhang, Lechao Cheng, Yaxiong Wang, Zhun Zhong, Meng Wang,
- Abstract要約: 本稿では,SSMAR(Semi-Supervised MAR)の設定について紹介する。
従来のSemi-Supervised Learning(SSL)メソッドは、不正確な擬似ラベルに過度に適合する傾向があり、エラーの蓄積と性能の低下につながる。
擬似ラベル作成プロセスとモデルトレーニングを明確に分離する非同期擬似ラベル作成訓練(APLT)を提案する。
- 参考スコア(独自算出の注目度): 35.32024173141412
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Micro-Action Recognition (MAR) aims to classify subtle human actions in video. However, annotating MAR datasets is particularly challenging due to the subtlety of actions. To this end, we introduce the setting of Semi-Supervised MAR (SSMAR), where only a part of samples are labeled. We first evaluate traditional Semi-Supervised Learning (SSL) methods to SSMAR and find that these methods tend to overfit on inaccurate pseudo-labels, leading to error accumulation and degraded performance. This issue primarily arises from the common practice of directly using the predictions of classifier as pseudo-labels to train the model. To solve this issue, we propose a novel framework, called Asynchronous Pseudo Labeling and Training (APLT), which explicitly separates the pseudo-labeling process from model training. Specifically, we introduce a semi-supervised clustering method during the offline pseudo-labeling phase to generate more accurate pseudo-labels. Moreover, a self-adaptive thresholding strategy is proposed to dynamically filter noisy labels of different classes. We then build a memory-based prototype classifier based on the filtered pseudo-labels, which is fixed and used to guide the subsequent model training phase. By alternating the two pseudo-labeling and model training phases in an asynchronous manner, the model can not only be learned with more accurate pseudo-labels but also avoid the overfitting issue. Experiments on three MAR datasets show that our APLT largely outperforms state-of-the-art SSL methods. For instance, APLT improves accuracy by 14.5\% over FixMatch on the MA-12 dataset when using only 50\% labeled data. Code will be publicly available.
- Abstract(参考訳): Micro-Action Recognition (MAR)は、ビデオにおける微妙な人間の行動の分類を目的としている。
しかし、MARデータセットの注釈付けは、アクションの微妙さのために特に難しい。
そこで本研究では,サンプルの一部のみをラベル付けしたセミスーパービジョンMAR(SSMAR)について紹介する。
我々はまず,従来の半教師学習(SSL)手法をSSMARに評価し,これらの手法が不正確な擬似ラベルに過度に適合する傾向にあり,誤りの蓄積や性能低下につながることを発見した。
この問題は主に、モデルのトレーニングに擬似ラベルとして分類器の予測を直接使用するという一般的な慣習から生じる。
そこで本研究では,Asynchronous Pseudo Labeling and Training (APLT) と呼ばれる新しいフレームワークを提案する。
具体的には、オフライン擬似ラベル生成フェーズにおいて、より正確な擬似ラベルを生成する半教師付きクラスタリング手法を提案する。
さらに,異なるクラスの雑音ラベルを動的にフィルタリングするために,自己適応型しきい値設定手法を提案する。
次に、フィルタされた擬似ラベルに基づいてメモリベースのプロトタイプ分類器を構築し、それを固定し、その後のモデルトレーニングフェーズをガイドする。
2つの擬似ラベルとモデルのトレーニングフェーズを非同期に交互に行うことで、モデルはより正確な擬似ラベルで学習できるだけでなく、過度に適合する問題を回避できる。
3つのMARデータセットの実験から、APLTは最先端のSSLメソッドよりも大幅に優れています。
例えば、APLTは50\%のラベル付きデータを使用する場合、MA-12データセット上のFixMatchよりも14.5\%精度が向上する。
コードは公開されます。
関連論文リスト
- CGMatch: A Different Perspective of Semi-supervised Learning [20.03126368452921]
ラベル付きデータを利用したセミ教師付き学習(SSL)が注目されている。
既存の手法はモデルの状態を正確に評価するためにモデルの信頼性にのみ依存している、と我々は主張する。
我々はCGMatchと呼ばれる新しいSSLモデルを提案し、これが初めてCount-Gapと呼ばれる新しいメトリックを組み込んだ。
論文 参考訳(メタデータ) (2025-03-04T03:14:15Z) - Prompt-based Pseudo-labeling Strategy for Sample-Efficient Semi-Supervised Extractive Summarization [12.582774521907227]
半教師付き学習(SSL)は、ラベル付きデータが不足し、ラベルなしデータが豊富であるシナリオで広く使われているテクニックである。
標準SSLメソッドは、まず分類モデルをトレーニングし、次に分類器の信頼性値を使用して擬似ラベルを選択するために教師-学生パラダイムに従う。
より正確な擬似ラベルでラベルなしのサンプルを抽出するLLMを用いたプロンプトベースの擬似ラベル方式を提案する。
論文 参考訳(メタデータ) (2023-11-16T04:29:41Z) - All Points Matter: Entropy-Regularized Distribution Alignment for
Weakly-supervised 3D Segmentation [67.30502812804271]
擬似ラベルは、弱い教師付き3Dセグメンテーションタスクに広く使われており、学習に使えるのはスパース・グラウンド・トラス・ラベルのみである。
本稿では,生成した擬似ラベルを正規化し,擬似ラベルとモデル予測とのギャップを効果的に狭めるための新しい学習戦略を提案する。
論文 参考訳(メタデータ) (2023-05-25T08:19:31Z) - CroSel: Cross Selection of Confident Pseudo Labels for Partial-Label Learning [14.077121555766398]
部分ラベル学習(Partial-label Learning, PLL)は, 弱い教師付き学習問題である。
モデルからの履歴予測を利用して,ほとんどのトレーニング例で真のラベルを識別するCroSelと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-18T08:48:16Z) - Pseudo-Label Noise Suppression Techniques for Semi-Supervised Semantic
Segmentation [21.163070161951868]
半消費学習(SSL)は、教師なしデータをトレーニングに組み込むことで、大きなラベル付きデータセットの必要性を減らすことができる。
現在のSSLアプローチでは、初期教師付きトレーニングモデルを使用して、擬似ラベルと呼ばれる未ラベル画像の予測を生成する。
擬似ラベルノイズと誤りを3つのメカニズムで制御する。
論文 参考訳(メタデータ) (2022-10-19T09:46:27Z) - Pseudo-Labeling Based Practical Semi-Supervised Meta-Training for Few-Shot Learning [93.63638405586354]
擬似ラベルベースメタラーニング(PLML)という,シンプルで効果的なメタトレーニングフレームワークを提案する。
まず、一般的な半教師付き学習(SSL)を用いて分類器を訓練し、ラベルなしデータの擬似ラベルを得る。
ラベル付きおよび擬似ラベル付きデータから数ショットのタスクを構築し、特徴の平滑化と雑音抑圧を伴う新しい微調整法を設計する。
論文 参考訳(メタデータ) (2022-07-14T10:53:53Z) - GuidedMix-Net: Semi-supervised Semantic Segmentation by Using Labeled
Images as Reference [90.5402652758316]
半教師付きセマンティックセマンティックセグメンテーションのための新しい手法である GuidedMix-Net を提案する。
ラベル付き情報を使用して、ラベルなしのインスタンスの学習をガイドする。
競合セグメンテーションの精度を達成し、mIoUを以前のアプローチに比べて+7$%大きく改善する。
論文 参考訳(メタデータ) (2021-12-28T06:48:03Z) - Cross-Model Pseudo-Labeling for Semi-Supervised Action Recognition [98.25592165484737]
CMPL(Cross-Model Pseudo-Labeling)と呼ばれる,より効果的な擬似ラベル方式を提案する。
CMPLは、それぞれRGBモダリティとラベル付きデータのみを使用して、Kinetics-400とUCF-101のTop-1の精度を17.6%と25.1%で達成している。
論文 参考訳(メタデータ) (2021-12-17T18:59:41Z) - GuidedMix-Net: Learning to Improve Pseudo Masks Using Labeled Images as
Reference [153.354332374204]
半教師付きセマンティックセマンティックセグメンテーションのための新しい手法である GuidedMix-Net を提案する。
まず、ラベル付きデータとラベルなしデータの間に特徴アライメントの目的を導入し、類似した画像対をキャプチャする。
MITransは、ラベルなしデータのさらなるプログレッシブな精細化のための強力な知識モジュールであることが示されている。
ラベル付きデータに対する教師付き学習とともに、ラベル付きデータの予測が生成した擬似マスクとともに学習される。
論文 参考訳(メタデータ) (2021-06-29T02:48:45Z) - Distribution-Aware Semantics-Oriented Pseudo-label for Imbalanced
Semi-Supervised Learning [80.05441565830726]
本稿では,疑似ラベルの重み付けがモデル性能に悪影響を及ぼすような,不均衡な半教師付き学習に対処する。
本稿では,この観測の動機となるバイアスに対処する,一般的な擬似ラベルフレームワークを提案する。
不均衡SSLのための新しい擬似ラベルフレームワークを、DASO(Distributed-Aware Semantics-Oriented Pseudo-label)と呼ぶ。
論文 参考訳(メタデータ) (2021-06-10T11:58:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。