論文の概要: Balanced Representation Learning for Long-tailed Skeleton-based Action Recognition
- arxiv url: http://arxiv.org/abs/2308.14024v2
- Date: Fri, 21 Feb 2025 07:13:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-24 17:07:13.142370
- Title: Balanced Representation Learning for Long-tailed Skeleton-based Action Recognition
- Title(参考訳): 長い尾を持つ骨格に基づく行動認識のためのバランス表現学習
- Authors: Hongda Liu, Yunlong Wang, Min Ren, Junxing Hu, Zhengquan Luo, Guangqi Hou, Zhenan Sun,
- Abstract要約: 動作認識における長い尾の問題に対処する新しいバランス付き表現学習法を提案する。
我々は、表現空間のバイアスを軽減するために、分離された行動認識学習スケジュールを設計する。
提案手法は4つのスケルトンデータセットで検証される。
- 参考スコア(独自算出の注目度): 31.626282931089055
- License:
- Abstract: Skeleton-based action recognition has recently made significant progress. However, data imbalance is still a great challenge in real-world scenarios. The performance of current action recognition algorithms declines sharply when training data suffers from heavy class imbalance. The imbalanced data actually degrades the representations learned by these methods and becomes the bottleneck for action recognition. How to learn unbiased representations from imbalanced action data is the key to long-tailed action recognition. In this paper, we propose a novel balanced representation learning method to address the long-tailed problem in action recognition. Firstly, a spatial-temporal action exploration strategy is presented to expand the sample space effectively, generating more valuable samples in a rebalanced manner. Secondly, we design a detached action-aware learning schedule to further mitigate the bias in the representation space. The schedule detaches the representation learning of tail classes from training and proposes an action-aware loss to impose more effective constraints. Additionally, a skip-modal representation is proposed to provide complementary structural information. The proposed method is validated on four skeleton datasets, NTU RGB+D 60, NTU RGB+D 120, NW-UCLA, and Kinetics. It not only achieves consistently large improvement compared to the state-of-the-art (SOTA) methods, but also demonstrates a superior generalization capacity through extensive experiments. Our code is available at https://github.com/firework8/BRL.
- Abstract(参考訳): 骨格に基づく行動認識は近年大きな進歩を遂げている。
しかし、実際のシナリオでは、データの不均衡は依然として大きな課題です。
現在の行動認識アルゴリズムの性能は、トレーニングデータが重度のクラス不均衡に苦しむと急激に低下する。
不均衡なデータは、これらの手法によって学習された表現を実際に劣化させ、アクション認識のボトルネックとなる。
不均衡なアクションデータからバイアスのない表現を学習する方法が、長い尾のアクション認識の鍵である。
本稿では,行動認識における長い尾の問題に対処する,バランスの取れた表現学習手法を提案する。
まず、サンプル空間を効果的に拡張し、より貴重なサンプルを再均衡的に生成するための時空間行動探索戦略を提示する。
第二に、表現空間のバイアスを軽減するために、分離された行動認識学習スケジュールを設計する。
スケジュールは、末尾クラスの表現学習を訓練から切り離し、より効果的な制約を課すために行動認識損失を提案する。
さらに、相補的な構造情報を提供するために、スキップモーダル表現を提案する。
提案手法は,NTU RGB+D 60,NTU RGB+D 120,NW-UCLA,Kineeticsの4つの骨格データに対して検証を行った。
最先端技術(SOTA)法に比べて一貫した大きな改善を達成できるだけでなく、広範な実験を通じてより優れた一般化能力を示す。
私たちのコードはhttps://github.com/firework8/BRLで公開されています。
関連論文リスト
- USDRL: Unified Skeleton-Based Dense Representation Learning with Multi-Grained Feature Decorrelation [24.90512145836643]
本稿では,特徴デコレーションに基づく統一骨格に基づくDense Representation Learningフレームワークを提案する。
我々のアプローチは現在のSOTA(State-of-the-art)アプローチよりも大幅に優れています。
論文 参考訳(メタデータ) (2024-12-12T12:20:27Z) - ReL-SAR: Representation Learning for Skeleton Action Recognition with Convolutional Transformers and BYOL [6.603505460200282]
非教師なし表現学習は、ラベルのない骨格データを活用する上で最も重要なものである。
ReL-SARと呼ばれる軽量な畳み込みトランスフォーマフレームワークを設計し、骨格配列の空間的および時間的キューを共同でモデル化する。
Bootstrap Your Own Latent (BYOL) を利用して、ラベルのない骨格配列データから堅牢な表現を学習する。
論文 参考訳(メタデータ) (2024-09-09T16:03:26Z) - Enhancing Consistency and Mitigating Bias: A Data Replay Approach for
Incremental Learning [100.7407460674153]
ディープラーニングシステムは、一連のタスクから学ぶとき、破滅的な忘れがちだ。
問題を緩和するため、新しいタスクを学ぶ際に経験豊富なタスクのデータを再生する手法が提案されている。
しかし、メモリ制約やデータプライバシーの問題を考慮すると、実際には期待できない。
代替として、分類モデルからサンプルを反転させることにより、データフリーなデータ再生法を提案する。
論文 参考訳(メタデータ) (2024-01-12T12:51:12Z) - Scaling Laws Beyond Backpropagation [64.0476282000118]
因果デコーダのみの変換器を効率的に訓練するための直接フィードバックアライメントの有効性について検討した。
DFAはバックプロパゲーションよりも効率的なスケーリングを提供していないことが分かりました。
論文 参考訳(メタデータ) (2022-10-26T10:09:14Z) - Moderately-Balanced Representation Learning for Treatment Effects with
Orthogonality Information [14.040918087553177]
平均治療効果(ATE)を観測データから推定することは選択バイアスにより困難である。
本稿では,中等度にバランスの取れた表現学習フレームワークを提案する。
このフレームワークは、マルチタスク学習によるオーバーバランスから表現を保護する。
論文 参考訳(メタデータ) (2022-09-05T13:20:12Z) - Constructing Balance from Imbalance for Long-tailed Image Recognition [50.6210415377178]
多数派(頭)クラスと少数派(尾)クラスの不均衡は、データ駆動のディープニューラルネットワークを著しく歪ませる。
従来の手法では、データ分散、特徴空間、モデル設計の観点からデータ不均衡に対処していた。
ラベル空間を段階的に調整し,ヘッドクラスとテールクラスを分割することで,簡潔なパラダイムを提案する。
提案モデルでは,特徴評価手法も提供し,長期的特徴学習の道を開く。
論文 参考訳(メタデータ) (2022-08-04T10:22:24Z) - Value-Consistent Representation Learning for Data-Efficient
Reinforcement Learning [105.70602423944148]
本稿では,意思決定に直接関連のある表現を学習するための,VCR(Value-Consistent Expression Learning)という新しい手法を提案する。
この想像された状態と環境によって返される実状態とを一致させる代わりに、VCRは両方の状態に$Q$-valueヘッドを適用し、2つのアクション値の分布を得る。
検索不要なRLアルゴリズムに対して,提案手法が新たな最先端性能を実現することが実証された。
論文 参考訳(メタデータ) (2022-06-25T03:02:25Z) - CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep
Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。
サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。
本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文 参考訳(メタデータ) (2022-02-11T13:49:51Z) - Exploratory State Representation Learning [63.942632088208505]
本稿では,XSRL(eXploratory State Representation Learning)と呼ばれる新しい手法を提案する。
一方、コンパクトな状態表現と、その表現から不可解な情報を除去するために使用される状態遷移推定器を共同で学習する。
一方、逆モデルを継続的に訓練し、このモデルの予測誤差に$k$-stepの学習促進ボーナスを加え、発見ポリシーの目的を形成する。
論文 参考訳(メタデータ) (2021-09-28T10:11:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。