論文の概要: Balanced Representation Learning for Long-tailed Skeleton-based Action
Recognition
- arxiv url: http://arxiv.org/abs/2308.14024v1
- Date: Sun, 27 Aug 2023 07:25:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 17:24:42.428330
- Title: Balanced Representation Learning for Long-tailed Skeleton-based Action
Recognition
- Title(参考訳): ロングテールスケルトンに基づく行動認識のためのバランスド表現学習
- Authors: Hongda Liu, Yunlong Wang, Min Ren, Junxing Hu, Zhengquan Luo, Guangqi
Hou, Zhenan Sun
- Abstract要約: 動作認識における長い尾の問題に対処する新しいバランス付き表現学習法を提案する。
我々は、表現空間のバイアスを軽減するために、分離された行動認識学習スケジュールを設計する。
提案手法は4つのスケルトンデータセットで検証される。
- 参考スコア(独自算出の注目度): 33.212205680007756
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Skeleton-based action recognition has recently made significant progress.
However, data imbalance is still a great challenge in real-world scenarios. The
performance of current action recognition algorithms declines sharply when
training data suffers from heavy class imbalance. The imbalanced data actually
degrades the representations learned by these methods and becomes the
bottleneck for action recognition. How to learn unbiased representations from
imbalanced action data is the key to long-tailed action recognition. In this
paper, we propose a novel balanced representation learning method to address
the long-tailed problem in action recognition. Firstly, a spatial-temporal
action exploration strategy is presented to expand the sample space
effectively, generating more valuable samples in a rebalanced manner. Secondly,
we design a detached action-aware learning schedule to further mitigate the
bias in the representation space. The schedule detaches the representation
learning of tail classes from training and proposes an action-aware loss to
impose more effective constraints. Additionally, a skip-modal representation is
proposed to provide complementary structural information. The proposed method
is validated on four skeleton datasets, NTU RGB+D 60, NTU RGB+D 120, NW-UCLA,
and Kinetics. It not only achieves consistently large improvement compared to
the state-of-the-art (SOTA) methods, but also demonstrates a superior
generalization capacity through extensive experiments. Our code is available at
https://github.com/firework8/BRL.
- Abstract(参考訳): スケルトンベースのアクション認識は最近大きな進歩を遂げている。
しかし、実際のシナリオでは、データの不均衡は依然として大きな課題です。
現在の行動認識アルゴリズムの性能は、トレーニングデータが重いクラス不均衡に苦しむと急激に低下する。
不均衡なデータは実際にこれらの方法で学んだ表現を劣化させ、アクション認識のボトルネックとなる。
不均衡なアクションデータからバイアスのない表現を学習する方法が、長い尾のアクション認識の鍵である。
本稿では,行動認識におけるロングテール問題に対処するための新しいバランスド表現学習手法を提案する。
まず、サンプル空間を効果的に拡張し、より貴重なサンプルを再均衡的に生成するための時空間行動探索戦略を示す。
次に,表現空間のバイアスを緩和するために,分離した行動認識学習スケジュールを設計する。
スケジュールは、末尾クラスの表現学習を訓練から切り離し、より効果的な制約を課すために行動認識損失を提案する。
さらに,相補的な構造情報を提供するためにスキップモーダル表現を提案する。
提案手法は,NTU RGB+D 60,NTU RGB+D 120,NW-UCLA,Kineeticsの4つの骨格データに対して検証を行った。
最先端技術(SOTA)法に比べて一貫した大きな改善を達成できるだけでなく、広範な実験を通じてより優れた一般化能力を示す。
私たちのコードはhttps://github.com/firework8/BRLで公開されています。
関連論文リスト
- ReL-SAR: Representation Learning for Skeleton Action Recognition with Convolutional Transformers and BYOL [6.603505460200282]
非教師なし表現学習は、ラベルのない骨格データを活用する上で最も重要なものである。
ReL-SARと呼ばれる軽量な畳み込みトランスフォーマフレームワークを設計し、骨格配列の空間的および時間的キューを共同でモデル化する。
Bootstrap Your Own Latent (BYOL) を利用して、ラベルのない骨格配列データから堅牢な表現を学習する。
論文 参考訳(メタデータ) (2024-09-09T16:03:26Z) - Enhancing Consistency and Mitigating Bias: A Data Replay Approach for
Incremental Learning [100.7407460674153]
ディープラーニングシステムは、一連のタスクから学ぶとき、破滅的な忘れがちだ。
問題を緩和するため、新しいタスクを学ぶ際に経験豊富なタスクのデータを再生する手法が提案されている。
しかし、メモリ制約やデータプライバシーの問題を考慮すると、実際には期待できない。
代替として、分類モデルからサンプルを反転させることにより、データフリーなデータ再生法を提案する。
論文 参考訳(メタデータ) (2024-01-12T12:51:12Z) - Scaling Laws Beyond Backpropagation [64.0476282000118]
因果デコーダのみの変換器を効率的に訓練するための直接フィードバックアライメントの有効性について検討した。
DFAはバックプロパゲーションよりも効率的なスケーリングを提供していないことが分かりました。
論文 参考訳(メタデータ) (2022-10-26T10:09:14Z) - Moderately-Balanced Representation Learning for Treatment Effects with
Orthogonality Information [14.040918087553177]
平均治療効果(ATE)を観測データから推定することは選択バイアスにより困難である。
本稿では,中等度にバランスの取れた表現学習フレームワークを提案する。
このフレームワークは、マルチタスク学習によるオーバーバランスから表現を保護する。
論文 参考訳(メタデータ) (2022-09-05T13:20:12Z) - Constructing Balance from Imbalance for Long-tailed Image Recognition [50.6210415377178]
多数派(頭)クラスと少数派(尾)クラスの不均衡は、データ駆動のディープニューラルネットワークを著しく歪ませる。
従来の手法では、データ分散、特徴空間、モデル設計の観点からデータ不均衡に対処していた。
ラベル空間を段階的に調整し,ヘッドクラスとテールクラスを分割することで,簡潔なパラダイムを提案する。
提案モデルでは,特徴評価手法も提供し,長期的特徴学習の道を開く。
論文 参考訳(メタデータ) (2022-08-04T10:22:24Z) - Efficient Augmentation for Imbalanced Deep Learning [8.38844520504124]
本研究では、畳み込みニューラルネットワークの内部表現である不均衡画像データについて検討する。
モデルの特徴埋め込みとテストセットの一般化ギャップを測定し、マイノリティクラスではそのギャップが広いことを示す。
この洞察により、不均衡なデータのための効率的な3相CNNトレーニングフレームワークを設計できる。
論文 参考訳(メタデータ) (2022-07-13T09:43:17Z) - Value-Consistent Representation Learning for Data-Efficient
Reinforcement Learning [105.70602423944148]
本稿では,意思決定に直接関連のある表現を学習するための,VCR(Value-Consistent Expression Learning)という新しい手法を提案する。
この想像された状態と環境によって返される実状態とを一致させる代わりに、VCRは両方の状態に$Q$-valueヘッドを適用し、2つのアクション値の分布を得る。
検索不要なRLアルゴリズムに対して,提案手法が新たな最先端性能を実現することが実証された。
論文 参考訳(メタデータ) (2022-06-25T03:02:25Z) - CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep
Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。
サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。
本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文 参考訳(メタデータ) (2022-02-11T13:49:51Z) - Exploratory State Representation Learning [63.942632088208505]
本稿では,XSRL(eXploratory State Representation Learning)と呼ばれる新しい手法を提案する。
一方、コンパクトな状態表現と、その表現から不可解な情報を除去するために使用される状態遷移推定器を共同で学習する。
一方、逆モデルを継続的に訓練し、このモデルの予測誤差に$k$-stepの学習促進ボーナスを加え、発見ポリシーの目的を形成する。
論文 参考訳(メタデータ) (2021-09-28T10:11:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。