論文の概要: DoGCLR: Dominance-Game Contrastive Learning Network for Skeleton-Based Action Recognition
- arxiv url: http://arxiv.org/abs/2511.14179v2
- Date: Wed, 19 Nov 2025 07:47:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 13:41:21.127542
- Title: DoGCLR: Dominance-Game Contrastive Learning Network for Skeleton-Based Action Recognition
- Title(参考訳): DoGCLR: 骨格に基づく行動認識のための支配ゲームコントラスト学習ネットワーク
- Authors: Yanshan Li, Ke Ma, Miaomiao Wei, Linhui Dai,
- Abstract要約: 既存の骨格に基づく行動認識のための自己教師付きコントラスト学習法は、しばしば全ての骨格領域を均一に処理する。
本稿では,骨格型行動認識(DoGCLR)のためのドミナンスゲームコントラスト学習ネットワークを提案する。
DoGCLRは、正と負のサンプルの構成を動的ドミナンスゲームとしてモデル化し、両方のサンプルタイプが相互作用し、セマンティックな保存と識別力のバランスをとる平衡に達する。
- 参考スコア(独自算出の注目度): 8.909010524191368
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing self-supervised contrastive learning methods for skeleton-based action recognition often process all skeleton regions uniformly, and adopt a first-in-first-out (FIFO) queue to store negative samples, which leads to motion information loss and non-optimal negative sample selection. To address these challenges, this paper proposes Dominance-Game Contrastive Learning network for skeleton-based action Recognition (DoGCLR), a self-supervised framework based on game theory. DoGCLR models the construction of positive and negative samples as a dynamic Dominance Game, where both sample types interact to reach an equilibrium that balances semantic preservation and discriminative strength. Specifically, a spatio-temporal dual weight localization mechanism identifies key motion regions and guides region-wise augmentations to enhance motion diversity while maintaining semantics. In parallel, an entropy-driven dominance strategy manages the memory bank by retaining high entropy (hard) negatives and replacing low-entropy (weak) ones, ensuring consistent exposure to informative contrastive signals. Extensive experiments are conducted on NTU RGB+D and PKU-MMD datasets. On NTU RGB+D 60 X-Sub/X-View, DoGCLR achieves 81.1%/89.4% accuracy, and on NTU RGB+D 120 X-Sub/X-Set, DoGCLR achieves 71.2%/75.5% accuracy, surpassing state-of-the-art methods by 0.1%, 2.7%, 1.1%, and 2.3%, respectively. On PKU-MMD Part I/Part II, DoGCLR performs comparably to the state-of-the-art methods and achieves a 1.9% higher accuracy on Part II, highlighting its strong robustness on more challenging scenarios.
- Abstract(参考訳): 既存の骨格に基づく行動認識のための自己教師付きコントラスト学習法は、全ての骨格領域を均一に処理し、ファースト・イン・ファースト・アウト(FIFO)キューを採用して負のサンプルを保存し、運動情報損失と非最適の負のサンプル選択につながる。
これらの課題に対処するために,ゲーム理論に基づく自己教師型フレームワークである骨格型行動認識(DoGCLR)のためのDominance-Game Contrastive Learningネットワークを提案する。
DoGCLRは、正と負のサンプルの構成を動的ドミナンスゲームとしてモデル化し、両方のサンプルタイプが相互作用し、セマンティックな保存と識別力のバランスをとる平衡に達する。
具体的には、時空間二重重み付け機構は、キーモーション領域を特定し、セマンティクスを維持しながら、動きの多様性を高めるために、領域的に拡張する。
並行して、エントロピー駆動の支配戦略は、高いエントロピー(ハード)の負を保ち、低エントロピー(弱)の負を置き換え、情報的コントラスト信号への一貫した露出を確保することでメモリバンクを管理する。
NTU RGB+D と PKU-MMD のデータセットに対して大規模な実験を行った。
NTU RGB+D 60 X-Sub/X-Viewでは、DoGCLRは81.1%/89.4%、NTU RGB+D 120 X-Sub/X-Setでは71.2%/75.5%、最先端のメソッドは0.1%、2.7%、1.1%、2.3%となっている。
PKU-MMD Part I/Part IIでは、DoGCLRは最先端の手法と互換性があり、パートIIでは1.9%高い精度を実現している。
関連論文リスト
- Simulating Sinogram-Domain Motion and Correcting Image-Domain Artifacts Using Deep Learning in HR-pQCT Bone Imaging [0.0]
HR-pQCT画像における動きアーティファクトをシミュレートするために,従来のシノグラムに基づく手法を最適化する。
本研究では,実世界(ターゲット)データセットと実世界(ターゲット)データセットの両方の動作成果物を扱うために,エッジ強化型自己注意型ワッサースタイン生成適応ネットワーク(ESWGAN-GP)を提案する。
論文 参考訳(メタデータ) (2025-09-13T19:43:05Z) - AHDMIL: Asymmetric Hierarchical Distillation Multi-Instance Learning for Fast and Accurate Whole-Slide Image Classification [51.525891360380285]
AHDMILは非対称な階層的蒸留マルチインスタンス学習フレームワークである。
2段階のトレーニングプロセスを通じて、無関係なパッチを排除します。
分類性能と推論速度の両方において、従来の最先端手法を一貫して上回っている。
論文 参考訳(メタデータ) (2025-08-07T07:47:16Z) - Variational Supervised Contrastive Learning [50.79938854370321]
本稿では,教師付きコントラスト学習を潜在クラス変数に対する変分推論として再構成した変分教師付きコントラスト学習(VarCon)を提案する。
VarConは対照的な学習フレームワークの最先端のパフォーマンスを達成し、ImageNet-1Kでは79.36%、CIFAR-100では78.29%、ResNet-50エンコーダでは78.29%に達した。
論文 参考訳(メタデータ) (2025-06-09T04:19:12Z) - Patch-Level Contrasting without Patch Correspondence for Accurate and
Dense Contrastive Representation Learning [79.43940012723539]
ADCLRは、正確で高密度な視覚表現を学習するための自己教師型学習フレームワークである。
提案手法は, コントラッシブな手法のための新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-23T07:38:09Z) - Stochastic Re-weighted Gradient Descent via Distributionally Robust Optimization [14.23697277904244]
Reweighted Gradient Descent (RGD) は、動的サンプル再重み付けによりディープニューラルネットワークの性能を向上させる新しい最適化手法である。
本稿では,教師付き学習,メタラーニング,ドメイン外一般化など,様々な学習課題におけるRGDの有効性を示す。
論文 参考訳(メタデータ) (2023-06-15T15:58:04Z) - GaitMM: Multi-Granularity Motion Sequence Learning for Gait Recognition [6.877671230651998]
歩行認識は、各身体部位の異なる周期的な動きを観察することにより、個人固有の歩行パターンを識別することを目的としている。
既存のほとんどの手法は各部分を等しく扱い、異なるステップ周波数と歩行のサンプリングレートによって引き起こされるデータの冗長性を考慮できない。
本研究では,歩行系列学習のためのマルチグラニュラリティ動作表現(GaitMM)を提案する。
論文 参考訳(メタデータ) (2022-09-18T04:07:33Z) - Source-free unsupervised domain adaptation for cross-modality abdominal
multi-organ segmentation [10.151144203061778]
腹部多臓器セグメンテーションのための未ラベルMRデータセットに,ソースラベル付きCTデータセットから学習知識を転送することが望ましい。
そこで本研究では, ソースデータセットにアクセスすることなく, 効率的なソースレス非教師なし領域適応手法を提案する。
論文 参考訳(メタデータ) (2021-11-24T01:42:07Z) - To be Critical: Self-Calibrated Weakly Supervised Learning for Salient
Object Detection [95.21700830273221]
弱教師付き有色物体検出(WSOD)は,画像レベルのアノテーションを用いた有色度モデルの開発を目的としている。
擬似ラベルとネットワーク予測の相互校正ループを明確に設定し,自己校正学習戦略を提案する。
十分に整合したアノテーションを持つはるかに小さなデータセットであっても、モデルがより優れたパフォーマンスと一般化性を達成するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-04T02:45:22Z) - Semi-supervised Contrastive Learning with Similarity Co-calibration [72.38187308270135]
SsCL(Semi-supervised Contrastive Learning)と呼ばれる新しいトレーニング戦略を提案する。
ssclは、自己教師付き学習におけるよく知られたコントラスト損失と、半教師付き学習におけるクロスエントロピー損失を組み合わせる。
SsCLはより差別的な表現を生じさせ,ショット学習に有益であることを示す。
論文 参考訳(メタデータ) (2021-05-16T09:13:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。