論文の概要: Informative Sample Selection Model for Skeleton-based Action Recognition with Limited Training Samples
- arxiv url: http://arxiv.org/abs/2510.25345v1
- Date: Wed, 29 Oct 2025 10:03:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:45.390269
- Title: Informative Sample Selection Model for Skeleton-based Action Recognition with Limited Training Samples
- Title(参考訳): 限られた訓練サンプルを用いた骨格に基づく行動認識のためのインフォームティブサンプル選択モデル
- Authors: Zhigang Tu, Zhengbo Zhang, Jia Gong, Junsong Yuan, Bo Du,
- Abstract要約: 半教師付き3D行動認識としても知られる訓練サンプルを用いた3D行動認識が提案されている。
我々は、マルコフ決定過程(MDP)としてキャストすることで、新しい視点からアクティブな学習を通して、半教師付き3次元行動認識を再構築する。
状態-作用対における因子の表現能力を高めるために、ユークリッド空間から双曲空間に投影する。
- 参考スコア(独自算出の注目度): 51.59753385094941
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Skeleton-based human action recognition aims to classify human skeletal sequences, which are spatiotemporal representations of actions, into predefined categories. To reduce the reliance on costly annotations of skeletal sequences while maintaining competitive recognition accuracy, the task of 3D Action Recognition with Limited Training Samples, also known as semi-supervised 3D Action Recognition, has been proposed. In addition, active learning, which aims to proactively select the most informative unlabeled samples for annotation, has been explored in semi-supervised 3D Action Recognition for training sample selection. Specifically, researchers adopt an encoder-decoder framework to embed skeleton sequences into a latent space, where clustering information, combined with a margin-based selection strategy using a multi-head mechanism, is utilized to identify the most informative sequences in the unlabeled set for annotation. However, the most representative skeleton sequences may not necessarily be the most informative for the action recognizer, as the model may have already acquired similar knowledge from previously seen skeleton samples. To solve it, we reformulate Semi-supervised 3D action recognition via active learning from a novel perspective by casting it as a Markov Decision Process (MDP). Built upon the MDP framework and its training paradigm, we train an informative sample selection model to intelligently guide the selection of skeleton sequences for annotation. To enhance the representational capacity of the factors in the state-action pairs within our method, we project them from Euclidean space to hyperbolic space. Furthermore, we introduce a meta tuning strategy to accelerate the deployment of our method in real-world scenarios. Extensive experiments on three 3D action recognition benchmarks demonstrate the effectiveness of our method.
- Abstract(参考訳): 骨格に基づく人間の行動認識は、行動の時空間表現である人間の骨格配列を予め定義されたカテゴリに分類することを目的としている。
競争的認識精度を維持しつつ、骨格配列のコストのかかるアノテーションへの依存を軽減するため、半教師付き3D行動認識(半教師付き3D行動認識)を用いた3D行動認識の課題が提案されている。
さらに,アノテーションに関する最も情報に乏しいサンプルを積極的に選択することを目的とした能動的学習を,半教師付き3次元行動認識を用いて行った。
具体的には,マルチヘッド機構を用いたクラスタリング情報とマージンベースの選択戦略を組み合わせたエンコーダ・デコーダ・フレームワークを用いて,未ラベル集合内の最も情報性の高い配列をアノテーションとして識別する。
しかしながら、最も代表的な骨格配列は、以前に見られた骨格標本から類似した知識を既に取得していたため、アクション認識器にとって必ずしも最も有益なものではないかもしれない。
そこで我々は,これをマルコフ決定プロセス(MDP)としてキャストすることで,新たな視点からアクティブな学習を通じて,半教師付き3D行動認識を再構築する。
MDPフレームワークとそのトレーニングパラダイムに基づいて、アノテーションのためのスケルトン配列の選択をインテリジェントにガイドするために、情報的サンプル選択モデルを訓練する。
状態-作用対における因子の表現能力を高めるために、ユークリッド空間から双曲空間に投影する。
さらに,実際のシナリオにおけるメソッドの展開を高速化するメタチューニング戦略を導入する。
3つの3次元行動認識ベンチマークの大規模な実験により,本手法の有効性が示された。
関連論文リスト
- 3D Skeleton-Based Action Recognition: A Review [60.0580120274659]
3Dスケルトンに基づく行動認識は、コンピュータビジョンの分野において顕著な話題となっている。
以前のレビューでは主にモデル指向の視点を採用しており、しばしば骨格に基づく行動認識に関わる基本的なステップを無視している。
本稿では,骨格に基づく行動認識を理解するための包括的,タスク指向のフレームワークを提案することによって,これらの制約に対処することを目的とする。
論文 参考訳(メタデータ) (2025-06-01T09:04:12Z) - An Information Compensation Framework for Zero-Shot Skeleton-based Action Recognition [49.45660055499103]
ゼロショットの人間の骨格に基づく行動認識は、トレーニング中に見られるカテゴリ外の行動を認識するモデルを構築することを目的としている。
従来の研究では、シーケンスの視覚的空間分布と意味的空間分布の整合性に焦点が当てられていた。
強固で頑健な表現を得るために,新たな損失関数サンプリング手法を提案する。
論文 参考訳(メタデータ) (2024-06-02T06:53:01Z) - Vision-Language Meets the Skeleton: Progressively Distillation with Cross-Modal Knowledge for 3D Action Representation Learning [20.34477942813382]
スケルトンに基づく行動表現学習は、骨格配列を符号化することで人間の行動を理解し理解することを目的としている。
クロスモーダル・コントラッシブ・ラーニングに基づく新しいスケルトンベースのトレーニング・フレームワークを提案する。
提案手法は,従来の手法より優れ,最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-05-31T03:40:15Z) - Skeleton2vec: A Self-supervised Learning Framework with Contextualized
Target Representations for Skeleton Sequence [56.092059713922744]
予測対象として高レベルな文脈化機能を使用することで,優れた性能が得られることを示す。
具体的には、シンプルで効率的な3D行動表現学習フレームワークであるSkeleton2vecを提案する。
提案するSkeleton2vecは,従来の手法より優れ,最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-01-01T12:08:35Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - A Self-Supervised Gait Encoding Approach with Locality-Awareness for 3D
Skeleton Based Person Re-Identification [65.18004601366066]
3Dスケルトン配列内の歩行特徴による人物再識別(Re-ID)は、いくつかの利点を持つ新しい話題である。
本稿では、ラベルのない骨格データを利用して人物の歩行表現を学習できる自己教師付き歩行符号化手法を提案する。
論文 参考訳(メタデータ) (2020-09-05T16:06:04Z) - Iterate & Cluster: Iterative Semi-Supervised Action Recognition [8.134961550216618]
動作中に追跡される機能の時系列を前提に、システムはそのシーケンスをアクションに集約します。
本システムでは,わずかなアノテーションで認識性能を向上できることを示す。
論文 参考訳(メタデータ) (2020-06-12T02:19:39Z) - Skeleton Based Action Recognition using a Stacked Denoising Autoencoder
with Constraints of Privileged Information [5.67220249825603]
本稿では骨格再構築の観点から骨格表現を研究するための新しい手法を提案する。
特権情報に基づく学習の概念に基づいて,動作カテゴリと時間座標を重畳したデノナイジングオートエンコーダに統合する。
一時的ミスアライメントによる変動を軽減するため,新しい時間的登録法を提案する。
論文 参考訳(メタデータ) (2020-03-12T09:56:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。