Fugu-MT 論文翻訳(概要): Idempotent Unsupervised Representation Learning for Skeleton-Based Action Recognition

論文の概要: Idempotent Unsupervised Representation Learning for Skeleton-Based Action Recognition

arxiv url: http://arxiv.org/abs/2410.20349v1
Date: Sun, 27 Oct 2024 06:29:04 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:40.937959
Title: Idempotent Unsupervised Representation Learning for Skeleton-Based Action Recognition
Title（参考訳）: 骨格に基づく行動認識のための等化的教師なし表現学習
Authors: Lilang Lin, Lehong Wu, Jiahang Zhang, Jiaying Liu,
Abstract要約: 教師なし表現学習のための新しい骨格ベース等等化生成モデル(IGM)を提案する。ベンチマークデータセットであるNTU RGB+DとPKUMMDに関する実験により,提案手法の有効性を実証した。
参考スコア（独自算出の注目度）: 13.593511876719367
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Generative models, as a powerful technique for generation, also gradually become a critical tool for recognition tasks. However, in skeleton-based action recognition, the features obtained from existing pre-trained generative methods contain redundant information unrelated to recognition, which contradicts the nature of the skeleton's spatially sparse and temporally consistent properties, leading to undesirable performance. To address this challenge, we make efforts to bridge the gap in theory and methodology and propose a novel skeleton-based idempotent generative model (IGM) for unsupervised representation learning. More specifically, we first theoretically demonstrate the equivalence between generative models and maximum entropy coding, which demonstrates a potential route that makes the features of generative models more compact by introducing contrastive learning. To this end, we introduce the idempotency constraint to form a stronger consistency regularization in the feature space, to push the features only to maintain the critical information of motion semantics for the recognition task. Our extensive experiments on benchmark datasets, NTU RGB+D and PKUMMD, demonstrate the effectiveness of our proposed method. On the NTU 60 xsub dataset, we observe a performance improvement from 84.6$\%$ to 86.2$\%$. Furthermore, in zero-shot adaptation scenarios, our model demonstrates significant efficacy by achieving promising results in cases that were previously unrecognizable. Our project is available at \url{https://github.com/LanglandsLin/IGM}.
Abstract（参考訳）: 生成モデルは、生成のための強力な技術として、徐々に認識タスクにとって重要なツールになりつつある。しかし、骨格に基づく行動認識では、既存の事前訓練された生成法から得られる特徴は、認識に無関係な冗長な情報を含んでおり、これは骨格の空間的に疎かで時間的に一貫した性質の性質と矛盾し、望ましくない性能をもたらす。この課題に対処するため、我々は理論と方法論のギャップを埋めることに取り組み、教師なし表現学習のための新しい骨格に基づく等等化生成モデル(IGM)を提案する。より具体的には、生成モデルと最大エントロピー符号化の等価性を理論的に証明し、対照的な学習を導入することで生成モデルの特徴をよりコンパクトにするための潜在的経路を示す。この目的のために,特徴空間におけるより強い整合性正規化を形成するためのイデオロシティ制約を導入し,その特徴を認識タスクにおける動作セマンティクスの重要な情報を維持するためだけにプッシュする。ベンチマークデータセットであるNTU RGB+DとPKUMMDに関する広範な実験により,提案手法の有効性が示された。 NTU 60 xsub データセットでは 84.6$\%$ から 86.2$\%$ に改善された。さらに, ゼロショット適応シナリオでは, 従来認識できなかった場合において, 有望な結果を得ることにより, 有効性を示す。我々のプロジェクトは \url{https://github.com/LanglandsLin/IGM} で利用可能です。

関連論文リスト

Dynamic Programming Techniques for Enhancing Cognitive Representation in Knowledge Tracing [125.75923987618977]
認知表現動的プログラミングに基づく知識追跡(CRDP-KT)モデルを提案する。質問の難易度とそれらの間の性能間隔に基づいて認知表現を最適化する動的プログラミングアルゴリズムである。これは、その後のモデルトレーニングのためにより正確で体系的な入力機能を提供し、それによって認知状態のシミュレーションにおける歪みを最小限にする。
論文参考訳（メタデータ） (2025-06-03T14:44:48Z)
Instance-Prototype Affinity Learning for Non-Exemplar Continual Graph Learning [7.821213342456415]
グラフニューラルネットワークは破滅的な忘れを耐え、以前獲得した知識を保持する能力を損なう。非現代連続グラフ学習(NECGL)のための新しいパラダイムであるインスタンス型親和性学習(IPAL)を提案する。我々は,PCL内に決定境界知覚機構を組み込み,クラス間識別性を向上する。
論文参考訳（メタデータ） (2025-05-15T07:35:27Z)
Exploring Training and Inference Scaling Laws in Generative Retrieval [50.82554729023865]
モデルサイズ,トレーニングデータスケール,推論時間計算が生成的検索性能にどのように影響するかを検討する。実験の結果,n-gram-based method はトレーニング法と推論法の両方と強く一致していることがわかった。 LLaMAモデルはT5モデルより一貫して優れており、生成検索におけるデコーダのみの大きなモデルに対して特に有利であることが示唆された。
論文参考訳（メタデータ） (2025-03-24T17:59:03Z)
A Novel Framework for Learning Stochastic Representations for Sequence Generation and Recognition [0.0]
シーケンシャルなデータの生成と認識は、動的環境で動作する自律システムの基本である。パラメトリックバイアスを用いた新しいリカレントネットワーク(RNNPB)を提案する。我々のアプローチは、時間パターンをモデル化するためのフレームワークを提供し、人工知能とロボティクスにおける堅牢なシステムの開発を前進させる。
論文参考訳（メタデータ） (2024-12-30T07:27:50Z)
USDRL: Unified Skeleton-Based Dense Representation Learning with Multi-Grained Feature Decorrelation [24.90512145836643]
本稿では,特徴デコレーションに基づく統一骨格に基づくDense Representation Learningフレームワークを提案する。我々のアプローチは現在のSOTA(State-of-the-art)アプローチよりも大幅に優れています。
論文参考訳（メタデータ） (2024-12-12T12:20:27Z)
Effort: Efficient Orthogonal Modeling for Generalizable AI-Generated Image Detection [66.16595174895802]
既存のAI生成画像(AIGI)検出手法は、しばしば限定的な一般化性能に悩まされる。本稿では、AIGI検出において、これまで見過ごされてきた重要な非対称性現象を同定する。
論文参考訳（メタデータ） (2024-11-23T19:10:32Z)
Enhancing Retrieval-Augmented LMs with a Two-stage Consistency Learning Compressor [4.35807211471107]
本研究では,検索強化言語モデルにおける検索情報圧縮のための2段階一貫性学習手法を提案する。提案手法は複数のデータセットにまたがって実験的に検証され,質問応答タスクの精度と効率が顕著に向上したことを示す。
論文参考訳（メタデータ） (2024-06-04T12:43:23Z)
Unsupervised Spatial-Temporal Feature Enrichment and Fidelity Preservation Network for Skeleton based Action Recognition [20.07820929037547]
非教師なし骨格に基づく行動認識は近年顕著な進歩を遂げている。既存の教師なし学習手法は、過度なオーバーフィッティング問題に悩まされる。本稿では,高機能化を実現するために,非教師付き時空間特徴強調・忠実度保存フレームワークを提案する。
論文参考訳（メタデータ） (2024-01-25T09:24:07Z)
A Bayesian Unification of Self-Supervised Clustering and Energy-Based Models [11.007541337967027]
我々は、最先端の自己教師型学習目標のベイズ分析を行う。目的関数が既存の自己教師型学習戦略より優れていることを示す。また、GEDIをニューロシンボリックな枠組みに統合できることを実証した。
論文参考訳（メタデータ） (2023-12-30T04:46:16Z)
ReCoRe: Regularized Contrastive Representation Learning of World Model [21.29132219042405]
対照的な教師なし学習と介入不変正規化器を用いて不変特徴を学習する世界モデルを提案する。提案手法は,現状のモデルベースおよびモデルフリーのRL法より優れ,iGibsonベンチマークで評価された分布外ナビゲーションタスクを大幅に改善する。
論文参考訳（メタデータ） (2023-12-14T15:53:07Z)
Generative Model-based Feature Knowledge Distillation for Action Recognition [11.31068233536815]
本稿では,軽量学生モデルの学習のための生成モデルを用いた,革新的な知識蒸留フレームワークについて紹介する。提案手法の有効性は,多種多様な人気データセットに対する総合的な実験によって実証される。
論文参考訳（メタデータ） (2023-12-14T03:55:29Z)
Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文参考訳（メタデータ） (2022-12-17T00:26:31Z)
Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文参考訳（メタデータ） (2022-07-17T07:05:39Z)
Toward Certified Robustness Against Real-World Distribution Shifts [65.66374339500025]
我々は、データから摂動を学ぶために生成モデルを訓練し、学習したモデルの出力に関して仕様を定義する。この設定から生じるユニークな挑戦は、既存の検証者がシグモイドの活性化を厳密に近似できないことである。本稿では,古典的な反例誘導的抽象的洗練の概念を活用するシグモイドアクティベーションを扱うための一般的なメタアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-06-08T04:09:13Z)
DEALIO: Data-Efficient Adversarial Learning for Imitation from Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。よりデータ効率の高いifOアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-03-31T23:46:32Z)
Task-Feature Collaborative Learning with Application to Personalized Attribute Prediction [166.87111665908333]
本稿では,TFCL(Task-Feature Collaborative Learning)と呼ばれる新しいマルチタスク学習手法を提案する。具体的には、まず、特徴とタスクの協調的なグループ化を活用するために、不均一なブロック対角構造正規化器を用いたベースモデルを提案する。実際の拡張として,重なり合う機能と難易度を区別することで,基本モデルを拡張します。
論文参考訳（メタデータ） (2020-04-29T02:32:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。