論文の概要: Learning with Category-Equivariant Representations for Human Activity Recognition
- arxiv url: http://arxiv.org/abs/2511.00900v1
- Date: Sun, 02 Nov 2025 11:37:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.984854
- Title: Learning with Category-Equivariant Representations for Human Activity Recognition
- Title(参考訳): 人間活動認識のためのカテゴリー同変表現を用いた学習
- Authors: Yoshihiro Maruyama,
- Abstract要約: 本稿では,信号の時間,スケール,センサの階層的変化を捉えた分類的対称性認識学習フレームワークを提案する。
我々はこれらの要素を特徴表現の構造に組み込み、センサー間の関係を自動的に保存するモデルを生成する。
UCI Human Activity Recognitionベンチマークでは、このカテゴリーの対称性駆動設計により、約46ポイントの精度で分布外精度が向上する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human activity recognition is challenging because sensor signals shift with context, motion, and environment; effective models must therefore remain stable as the world around them changes. We introduce a categorical symmetry-aware learning framework that captures how signals vary over time, scale, and sensor hierarchy. We build these factors into the structure of feature representations, yielding models that automatically preserve the relationships between sensors and remain stable under realistic distortions such as time shifts, amplitude drift, and device orientation changes. On the UCI Human Activity Recognition benchmark, this categorical symmetry-driven design improves out-of-distribution accuracy by approx. 46 percentage points (approx. 3.6x over the baseline), demonstrating that abstract symmetry principles can translate into concrete performance gains in everyday sensing tasks via category-equivariant representation theory.
- Abstract(参考訳): 人間の活動認識は、センサー信号がコンテキスト、動き、環境とともに変化するため、困難である。
本稿では,信号の時間,スケール,センサの階層的変化を捉えた分類的対称性認識学習フレームワークを提案する。
我々はこれらの因子を特徴表現の構造に組み込み、センサ間の関係を自動的に保存し、時間シフトや振幅ドリフト、デバイス向きの変化といった現実的な歪みの下で安定なモデルを生成する。
UCI Human Activity Recognitionベンチマークでは、このカテゴリ対称性駆動設計により、近似による分布外精度が向上する。
46パーセンテージポイント(ベースラインの約3.6倍)は、抽象対称性の原理が、カテゴリー同変表現理論によって、日常的な知覚タスクにおける具体的なパフォーマンス向上に変換可能であることを証明している。
関連論文リスト
- Learning with Category-Equivariant Architectures for Human Activity Recognition [0.0]
慣性センサを用いたHAR(Human Activity Recognition)のためのカテゴリー等価ニューラルネットワークであるCatEquivを提案する。
本稿では, 周期的時間シフト, 正のゲインスケーリング, センサ・ヒエラルキー・ポーズを共同で表現する対称性のカテゴリーを導入し, データのカテゴリー対称性構造を捉える。
論文 参考訳(メタデータ) (2025-11-03T01:20:35Z) - CARE: Contrastive Alignment for ADL Recognition from Event-Triggered Sensor Streams [4.3359440506714]
イベントトリガーセンサストリーム(CARE)からのADL認識のためのコントラストアライメントを提案する。
CAREは、Sequence-Image Contrastive Alignment (SICA)による表現学習と、クロスエントロピーによる分類を共同で最適化するエンドツーエンドフレームワークである。
CAREは最先端のパフォーマンスを達成した(ミラノ89.8%、カイロ88.9%、京都7.3%)。
論文 参考訳(メタデータ) (2025-10-19T20:11:12Z) - Dynamic Inertial Poser (DynaIP): Part-Based Motion Dynamics Learning for
Enhanced Human Pose Estimation with Sparse Inertial Sensors [17.3834029178939]
本稿では,スパース慣性センサを用いた人間のポーズ推定手法を提案する。
さまざまなスケルトンフォーマットからの多様な実慣性モーションキャプチャデータを活用して、動作の多様性とモデル一般化を改善する。
このアプローチは、5つのパブリックデータセットにわたる最先端モデルよりも優れたパフォーマンスを示し、特にDIP-IMUデータセットのポーズエラーを19%削減する。
論文 参考訳(メタデータ) (2023-12-02T13:17:10Z) - Multi-body SE(3) Equivariance for Unsupervised Rigid Segmentation and
Motion Estimation [49.56131393810713]
本稿では、SE(3)同変アーキテクチャと、この課題に教師なしで取り組むためのトレーニング戦略を提案する。
本手法は,0.25Mパラメータと0.92G FLOPを用いて,モデル性能と計算効率を両立させる。
論文 参考訳(メタデータ) (2023-06-08T22:55:32Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z) - Attention-based Adversarial Appearance Learning of Augmented Pedestrians [49.25430012369125]
本稿では,歩行者認識タスクのための現実的なデータを合成する手法を提案する。
本手法は, 対向的損失によって駆動される注意機構を用いて, ドメインの相違を学習する。
提案手法はこのような不一致に対して頑健であり,視覚的リアリズムと意味的整合性の両方を明らかにする。
論文 参考訳(メタデータ) (2021-07-06T15:27:00Z) - Domain Adaptive Robotic Gesture Recognition with Unsupervised
Kinematic-Visual Data Alignment [60.31418655784291]
本稿では,マルチモダリティ知識,すなわちキネマティックデータとビジュアルデータを同時にシミュレータから実ロボットに伝達できる,教師なしドメイン適応フレームワークを提案する。
ビデオの時間的手がかりと、ジェスチャー認識に対するマルチモーダル固有の相関を用いて、トランスファー可能な機能を強化したドメインギャップを修復する。
その結果, 本手法は, ACCでは最大12.91%, F1scoreでは20.16%と, 実際のロボットではアノテーションを使わずに性能を回復する。
論文 参考訳(メタデータ) (2021-03-06T09:10:03Z) - Semantic Change Detection with Asymmetric Siamese Networks [71.28665116793138]
2つの空中画像が与えられた場合、セマンティックチェンジ検出は、土地被覆のバリエーションを特定し、それらの変化タイプをピクセルワイド境界で識別することを目的としている。
この問題は、正確な都市計画や天然資源管理など、多くの地球ビジョンに関連するタスクにおいて不可欠である。
本研究では, 広く異なる構造を持つモジュールから得られた特徴対を用いて意味変化を同定し, 同定するための非対称システマネットワーク(ASN)を提案する。
論文 参考訳(メタデータ) (2020-10-12T13:26:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。