論文の概要: Every Subtlety Counts: Fine-grained Person Independence Micro-Action Recognition via Distributionally Robust Optimization
- arxiv url: http://arxiv.org/abs/2509.21261v2
- Date: Mon, 29 Sep 2025 03:48:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 14:13:47.636068
- Title: Every Subtlety Counts: Fine-grained Person Independence Micro-Action Recognition via Distributionally Robust Optimization
- Title(参考訳): サブスチュアカウント:分布ロバスト最適化による微粒人独立マイクロアクション認識
- Authors: Feng-Qi Cui, Jinyang Huang, Anyang Tong, Ziyu Jia, Jie Zhang, Zhi Liu, Dan Guo, Jianwei Lu, Meng Wang,
- Abstract要約: マイクロアクション認識は、心理的アセスメントと人間とコンピュータの相互作用に不可欠である。
既存の手法は現実のシナリオで失敗することが多い。
本稿では、分散ロバスト最適化の原則を取り入れた個人独立ユニバーサルマイクロアクション認識フレームワークを提案する。
- 参考スコア(独自算出の注目度): 36.230001277076376
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Micro-action Recognition is vital for psychological assessment and human-computer interaction. However, existing methods often fail in real-world scenarios because inter-person variability causes the same action to manifest differently, hindering robust generalization. To address this, we propose the Person Independence Universal Micro-action Recognition Framework, which integrates Distributionally Robust Optimization principles to learn person-agnostic representations. Our framework contains two plug-and-play components operating at the feature and loss levels. At the feature level, the Temporal-Frequency Alignment Module normalizes person-specific motion characteristics with a dual-branch design: the temporal branch applies Wasserstein-regularized alignment to stabilize dynamic trajectories, while the frequency branch introduces variance-guided perturbations to enhance robustness against person-specific spectral differences. A consistency-driven fusion mechanism integrates both branches. At the loss level, the Group-Invariant Regularized Loss partitions samples into pseudo-groups to simulate unseen person-specific distributions. By up-weighting boundary cases and regularizing subgroup variance, it forces the model to generalize beyond easy or frequent samples, thus enhancing robustness to difficult variations. Experiments on the large-scale MA-52 dataset demonstrate that our framework outperforms existing methods in both accuracy and robustness, achieving stable generalization under fine-grained conditions.
- Abstract(参考訳): マイクロアクション認識は、心理的アセスメントと人間とコンピュータの相互作用に不可欠である。
しかし、既存の手法は現実のシナリオでは失敗することが多く、それは個人間の変動が同じ動作を異なる形で示し、堅牢な一般化を妨げるためである。
そこで本研究では、分散ロバスト最適化の原則を取り入れた個人独立ユニバーサルマイクロアクション認識フレームワークを提案する。
当社のフレームワークには,機能レベルと損失レベルの2つのプラグイン・アンド・プレイコンポーネントが含まれています。
時間枝は、動的軌跡を安定させるためにワッサーシュタイン正規化アライメントを適用し、周波数枝は、個人固有のスペクトル差に対する堅牢性を高めるために分散誘導摂動を導入する。
整合性駆動型核融合機構は両方の枝を統合する。
損失レベルでは、グループ不変正規化ロスはサンプルを擬似グループに分割し、見えない人固有の分布をシミュレートする。
境界ケースの高重み付けと部分群分散の正則化により、モデルは簡単なサンプルや頻繁なサンプルを超えて一般化され、難易度への堅牢性を高める。
大規模MA-52データセットの実験により,我々のフレームワークは,精度とロバスト性の両方で既存の手法より優れており,粒度の細かい条件下での安定な一般化を実現していることが示された。
関連論文リスト
- MGSC: A Multi-granularity Consistency Framework for Robust End-to-end Asr [0.0]
我々は、内部の自己整合性を強制するモデルに依存しないプラグイン・アンド・プレイモジュールであるMulti-Granularity Soft Consistencyフレームワークを紹介する。
私たちの研究は、この2つの一貫性の粒度の強力な相乗効果を初めて明らかにしました。
私たちの研究は、より堅牢で信頼性の高いAIを構築するための重要なステップとして、内部一貫性の実施を実証しています。
論文 参考訳(メタデータ) (2025-08-20T09:51:49Z) - Learning from Heterogeneity: Generalizing Dynamic Facial Expression Recognition via Distributionally Robust Optimization [23.328511708942045]
Heterogeneity-Aware Distributional Framework (HDF) は、時間周波数モデリングを強化し、ハードサンプルによる不均衡を軽減するために設計された。
時間周波数分散アテンションモジュール(DAM)は、時間的一貫性と周波数ロバスト性の両方をキャプチャする。
適応最適化モジュール 分散対応スケーリングモジュール (DSM) は、動的に分類と対照的な損失のバランスをとるために導入された。
論文 参考訳(メタデータ) (2025-07-21T16:21:47Z) - Fair Deepfake Detectors Can Generalize [51.21167546843708]
共同設立者(データ分散とモデルキャパシティ)の制御により,公正な介入による一般化が向上することを示す。
この知見を応用して, 逆正当性重み付けとサブグループワイド特徴正規化を併用し, 新たなアライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・インセンティブ・インターベンション・インベンション・インテクション(DAID)を提案する。
DAIDは、いくつかの最先端技術と比較して、公平性と一般化の両方において一貫して優れた性能を達成する
論文 参考訳(メタデータ) (2025-07-03T14:10:02Z) - Equal is Not Always Fair: A New Perspective on Hyperspectral Representation Non-Uniformity [42.8098014428052]
ハイパースペクトル画像(HSI)の表現は、広汎な非一様性によって根本的に挑戦される。
フェアネス指向のフレームワークであるFairHypを提案する。
本研究は,HSIモデリングにおける構造的必要条件として公正性を再定義し,適応性,効率,忠実性のバランスをとるための新たなパラダイムを提供する。
論文 参考訳(メタデータ) (2025-05-16T14:00:11Z) - Deep Multi-Manifold Transformation Based Multivariate Time Series Fault Detection [22.005142941322912]
本稿では, 近傍型データ拡張戦略と多次元表現学習フレームワークを組み合わせた新しい手法を提案する。
提案手法は精度とロバスト性の両方において優れた性能を示し, 一般化と実世界の展開の可能性を示す。
論文 参考訳(メタデータ) (2024-05-25T14:48:04Z) - Understanding and Constructing Latent Modality Structures in Multi-modal
Representation Learning [53.68371566336254]
優れたパフォーマンスの鍵は、完全なモダリティアライメントではなく、有意義な潜在モダリティ構造にある、と我々は主張する。
具体的には,1)モダリティ内正規化のための深い特徴分離損失,2)モダリティ間正規化のためのブラウン橋損失,3)モダリティ内正規化およびモダリティ間正規化のための幾何学的整合損失を設計する。
論文 参考訳(メタデータ) (2023-03-10T14:38:49Z) - Disentangled Federated Learning for Tackling Attributes Skew via
Invariant Aggregation and Diversity Transferring [104.19414150171472]
属性は、クライアント間の一貫した最適化方向から、現在の連邦学習(FL)フレームワークを歪めます。
本稿では,ドメイン固有属性とクロス不変属性を2つの補足枝に分離するために,非絡み付きフェデレーション学習(DFL)を提案する。
実験により、DFLはSOTA FL法と比較して高い性能、より良い解釈可能性、より高速な収束率でFLを促進することが確認された。
論文 参考訳(メタデータ) (2022-06-14T13:12:12Z) - Calibrated Feature Decomposition for Generalizable Person
Re-Identification [82.64133819313186]
Calibrated Feature Decomposition (CFD)モジュールは、人物の再識別の一般化能力の向上に焦点を当てている。
キャリブレーション・アンド・スタンダード化されたバッチ正規化(CSBN)は、キャリブレーションされた人物表現を学習するために設計されている。
論文 参考訳(メタデータ) (2021-11-27T17:12:43Z) - Distributional Robustness and Regularization in Reinforcement Learning [62.23012916708608]
経験値関数の新しい正規化器を導入し、ワッサーシュタイン分布のロバストな値関数を下限とすることを示す。
強化学習における$textitexternalな不確実性に対処するための実用的なツールとして正規化を使用することを提案する。
論文 参考訳(メタデータ) (2020-03-05T19:56:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。