論文の概要: Spatial-Temporal Decoupled Adapter for Micro-gesture Online Recognition
- arxiv url: http://arxiv.org/abs/2606.07355v1
- Date: Fri, 05 Jun 2026 15:03:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.801693
- Title: Spatial-Temporal Decoupled Adapter for Micro-gesture Online Recognition
- Title(参考訳): マイクロタグオンライン認識のための時空間デカップリング適応器
- Authors: Xucheng Shen, Kun Li, Fei Wang, Wei Qian, Jin Jiang, Dan Guo,
- Abstract要約: 本稿では,映像適応を時間的・空間的に独立に分割する空間的分離適応器を提案する。
本手法は,第4回EI-Mi-JCAIチャレンジのトラック2にランクインしたF1スコア0.43808を達成する。
- 参考スコア(独自算出の注目度): 23.516828286378836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Micro-gesture online recognition aims to temporally localize and classify subtle gestures in untrimmed videos. Owing to their extremely short duration, low motion amplitude, and ambiguous visual cues, capturing discriminative spatiotemporal representations remains highly challenging. Existing parameter-efficient adapters typically employ a single branch to model spatial and temporal cues jointly, which may fail to capture the fine-grained patterns of micro-gestures. To address this limitation, we propose a Spatial-Temporal Decoupled Adapter that decomposes video adaptation into independent temporal and spatial branches via lightweight depthwise convolutions. In addition, to address the long-tail distribution problem in the benchmark dataset, we introduce Adaptive Soft Balanced Augmentation, which dynamically allocates augmentation intensity based on class rarity and learning difficulty, without manual thresholds. Our method achieves an F1 score of 0.43808, ranking 1st in Track 2 of the 4th EI-MiGA-IJCAI Challenge.
- Abstract(参考訳): Micro-gesture Online Recognitionは、ビデオの微妙なジェスチャーを時間的にローカライズし、分類することを目的としている。
極端に短い時間、低運動振幅、曖昧な視覚的手がかりにより、差別的な時空間表現を捉えることは極めて困難である。
既存のパラメータ効率のアダプタは、通常、単一分岐を用いて空間的および時間的キューを一緒にモデル化する。
この制限に対処するために,映像を時間的・空間的に独立に分割する空間的分離適応器を提案する。
さらに,ベンチマークデータセットの長期分布問題に対処するため,手動の閾値を伴わずに,クラス希薄度と学習困難度に基づいて,動的に拡張強度を割り当てるAdaptive Soft Balanced Augmentationを導入する。
本手法は,第4回EI-MiGA-IJCAIチャレンジのトラック2で1位となる0.43808のF1スコアを達成する。
関連論文リスト
- Local Spatiotemporal Convolutional Network for Robust Gait Recognition [7.0676119183443395]
歩行認識は、個人を独自の歩行パターンで識別する有望な生体計測技術である。
既存のアプローチは、個々のシルエットフレームから抽出された静的な外観特徴、複雑なシーケンシャルモデルのいずれかに依存している。
本稿では,従来の2次元畳み込みネットワークに時間的情報を抽出する能力を持たせた,構造的にシンプルで高効率なデュアルブランチアーキテクチャLSTCNを提案する。
論文 参考訳(メタデータ) (2026-05-14T08:28:49Z) - EchoTorrent: Towards Swift, Sustained, and Streaming Multi-Modal Video Generation [8.795438456031512]
マルチモーダル生成モデルは、高い視覚的品質を達成するが、その禁止されたレイテンシと時間的安定性は、リアルタイムなデプロイメントを妨げている。
ストリーミング推論はこれらの問題を悪化させ、ぼやけ、時間的ドリフト、唇のデクロナイゼーションといったマルチモーダルな曖昧さが顕著になる。
複数教師による異なる嗜好領域の事前学習モデルを微調整し、適応MDD(ACCDMD)は、スケジュールを介して段階的に音のCFG劣化誤差を校正する、Long Hybrid Tailは、長い水平自転期間に尾フレームのみにアライメントを強制する。
論文 参考訳(メタデータ) (2026-02-14T08:32:38Z) - Lightweight Test-Time Adaptation for EMG-Based Gesture Recognition [2.414036142474149]
本稿では,TCNバックボーンを用いたテスト時間適応(TTA)のための軽量フレームワークを提案する。
本稿では, リアルタイム統計アライメントのための因果適応バッチ正規化, (ii) ガウス混合モデル(GMM)アライメント, (iii) 迅速な数ショットキャリブレーションのためのメタラーニングの3つの展開対応戦略を紹介する。
評価の結果,経験再生更新は限られたデータの下では優れた安定性を示し,メタラーニングは1ショットと2ショットのレギュレーションにおいて競争性能を達成していることがわかった。
論文 参考訳(メタデータ) (2026-01-07T18:48:31Z) - What You Have is What You Track: Adaptive and Robust Multimodal Tracking [72.92244578461869]
本研究では,時間的に不完全なマルチモーダルデータを用いたトラッカー性能に関する総合的研究を行った。
我々のモデルは9つのベンチマークでSOTA性能を達成し、従来の完全性と欠落したモダリティ設定の両方で優れている。
論文 参考訳(メタデータ) (2025-07-08T11:40:21Z) - SampleAttention: Near-Lossless Acceleration of Long Context LLM Inference with Adaptive Structured Sparse Attention [53.4441894198495]
大きな言語モデル(LLM)は、非常に長いコンテキストウィンドウをサポートするようになった。
バニラの注意の二次的な複雑さは、TTFT(Time-to-First-Token)レイテンシを著しく長くする。
適応型構造とほぼロスレスなスパースアテンションであるSampleAttentionを提案する。
論文 参考訳(メタデータ) (2024-06-17T11:05:15Z) - D$^2$ST-Adapter: Disentangled-and-Deformable Spatio-Temporal Adapter for Few-shot Action Recognition [64.153799533257]
D$2$ST-Adapterは、空間的特徴と時間的特徴の非絡み合いの符号化を可能にする内部のデュアルパスアーキテクチャで構成されている。
本手法は,時間的ダイナミクスが行動認識に不可欠である難易度シナリオに特に適している。
論文 参考訳(メタデータ) (2023-12-03T15:40:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。