論文の概要: C-MambaPose: A Physics-Informed Complex Mamba Framework for Cross-Environment WiFi Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2606.13700v1
- Date: Fri, 05 Jun 2026 16:00:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.498942
- Title: C-MambaPose: A Physics-Informed Complex Mamba Framework for Cross-Environment WiFi Human Pose Estimation
- Title(参考訳): C-MambaPose: クロス環境WiFiヒューマンポース推定のための物理インフォーム複合マンバフレームワーク
- Authors: Phuc Nguyen H,
- Abstract要約: C-MambaPose(C-MambaPose)は、Wi-Fiを用いた3次元ポーズ推定のための物理インフォームド複合値Mamba-GraFormerハイブリッドフレームワークである。
本フレームワークは、まず、生のWiFiチャネル状態情報(CSI)位相誤差を浄化し、位相保存複素値表現を構築する。
クロスアテンション共同クエリ・マッパーは、非構造的シーケンストークンをヒトの関節にマッピングし、グラフ畳み込みネットワーク(GCN)によってデコードされ、解剖学的にコヒーレントな3D座標を予測する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human pose estimation (HPE) utilizing wireless WiFi signals has emerged as a promising technology owing to its device-free nature, privacy preservation, and robustness against occlusion and poor lighting. However, existing methods often overlook the physical complex phase information of WiFi signals and fail to generalize across diverse environments due to severe domain shifts. In this paper, we present C-MambaPose, a physics-informed complex-valued Mamba-GraFormer hybrid framework for robust cross-environment WiFi-based 3D HPE. Our framework first sanitizes raw WiFi Channel State Information (CSI) phase errors and constructs a phase-preserving complex-valued representation. We then employ a Spatiotemporal Complex Mamba encoder with a dynamic selective receptive field to capture fine-grained phase dynamics. A cross-attention joint-query mapper maps the unstructured sequence tokens to human joints, which are decoded by a Graph Convolutional Network (GCN) to predict anatomically coherent 3D coordinates. Extensive evaluations on the MM-Fi dataset show that C-MambaPose achieves competitive or superior performance to state-of-the-art baselines across all settings, setting a new state-of-the-art specifically on the challenging cross-environment split, requiring only 3.78 M parameters-an 83.1\% reduction compared to GraphPose-Fi~\cite{chen2026graph} and an 85.7\% reduction compared to MetaFi++~\cite{zhou2023metafi++}, while maintaining a comparable size to DT-Pose~\cite{chen2025towards} (which is only 18\% smaller) but achieving significantly superior performance without requiring any pretraining. Our code is publicly available at https://github.com/phucngvinuni/cmampose.git.
- Abstract(参考訳): 無線Wi-Fi信号を利用したヒューマンポーズ推定(HPE)は、デバイスフリーな性質、プライバシー保護、閉塞や照明の低さに対する堅牢性のために、有望な技術として登場した。
しかし、既存の手法はしばしばWiFi信号の物理的複雑な位相情報を見落とし、厳しいドメインシフトのために様々な環境にまたがる一般化に失敗する。
本稿では,Wi-Fiを用いた3次元HPEのための物理インフォームド複合値Mamba-GraFormerハイブリッドフレームワークであるC-MambaPoseについて述べる。
本フレームワークは、まず、生のWiFiチャネル状態情報(CSI)位相誤差を浄化し、位相保存複素値表現を構築する。
次に、動的選択受容場を持つ時空間複素マンバエンコーダを用いて、微細な位相ダイナミクスを捉える。
クロスアテンション共同クエリ・マッパーは、非構造的シーケンストークンをヒトの関節にマッピングし、グラフ畳み込みネットワーク(GCN)によってデコードされ、解剖学的にコヒーレントな3D座標を予測する。
MM-Fiデータセットの広範囲な評価によると、C-MambaPoseはあらゆる設定で最先端のベースラインに対して競争力または優れたパフォーマンスを達成し、挑戦的なクロス環境分割に特化して新しい最先端を設定でき、GraphPose-Fi~\cite{chen2026graph}と比較してわずか3.78Mのパラメータと83.1\%の削減とMetaFi++~\cite{zhou2023metafi++}に比べて85.7\%の削減が必要であり、DT-Pose~\cite{chen2025towards}(わずか18\%)に匹敵するサイズを維持しながら、事前トレーニングを必要とせず、優れたパフォーマンスを実現している。
私たちのコードはhttps://github.com/phucngvinuni/cmampose.git.comで公開されています。
関連論文リスト
- VIMCAN: Visual-Inertial 3D Human Pose Estimation with Hybrid Mamba-Cross-Attention Network [15.727067180984237]
VIMCANは、Mambaの効率的なシーケンスモデリングと、Cross-Attentionの空間的推論を組み合わせたハイブリッドアーキテクチャである。
VIMCANは、TotalCaptureでは17.2mm、3DPWでは45.3mmの平均結合位置誤差(MPJPE)よりも精度が高い。
論文 参考訳(メタデータ) (2026-05-08T10:28:05Z) - LuMamba: Latent Unified Mamba for Electrode Topology-Invariant and Efficient EEG Modeling [14.663411219312827]
textbfLuMamba(textbfLatent textbfUnified textbfMamba)を提案する。
わずか4.6Mのパラメータで、ルマンバはTUABで80.99%の精度を達成し、アルツハイマーの検出で最先端の性能を達成する。
論文 参考訳(メタデータ) (2026-03-19T16:26:11Z) - Breaking Coordinate Overfitting: Geometry-Aware WiFi Sensing for Cross-Layout 3D Pose Estimation [26.629874388669176]
本稿では、WiFiベースのクロスドメインポーズ推定のための最初の幾何条件付きフレームワークPerceptAlignを紹介する。
PerceptAlignは、最先端のベースラインと比較して、ドメイン内エラーを12.3%削減し、ドメイン間エラーを60%以上削減する。
これらの結果は、スケーラブルで実用的なWiFiセンシングへの有効な経路として、幾何学条件学習を確立している。
論文 参考訳(メタデータ) (2026-01-18T04:13:09Z) - UniSH: Unifying Scene and Human Reconstruction in a Feed-Forward Pass [83.7071371474926]
UniSHは、統合されたフィードフォワードフレームワークで、共同でメートルスケールの3Dシーンと人間の再構築を行う。
我々のフレームワークは、シーン再構築とHMRとの違いを強く橋渡しします。
本モデルは,人間中心のシーン再構築における最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-01-03T16:06:27Z) - Graph-based 3D Human Pose Estimation using WiFi Signals [7.772045520373017]
GraphPose-Fiは、WiFiベースの人間のポーズ推定のための骨格トポロジーを明示的にモデル化するグラフベースのフレームワークである。
提案手法はMM-Fiデータセット上の既存手法を様々な設定で大幅に上回っている。
論文 参考訳(メタデータ) (2025-11-24T13:40:26Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - SIGMA: Selective Gated Mamba for Sequential Recommendation [56.85338055215429]
最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-08-21T09:12:59Z) - Coordinate Transformer: Achieving Single-stage Multi-person Mesh
Recovery from Videos [91.44553585470688]
ビデオから複数人の3Dメッシュを回収することは、バーチャルリアリティーや理学療法などにおけるグループ行動の自動認識に向けた重要な第一歩である。
本稿では,複数人物の時空間関係を直接モデル化し,同時にエンドツーエンドでマルチ・メッシュ・リカバリを行うコーディネート・トランスフォーマーを提案する。
3DPWデータセットの実験では、CoordFormerが最先端の精度を大幅に向上し、MPJPE、PAMPJPE、PVEの計測値でそれぞれ4.2%、8.8%、そして4.7%を上回った。
論文 参考訳(メタデータ) (2023-08-20T18:23:07Z) - AdaptivePose++: A Powerful Single-Stage Network for Multi-Person Pose
Regression [66.39539141222524]
そこで本研究では,ヒトの部位を適応点として表現し,微細な身体表現法を提案する。
提案するボディ表現では,AdaptivePoseと呼ばれる,コンパクトなシングルステージ多人数ポーズ回帰ネットワークを提供する。
本稿では,AdaptivePoseの有効性を検証するために,2D/3D多人数ポーズ推定タスクにAdaptivePoseを用いる。
論文 参考訳(メタデータ) (2022-10-08T12:54:20Z) - Back to MLP: A Simple Baseline for Human Motion Prediction [59.18776744541904]
本稿では、歴史的に観察されたシーケンスから将来の身体のポーズを予測することによる、人間の動作予測の課題に取り組む。
これらの手法の性能は、0.14Mパラメータしか持たない軽量で純粋にアーキテクチャアーキテクチャによって超えることができることを示す。
Human3.6M, AMASS, 3DPWデータセットの徹底的な評価は, siMLPeをダブした我々の手法が, 他のアプローチよりも一貫して優れていることを示している。
論文 参考訳(メタデータ) (2022-07-04T16:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。