論文の概要: Breaking Coordinate Overfitting: Geometry-Aware WiFi Sensing for Cross-Layout 3D Pose Estimation
- arxiv url: http://arxiv.org/abs/2601.12252v1
- Date: Sun, 18 Jan 2026 04:13:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.52747
- Title: Breaking Coordinate Overfitting: Geometry-Aware WiFi Sensing for Cross-Layout 3D Pose Estimation
- Title(参考訳): 座標オーバーフィッティングを破る:3D空間を横断的に推定する幾何学的WiFiセンシング
- Authors: Songming Jia, Yan Lu, Bin Liu, Xiang Zhang, Peng Zhao, Xinmeng Tang, Yelin Wei, Jinyang Huang, Huan Yan, Zhi Liu,
- Abstract要約: 本稿では、WiFiベースのクロスドメインポーズ推定のための最初の幾何条件付きフレームワークPerceptAlignを紹介する。
PerceptAlignは、最先端のベースラインと比較して、ドメイン内エラーを12.3%削減し、ドメイン間エラーを60%以上削減する。
これらの結果は、スケーラブルで実用的なWiFiセンシングへの有効な経路として、幾何学条件学習を確立している。
- 参考スコア(独自算出の注目度): 26.629874388669176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: WiFi-based 3D human pose estimation offers a low-cost and privacy-preserving alternative to vision-based systems for smart interaction. However, existing approaches rely on visual 3D poses as supervision and directly regress CSI to a camera-based coordinate system. We find that this practice leads to coordinate overfitting: models memorize deployment-specific WiFi transceiver layouts rather than only learning activity-relevant representations, resulting in severe generalization failures. To address this challenge, we present PerceptAlign, the first geometry-conditioned framework for WiFi-based cross-layout pose estimation. PerceptAlign introduces a lightweight coordinate unification procedure that aligns WiFi and vision measurements in a shared 3D space using only two checkerboards and a few photos. Within this unified space, it encodes calibrated transceiver positions into high-dimensional embeddings and fuses them with CSI features, making the model explicitly aware of device geometry as a conditional variable. This design forces the network to disentangle human motion from deployment layouts, enabling robust and, for the first time, layout-invariant WiFi pose estimation. To support systematic evaluation, we construct the largest cross-domain 3D WiFi pose estimation dataset to date, comprising 21 subjects, 5 scenes, 18 actions, and 7 device layouts. Experiments show that PerceptAlign reduces in-domain error by 12.3% and cross-domain error by more than 60% compared to state-of-the-art baselines. These results establish geometry-conditioned learning as a viable path toward scalable and practical WiFi sensing.
- Abstract(参考訳): WiFiベースの人間の3Dポーズ推定は、スマートインタラクションのための視覚ベースのシステムに代わる、低コストでプライバシー保護の代替手段を提供する。
しかし、既存のアプローチでは、監視として視覚的な3Dポーズに依存し、CSIを直接カメラベースの座標系に回帰する。
モデルは、アクティビティ関連表現を学習するだけでなく、デプロイメント固有のWiFiトランシーバレイアウトを記憶し、その結果、重大な一般化失敗をもたらす。
この課題に対処するために、WiFiベースのクロスレイアウトポーズ推定のための最初の幾何条件付きフレームワークPerceptAlignを提案する。
PerceptAlignは、2つのチェッカーボードと数枚の写真だけで、WiFiと視覚計測を共有3D空間で調整する軽量な座標統一手順を導入した。
この統一空間内では、キャリブレーションされたトランシーバの位置を高次元の埋め込みにエンコードし、CSI特徴と融合し、デバイス幾何学を条件変数として明確に認識する。
この設計により、ネットワークは人間の動きを配置のレイアウトから切り離し、堅牢で、初めてレイアウトに不変なWiFiのポーズ推定を可能にする。
システム評価を支援するため,21の被験者,5のシーン,18のアクション,7のデバイスレイアウトからなる,これまでで最大のクロスドメイン3D WiFi ポーズ推定データセットを構築した。
実験の結果、PerceptAlignはドメイン内エラーを12.3%減らし、ドメイン間エラーを60%以上減らした。
これらの結果は、スケーラブルで実用的なWiFiセンシングへの有効な経路として、幾何学条件学習を確立している。
関連論文リスト
- Graph-based 3D Human Pose Estimation using WiFi Signals [7.772045520373017]
GraphPose-Fiは、WiFiベースの人間のポーズ推定のための骨格トポロジーを明示的にモデル化するグラフベースのフレームワークである。
提案手法はMM-Fiデータセット上の既存手法を様々な設定で大幅に上回っている。
論文 参考訳(メタデータ) (2025-11-24T13:40:26Z) - Geometric-aware Pretraining for Vision-centric 3D Object Detection [77.7979088689944]
GAPretrainと呼ばれる新しい幾何学的事前学習フレームワークを提案する。
GAPretrainは、複数の最先端検出器に柔軟に適用可能なプラグアンドプレイソリューションとして機能する。
BEVFormer法を用いて, nuScenes val の 46.2 mAP と 55.5 NDS を実現し, それぞれ 2.7 と 2.1 点を得た。
論文 参考訳(メタデータ) (2023-04-06T14:33:05Z) - DensePose From WiFi [86.61881052177228]
WiFi信号の位相と振幅を24のヒト領域内の紫外線座標にマッピングするディープニューラルネットワークを開発した。
本モデルでは,複数の被験者の密集したポーズを,画像に基づくアプローチと同等の性能で推定することができる。
論文 参考訳(メタデータ) (2022-12-31T16:48:43Z) - 3D Human Mesh Construction Leveraging Wi-Fi [6.157977673335047]
Wi-Meshはビジョンベースの人間のメッシュ構築システムである。
システムはWiFiを使って人体の形状と変形を視覚化する。
論文 参考訳(メタデータ) (2022-10-20T01:58:27Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - WiCluster: Passive Indoor 2D/3D Positioning using WiFi without Precise
Labels [0.0]
我々は、無線周波数(RF)チャネル状態情報(CSI)を用いた受動的屋内位置決めのための新しい機械学習(ML)アプローチであるWiClusterを紹介する。
WiClusterは、トレーニング中に正確な位置ラベルを使わずに、ゾーンレベルの位置と正確な2Dまたは3D位置の両方を予測することができる。
論文 参考訳(メタデータ) (2021-05-31T12:09:46Z) - From Point to Space: 3D Moving Human Pose Estimation Using Commodity
WiFi [21.30069619479767]
Wi-Moseは、商品WiFiを用いた最初の3D移動人間のポーズ推定システムです。
振幅と位相をチャネル状態情報(csi)画像に融合し,ポーズ情報と位置情報の両方を提供する。
実験結果は、Wi-Moseが29.7mmおよび37.8mm Procrustes分析で、Sight of Sight(LoS)およびnon-Line of Sight(NLoS)シナリオにおける共同位置誤差(P-MPJPE)を局在化できることを示しています。
論文 参考訳(メタデータ) (2020-12-28T02:27:26Z) - Monocular 3D Detection with Geometric Constraints Embedding and
Semi-supervised Training [3.8073142980733]
我々は,KM3D-Netと呼ばれる,RGB画像のみを用いたモノクル3Dオブジェクト検出のための新しいフレームワークを提案する。
我々は、対象のキーポイント、次元、方向を予測するための完全な畳み込みモデルを設計し、これらの推定を視点幾何学的制約と組み合わせて位置属性を計算する。
論文 参考訳(メタデータ) (2020-09-02T00:51:51Z) - ZoomNet: Part-Aware Adaptive Zooming Neural Network for 3D Object
Detection [69.68263074432224]
ステレオ画像に基づく3D検出のためのZoomNetという新しいフレームワークを提案する。
ZoomNetのパイプラインは、通常の2Dオブジェクト検出モデルから始まり、左右のバウンディングボックスのペアを取得するために使用される。
さらに,RGB画像のテクスチャキューを多用し,より正確な異質度推定を行うため,適応ズームという概念的に真直ぐなモジュールを導入する。
論文 参考訳(メタデータ) (2020-03-01T17:18:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。