論文の概要: End-to-End Human Pose Reconstruction from Wearable Sensors for 6G Extended Reality Systems
- arxiv url: http://arxiv.org/abs/2503.04860v1
- Date: Thu, 06 Mar 2025 08:52:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-10 12:21:02.288947
- Title: End-to-End Human Pose Reconstruction from Wearable Sensors for 6G Extended Reality Systems
- Title(参考訳): ウェアラブルセンサを用いた6G拡張現実感システムのためのエンド・ツー・エンドヒューマン・ポース・コンストラクション
- Authors: Nguyen Quang Hieu, Dinh Thai Hoang, Diep N. Nguyen, Mohammad Abu Alsheikh, Carlos C. N. Kuhn, Yibeltal F. Alem, Ibrahim Radwan,
- Abstract要約: フル3次元ポーズ再構築は,第6世代(6G)ネットワークにおける拡張現実(XR)アプリケーションにとって重要な実現手段である。
従来のアプローチでは、屋内環境でのエラーのない送信を前提としており、実際のシナリオに適用性に制限がある。
我々はOFDMシステム上での人間のポーズ再構築のための新しいディープラーニングベースのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 19.008505822600327
- License:
- Abstract: Full 3D human pose reconstruction is a critical enabler for extended reality (XR) applications in future sixth generation (6G) networks, supporting immersive interactions in gaming, virtual meetings, and remote collaboration. However, achieving accurate pose reconstruction over wireless networks remains challenging due to channel impairments, bit errors, and quantization effects. Existing approaches often assume error-free transmission in indoor settings, limiting their applicability to real-world scenarios. To address these challenges, we propose a novel deep learning-based framework for human pose reconstruction over orthogonal frequency-division multiplexing (OFDM) systems. The framework introduces a two-stage deep learning receiver: the first stage jointly estimates the wireless channel and decodes OFDM symbols, and the second stage maps the received sensor signals to full 3D body poses. Simulation results demonstrate that the proposed neural receiver reduces bit error rate (BER), thus gaining a 5 dB gap at $10^{-4}$ BER, compared to the baseline method that employs separate signal detection steps, i.e., least squares channel estimation and linear minimum mean square error equalization. Additionally, our empirical findings show that 8-bit quantization is sufficient for accurate pose reconstruction, achieving a mean squared error of $5\times10^{-4}$ for reconstructed sensor signals, and reducing joint angular error by 37\% for the reconstructed human poses compared to the baseline.
- Abstract(参考訳): 完全な3Dのポーズ再構築は、将来の第6世代(6G)ネットワークにおける拡張現実(XR)アプリケーションにとって重要な実現手段であり、ゲーム、仮想会議、リモートコラボレーションにおける没入型インタラクションをサポートする。
しかし、無線ネットワーク上で正確なポーズ再構築を実現することは、チャネル障害、ビットエラー、量子化効果のために依然として困難である。
既存のアプローチでは、屋内環境ではエラーのない送信を前提としており、実際のシナリオに適用性に制限がある。
これらの課題に対処するために、直交周波数分割多重化(OFDM)システムを用いた人間のポーズ再構成のための新しいディープラーニングベースのフレームワークを提案する。
このフレームワークは、2段階のディープラーニング受信機を導入し、第1段階は無線チャネルを共同で推定し、OFDMシンボルをデコードし、第2段階は受信したセンサー信号をフル3Dボディポーズにマッピングする。
シミュレーションの結果、提案したニューラルレシーバはビット誤り率(BER)を低減し、最小二乗チャネル推定と線形最小二乗平均二乗誤差等化という分離信号検出ステップを用いるベースライン法と比較して、10^{-4}$ BERで5dBのギャップを得ることを示した。
さらに,8ビットの量子化は正確なポーズ復元に十分であることを示すとともに,再建されたセンサ信号に対して平均2乗誤差5\times10^{-4}$を達成し,再建された人間のポーズに対する関節角誤差をベースラインと比較して37\%低減することを示した。
関連論文リスト
- A Lightweight Human Pose Estimation Approach for Edge Computing-Enabled Metaverse with Compressive Sensing [23.884862152830184]
5G/6Gネットワークのようなエッジコンピューティング対応ネットワーク上のユーザの3D動作を推定する能力は、拡張現実(XR)とメタバースアプリケーションの新しい時代の重要な実現要因である。
近年の深層学習の進歩は,センサ信号からの予備的な計測から3次元人のポーズを推定する最適化手法よりも有利であることが示されている。
ノイズの多い無線環境におけるIMU信号の冗長性除去と軽量伝送のための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-08-26T02:57:23Z) - DM3D: Distortion-Minimized Weight Pruning for Lossless 3D Object Detection [42.07920565812081]
本稿では,3次元物体検出のための新しいトレーニング後の重み付け手法を提案する。
事前訓練されたモデルにおける冗長パラメータを決定し、局所性と信頼性の両方において最小限の歪みをもたらす。
本フレームワークは,ネットワーク出力の歪みを最小限に抑え,検出精度を最大に維持することを目的とする。
論文 参考訳(メタデータ) (2024-07-02T09:33:32Z) - Match and Locate: low-frequency monocular odometry based on deep feature
matching [0.65268245109828]
本稿では,1台のカメラしか必要としないロボットオドメトリーの新たなアプローチを提案する。
アプローチは、深い特徴マッチングモデルを用いて、ビデオストリームの連続フレーム間の画像特徴のマッチングに基づいている。
本研究では,AISG-SLAビジュアルローカライゼーションチャレンジにおける手法の性能評価を行い,計算効率が高く,実装が容易であるにもかかわらず,競合する結果が得られた。
論文 参考訳(メタデータ) (2023-11-16T17:32:58Z) - Coordinate Transformer: Achieving Single-stage Multi-person Mesh
Recovery from Videos [91.44553585470688]
ビデオから複数人の3Dメッシュを回収することは、バーチャルリアリティーや理学療法などにおけるグループ行動の自動認識に向けた重要な第一歩である。
本稿では,複数人物の時空間関係を直接モデル化し,同時にエンドツーエンドでマルチ・メッシュ・リカバリを行うコーディネート・トランスフォーマーを提案する。
3DPWデータセットの実験では、CoordFormerが最先端の精度を大幅に向上し、MPJPE、PAMPJPE、PVEの計測値でそれぞれ4.2%、8.8%、そして4.7%を上回った。
論文 参考訳(メタデータ) (2023-08-20T18:23:07Z) - NeurAR: Neural Uncertainty for Autonomous 3D Reconstruction [64.36535692191343]
暗黙の神経表現はオフラインの3D再構成において魅力的な結果を示しており、オンラインSLAMシステムの可能性も最近示している。
本論文は,1)新しい表現に基づく視点計画の質を評価するための基準を求めること,2)手作りではなく,異なる場面に一般化可能なデータから基準を学習すること,の2つの課題に対処する。
本手法は, TSDFを用いた変形モデルやビュープランニングなしでの再構成モデルと比較した場合, レンダリングされた画像品質と再構成された3次元モデルの幾何学的品質について, 様々な指標について有意な改善を示す。
論文 参考訳(メタデータ) (2022-07-22T10:05:36Z) - iSDF: Real-Time Neural Signed Distance Fields for Robot Perception [64.80458128766254]
iSDFは実時間符号付き距離場再構成のための連続学習システムである。
より正確な再構築と、衝突コストと勾配のより良い近似を生成する。
論文 参考訳(メタデータ) (2022-04-05T15:48:39Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Category-Level 6D Object Pose Estimation via Cascaded Relation and
Recurrent Reconstruction Networks [22.627704070200863]
カテゴリーレベルの6Dポーズ推定は、ロボット操作や拡張現実といった多くのシナリオに不可欠である。
カテゴリレベルの6次元ポーズ推定をカスケード関係と再帰的再構成ネットワークを用いて高精度に行う。
我々の手法は最新の最先端のSPDを4.9%、CAMERA25データセットで17.7%で上回る。
論文 参考訳(メタデータ) (2021-08-19T15:46:52Z) - Pose-dependent weights and Domain Randomization for fully automatic
X-ray to CT Registration [51.280096834264256]
完全自動X線CT登録は、既存の強度ベース登録の範囲内での最初のアライメントを必要とする。
この作業は、エンドツーエンドの登録を可能にする新しい自動初期化を提供する。
ミリメートルにおける平均(+標準偏差)ターゲット登録誤差は、成功率92%の模擬X線に対して4.1 +- 4.3、成功率86.8%の実X線に対して4.2 +- 3.9であり、成功率は30mm未満の翻訳誤差と定義される。
論文 参考訳(メタデータ) (2020-11-14T12:50:32Z) - 3D Pose Detection in Videos: Focusing on Occlusion [0.4588028371034406]
我々は,映像中の隠蔽型3Dポーズ検出のための既存の手法を構築した。
我々は,2次元ポーズ予測を生成するために,積み重ねられた時間ガラスネットワークからなる2段階アーキテクチャを実装した。
閉鎖関節によるポーズの予測を容易にするため,シリンダーマンモデルの直感的な一般化を導入する。
論文 参考訳(メタデータ) (2020-06-24T07:01:17Z) - Coherent Reconstruction of Multiple Humans from a Single Image [68.3319089392548]
本研究では,1枚の画像から多人数の3Dポーズ推定を行う問題に対処する。
この問題のトップダウン設定における典型的な回帰アプローチは、まずすべての人間を検出し、それぞれを独立して再構築する。
我々のゴールは、これらの問題を回避し、現場のすべての人間のコヒーレントな3D再構成を生成するために学習する単一のネットワークをトレーニングすることである。
論文 参考訳(メタデータ) (2020-06-15T17:51:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。