論文の概要: MMBaT: A Multi-task Framework for mmWave-based Human Body Reconstruction
and Translation Prediction
- arxiv url: http://arxiv.org/abs/2312.10346v1
- Date: Sat, 16 Dec 2023 06:28:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 17:02:34.863189
- Title: MMBaT: A Multi-task Framework for mmWave-based Human Body Reconstruction
and Translation Prediction
- Title(参考訳): mmbat:mmwaveに基づく人体再構成と翻訳予測のためのマルチタスクフレームワーク
- Authors: Jiarui Yang, Songpengcheng Xia, Yifan Song, Qi Wu, Ling Pei
- Abstract要約: mmBaTは、人間の身体を推定し、その後のフレームで身体翻訳を予測する新しいディープラーニングフレームワークである。
本手法は,異なるレーダ装置とノイズレベルで収集した2つの公開データセットを用いて評価する。
- 参考スコア(独自算出の注目度): 22.606025860794627
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human body reconstruction with Millimeter Wave (mmWave) radar point clouds
has gained significant interest due to its ability to work in adverse
environments and its capacity to mitigate privacy concerns associated with
traditional camera-based solutions. Despite pioneering efforts in this field,
two challenges persist. Firstly, raw point clouds contain massive noise points,
usually caused by the ambient objects and multi-path effects of Radio Frequency
(RF) signals. Recent approaches typically rely on prior knowledge or elaborate
preprocessing methods, limiting their applicability. Secondly, even after noise
removal, the sparse and inconsistent body-related points pose an obstacle to
accurate human body reconstruction. To address these challenges, we introduce
mmBaT, a novel multi-task deep learning framework that concurrently estimates
the human body and predicts body translations in subsequent frames to extract
body-related point clouds. Our method is evaluated on two public datasets that
are collected with different radar devices and noise levels. A comprehensive
comparison against other state-of-the-art methods demonstrates our method has a
superior reconstruction performance and generalization ability from noisy raw
data, even when compared to methods provided with body-related point clouds.
- Abstract(参考訳): ミリ波(mmWave)レーダーポイント雲による人体再構成は、悪環境で働く能力と、従来のカメラベースのソリューションに関連するプライバシーの懸念を軽減する能力により、大きな関心を集めている。
この分野での先駆的な努力にもかかわらず、2つの課題が続いている。
まず、生の点雲は、周囲の物体と高周波(RF)信号のマルチパス効果によって引き起こされる大きなノイズポイントを含む。
最近のアプローチは一般的に、事前の知識や精巧な事前処理手法に依存し、適用性を制限する。
第二に、ノイズ除去後にも、スパースと不整合体関連点が正確な人体再建に障害となる。
これらの課題に対処するために,人体を同時に推定し,その後のフレームにおける身体翻訳を予測し,身体関連点群を抽出する,新しいマルチタスク深層学習フレームワークmmBaTを導入する。
本手法は,異なるレーダ装置とノイズレベルで収集した2つの公開データセットを用いて評価する。
他の最先端手法と比較して総合的に比較すると,本手法は,身体関連点群と比べ,ノイズの多い生データからの復元性能と一般化能力に優れていた。
関連論文リスト
- Fast Learning of Signed Distance Functions from Noisy Point Clouds via Noise to Noise Mapping [54.38209327518066]
点雲から符号付き距離関数を学習することは、3Dコンピュータビジョンにおいて重要な課題である。
クリーンポイントクラウドや地上の真理監督を必要としないノイズ・ノイズマッピングを用いてSDFを学習することを提案する。
我々の新しい特徴はノイズ・ト・ノイズマッピングにあり、1つの物体やシーンの高精度なSDFを、その多重または単一ノイズの観測から推測することができる。
論文 参考訳(メタデータ) (2024-07-04T03:35:02Z) - DPMesh: Exploiting Diffusion Prior for Occluded Human Mesh Recovery [71.6345505427213]
DPMeshは、人間のメッシュリカバリを排除した革新的なフレームワークである。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルに埋め込まれた対象構造と空間的関係について、より深い拡散に乗じる。
論文 参考訳(メタデータ) (2024-04-01T18:59:13Z) - AiOS: All-in-One-Stage Expressive Human Pose and Shape Estimation [55.179287851188036]
人間のポーズと形状の復元のための新しいオールインワンステージフレームワークであるAiOSを、追加の人間検出ステップなしで導入する。
まず、画像中の人間の位置を探索し、各インスタンスのグローバルな機能をエンコードするために、人間のトークンを使用します。
そして、画像中の人間の関節を探索し、きめ細かい局所的特徴を符号化するジョイント関連トークンを導入する。
論文 参考訳(メタデータ) (2024-03-26T17:59:23Z) - Diffusion Model is a Good Pose Estimator from 3D RF-Vision [32.72703340013302]
無線周波数ビジョン(RF-vision)からのヒューマンポーズ推定(HPE)は、RF信号を用いて人間のセンシングを行う。
mmWaveレーダーは有望なRFビジョンセンサーとして登場し、RF信号を処理してレーダー点雲を提供する。
本研究は,ノイズレーダデータに適した新しい拡散型ポーズ推定器mmDiffを提案する。
論文 参考訳(メタデータ) (2024-03-24T15:39:52Z) - RoHM: Robust Human Motion Reconstruction via Diffusion [58.63706638272891]
RoHMは、モノクロRGB(-D)ビデオから頑健な3次元人間の動きを復元するためのアプローチである。
ノイズと閉鎖された入力データに条件付けし、一貫した大域座標で完全な可塑性運動を再構成した。
本手法は,テスト時に高速でありながら,定性的かつ定量的に最先端の手法より優れる。
論文 参考訳(メタデータ) (2024-01-16T18:57:50Z) - Implicit neural representation for change detection [15.741202788959075]
点雲の変化を検出する最も一般的なアプローチは、教師付き手法に基づいている。
Inlicit Neural Representation (INR) for continuous shape reconstruction と Gaussian Mixture Model for categorising change の2つのコンポーネントからなる教師なしアプローチを提案する。
本手法を都市スプロールのためのシミュレーションLiDAR点雲からなるベンチマークデータセットに適用する。
論文 参考訳(メタデータ) (2023-07-28T09:26:00Z) - DRNet: Decomposition and Reconstruction Network for Remote Physiological
Measurement [39.73408626273354]
既存の方法は一般に2つのグループに分けられる。
1つ目は、顔ビデオから微妙な音量パルス(BVP)信号を抽出することに焦点を当てているが、顔ビデオコンテンツを支配するノイズを明示的にモデル化することはめったにない。
第二に、ノイズの多いデータを直接モデリングすることに焦点を当てており、これらの厳密なランダムノイズの規則性の欠如により、最適以下の性能が得られる。
論文 参考訳(メタデータ) (2022-06-12T07:40:10Z) - Towards Adversarially Robust Deep Image Denoising [199.2458715635285]
本研究は,ディープ・イメージ・デノイザ(DID)の対角的ロバスト性について系統的に検討する。
本稿では,観測に基づくゼロ平均アタック(sc ObsAtk)という新たな敵攻撃を提案する。
DIDを頑健化するために,DIDと非対向雑音データとを併用したハイブリッド対向訓練(sc HAT)を提案する。
論文 参考訳(メタデータ) (2022-01-12T10:23:14Z) - Multimodal In-bed Pose and Shape Estimation under the Blankets [77.12439296395733]
マルチモーダルセンサが捉えた知識を最大限活用するために,様々なモダリティを融合するピラミッド方式を提案する。
我々は注意に基づく再構築モジュールを用いて検出されたモダリティを生成し,現在の推定値を更新するためにさらに融合する。
論文 参考訳(メタデータ) (2020-12-12T05:35:23Z) - Solving Inverse Problems With Deep Neural Networks -- Robustness
Included? [3.867363075280544]
近年の研究では、複数の画像再構成タスクにおけるディープニューラルネットワークの不安定性が指摘されている。
分類における敵対的攻撃と類似して、入力領域のわずかな歪みが深刻な成果物を生じさせる可能性が示された。
本稿では、未決定の逆問題を解決するためのディープラーニングベースのアルゴリズムの堅牢性について広範な研究を行うことにより、この懸念に新たな光を当てる。
論文 参考訳(メタデータ) (2020-11-09T09:33:07Z) - Class-Specific Blind Deconvolutional Phase Retrieval Under a Generative
Prior [8.712404218757733]
この問題はフーリエ・プチコグラフィー、X線結晶学、可視光通信など様々な画像モダリティで発生する。
本稿では,事前訓練された2つの深層生成ネットワークの下での交互勾配降下アルゴリズムを用いて,この逆問題の解法を提案する。
提案アルゴリズムは,前向き測定モデルを説明する各前駆体の範囲内で,シャープな画像とぼやけたカーネルを見つけ出そうとする。
論文 参考訳(メタデータ) (2020-02-28T07:36:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。