論文の概要: PoseFusion2: Simultaneous Background Reconstruction and Human Shape
Recovery in Real-time
- arxiv url: http://arxiv.org/abs/2108.00695v1
- Date: Mon, 2 Aug 2021 08:03:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:06:15.437998
- Title: PoseFusion2: Simultaneous Background Reconstruction and Human Shape
Recovery in Real-time
- Title(参考訳): PoseFusion2: バックグラウンドでの同時再構築と人体形状復元
- Authors: Huayan Zhang, Tianwei Zhang, Tin Lun Lam, and Sethu Vijayakumar
- Abstract要約: 動的対象を分離する高速で学習可能な人体検出装置を提案する。
我々は、人間のポーズと形を推定し、再構築することでさらに進みます。
最終的な出力環境マップは、動的な人間のメッシュとその軌道を含む。
- 参考スコア(独自算出の注目度): 10.808349747179978
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Dynamic environments that include unstructured moving objects pose a hard
problem for Simultaneous Localization and Mapping (SLAM) performance. The
motion of rigid objects can be typically tracked by exploiting their texture
and geometric features. However, humans moving in the scene are often one of
the most important, interactive targets - they are very hard to track and
reconstruct robustly due to non-rigid shapes. In this work, we present a fast,
learning-based human object detector to isolate the dynamic human objects and
realise a real-time dense background reconstruction framework. We go further by
estimating and reconstructing the human pose and shape. The final output
environment maps not only provide the dense static backgrounds but also contain
the dynamic human meshes and their trajectories. Our Dynamic SLAM system runs
at around 26 frames per second (fps) on GPUs, while additionally turning on
accurate human pose estimation can be executed at up to 10 fps.
- Abstract(参考訳): 非構造化移動オブジェクトを含む動的環境は、同時ローカライゼーションとマッピング(slam)のパフォーマンスに困難をもたらす。
剛体の運動は、そのテクスチャと幾何学的特徴を利用して追跡することができる。
しかし、現場を移動する人間は多くの場合、最も重要で対話的な標的の1つです。
そこで本研究では,動的物体を分離し,リアルタイムの濃密な背景復元フレームワークを実現するための高速学習に基づくヒューマンオブジェクト検出器を提案する。
さらに、人間のポーズや形状を推定し、再構成する。
最終的な出力環境マップは、密度の高い静的背景を提供するだけでなく、動的人間のメッシュとその軌道も含んでいる。
われわれのDynamic SLAMシステムはGPU上で約26フレーム/秒(fps)で動作し、同時に正確な人間のポーズ推定を最大10fpsで行うことができる。
関連論文リスト
- EgoGaussian: Dynamic Scene Understanding from Egocentric Video with 3D Gaussian Splatting [95.44545809256473]
エゴガウスアン(EgoGaussian)は、3Dシーンを同時に再構築し、RGBエゴセントリックな入力のみから3Dオブジェクトの動きを動的に追跡する手法である。
動的オブジェクトと背景再構築の品質の両面で,最先端技術と比較して大きな改善が見られた。
論文 参考訳(メタデータ) (2024-06-28T10:39:36Z) - Simultaneous Map and Object Reconstruction [66.66729715211642]
本稿では,LiDARから大規模都市景観を動的に再現する手法を提案する。
我々は、最近の新しいビュー合成法から着想を得て、大域的な最適化として再構築問題を提起する。
連続動作の慎重なモデリングにより, 回転するLiDARセンサの回転シャッター効果を補うことができる。
論文 参考訳(メタデータ) (2024-06-19T23:53:31Z) - Physics-based Scene Layout Generation from Human Motion [21.939444709132395]
本研究では、シーンレイアウト生成を同時に最適化し、物理シミュレータで動く人間をシミュレートする物理に基づくアプローチを提案する。
我々は、強化学習を用いて、キャラクタ動作模倣コントローラとシーンレイアウトジェネレータの両方の二重最適化を行う。
提案手法は,SAMPとPROXの動作を用いて評価し,従来のキネマティクス法と比較して,物理的に妥当なシーンレイアウトの再構築を示す。
論文 参考訳(メタデータ) (2024-05-21T02:36:37Z) - TRACE: 5D Temporal Regression of Avatars with Dynamic Cameras in 3D
Environments [106.80978555346958]
現在の方法では、地球上の座標で動く人間を確実に推定することはできない。
TRACEは、ダイナミックカメラからグローバル座標における3D人間の共同回収と追跡を行う最初の1段階の手法である。
トラッキングとHPSベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-06-05T13:00:44Z) - Full-Body Articulated Human-Object Interaction [61.01135739641217]
CHAIRSは16.2時間の多目的相互作用からなる大規模な動きキャプチャーされたf-AHOIデータセットである。
CHAIRSは、対話的なプロセス全体を通して、人間と明瞭なオブジェクトの両方の3Dメッシュを提供する。
HOIにおける幾何学的関係を学習することにより,人間のポーズ推定を利用した最初のモデルが考案された。
論文 参考訳(メタデータ) (2022-12-20T19:50:54Z) - Visual-Inertial Multi-Instance Dynamic SLAM with Object-level
Relocalisation [14.302118093865849]
密結合型ビジュアル・慣性オブジェクトレベルのマルチインスタンス動的SLAMシステムを提案する。
カメラのポーズ、速度、IMUバイアスを強く最適化し、環境の高密度な3D再構成オブジェクトレベルマップを構築することができる。
論文 参考訳(メタデータ) (2022-08-08T17:13:24Z) - Trajectory Optimization for Physics-Based Reconstruction of 3d Human
Pose from Monocular Video [31.96672354594643]
本研究は,単眼映像から身体的に可視な人間の動きを推定する作業に焦点をあてる。
物理を考慮しない既存のアプローチは、しばしば運動人工物と時間的に矛盾した出力を生み出す。
提案手法は,Human3.6Mベンチマークにおける既存の物理法と競合する結果が得られることを示す。
論文 参考訳(メタデータ) (2022-05-24T18:02:49Z) - Human-Aware Object Placement for Visual Environment Reconstruction [63.14733166375534]
我々は,モノクラーRGBビデオからシーンの3次元再構成を改善するために,人間とシーンのインタラクションを活用することができることを示す。
私たちのキーとなるアイデアは、人がシーンを移動してそれと対話するにつれて、複数の入力イメージにまたがってHSIを蓄積する、ということです。
シーン再構成は,初期3次元の人物のポーズと形状推定の精度向上に有効であることを示す。
論文 参考訳(メタデータ) (2022-03-07T18:59:02Z) - AirDOS: Dynamic SLAM benefits from Articulated Objects [9.045690662672659]
オブジェクト認識SLAM(DOS)は、動的環境におけるロバストな動き推定を可能にするためにオブジェクトレベル情報を利用する。
AirDOSは、動的な調音オブジェクトを組み込むことで、カメラのポーズ推定を改善することができることを示す最初の動的オブジェクト認識SLAMシステムである。
論文 参考訳(メタデータ) (2021-09-21T01:23:48Z) - Contact and Human Dynamics from Monocular Video [73.47466545178396]
既存のディープモデルは、ほぼ正確に見えるエラーを含むビデオから2Dと3Dキネマティックのポーズを予測する。
本稿では,最初の2次元と3次元のポーズ推定を入力として,映像系列から3次元の人間の動きを推定する物理に基づく手法を提案する。
論文 参考訳(メタデータ) (2020-07-22T21:09:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。