論文の概要: Map-Mono-Ego: Map-Grounded Global Human Pose Estimation from Monocular Egocentric Video
- arxiv url: http://arxiv.org/abs/2605.20889v1
- Date: Wed, 20 May 2026 08:30:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.570928
- Title: Map-Mono-Ego: Map-Grounded Global Human Pose Estimation from Monocular Egocentric Video
- Title(参考訳): Map-Mono-Ego: モノクラー・エゴセントリック・ビデオによるグローバル・ヒューマン・ポース推定
- Authors: Hiroyuki Deguchi, Ryosuke Hori, Kotaro Amaya, Tsubasa Maruyama, Mitsunori Tada, Hideo Saito,
- Abstract要約: 本研究では,モノクロカメラのみから,グローバルに一貫した人間のポーズ推定を実現する新しいフレームワークであるMapMonoEgoを提案する。
また,AIST-Living データセットも導入した。このデータセットは,スキャンした環境下での地底運動を伴うエゴセントリックなビデオのペアリングである。
- 参考スコア(独自算出の注目度): 11.47608629624409
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monocular egocentric human pose estimation is essential for ubiquitous activity monitoring. However, understanding the user's absolute location within the environment remains a challenge. Existing methods primarily focus on relative motion from an initial position, and tend not to account for the wearer's absolute location within an environment. Furthermore, inherent scale ambiguity in monocular vision leads to severe translational drift, limiting long-term tracking without specialized multi-sensor hardware. To address this, we propose MapMonoEgo, a novel framework achieving globally consistent human pose estimation solely from a monocular camera by leveraging a pre-scanned 3D point cloud. We also introduce AIST-Living dataset, a new dataset pairing egocentric video with ground-truth motion in a scanned environment. Experiments demonstrate that our approach significantly outperforms the state-of-the-art baseline, proving its utility for practical monitoring tasks without specialized hardware.
- Abstract(参考訳): 単眼の自己中心型人間のポーズ推定は、ユビキタスな活動監視に不可欠である。
しかし、環境内のユーザの絶対的な位置を理解することは依然として困難である。
既存の方法は、主に初期位置からの相対的な動きに焦点を当てており、着用者の環境における絶対的な位置を考慮しない傾向がある。
さらに、単眼視における内在的なスケールの曖昧さは、特殊なマルチセンサーハードウェアを使わずに長期追跡を制限し、翻訳の急激なドリフトにつながる。
そこで本研究では,単眼カメラのみで一貫した人間のポーズ推定を実現する新しいフレームワークであるMapMonoEgoを提案する。
また,AIST-Living データセットも導入した。このデータセットは,スキャンした環境下での地底運動を伴うエゴセントリックなビデオのペアリングである。
実験により,本手法は最先端のベースラインを著しく上回り,特殊なハードウェアを使わずに実際の監視作業に有効であることが示された。
関連論文リスト
- Stereo-Inertial Poser: Towards Metric-Accurate Shape-Aware Motion Capture Using Sparse IMUs and a Single Stereo Camera [54.967647497048205]
本稿では,距離精度と形状を考慮した3次元動作を推定するリアルタイムモーションキャプチャシステムであるStereo-Inertial Poserを提案する。
モノクラーRGBをステレオビジョンに置き換え、直接3次元キーポイント抽出と形状パラメータ推定を可能にした。
ドリフトフリーなグローバル翻訳を長い記録時間で生成し,フットスケート効果を低減させる。
論文 参考訳(メタデータ) (2026-03-02T17:46:38Z) - EgoMoD: Predicting Global Maps of Dynamics from Local Egocentric Observations [3.5831173106587393]
Maps of Dynamics (MoDs) は、長期のグローバルプランニングに有用な空間における動き傾向の構造化された表現を提供する。
EgoMoDは,ロボット操作中に収集した短い自我中心のビデオクリップから直接,未来のMoDを予測するための最初のアプローチである。
本手法は,外部観測から学習したMoDを用いて学習した映像とポーズ条件のアーキテクチャを用いて,局所的な動的キューから環境全体の動き傾向を推定する。
論文 参考訳(メタデータ) (2026-02-26T09:56:21Z) - Hand-Aware Egocentric Motion Reconstruction with Sequence-Level Context [17.735273173582716]
本稿では,頭部軌跡と間欠的に見える手探触子を直接条件とする,最初の手認識型シーケンスレベルの拡散フレームワークHaMoSを提案する。
また, 身体形状や視野といったシーケンスレベルのコンテキストが, 正確な運動再構成に不可欠であることを示す。
論文 参考訳(メタデータ) (2025-12-22T11:26:41Z) - Group Inertial Poser: Multi-Person Pose and Global Translation from Sparse Inertial Sensors and Ultra-Wideband Ranging [28.86800972797388]
Group Inertial Poserは、身体のポーズを強く推定し、複数の個人に対してグローバルな翻訳を行うための新しいアプローチである。
Group Inertial Poserは、超広帯域距離(UWB)からの2組のセンサー間の絶対距離を推定する
2人追跡のための最初のIMU+UWBデータセットであるGIP-DBを導入する。
論文 参考訳(メタデータ) (2025-10-24T17:11:50Z) - NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文 参考訳(メタデータ) (2025-06-23T14:28:30Z) - EgoPoser: Robust Real-Time Egocentric Pose Estimation from Sparse and Intermittent Observations Everywhere [29.795731025552957]
EgoPoserは、ヘッドセットの視野内でのみ、間欠的な手の位置と方向追跡から体ポーズを頑健にモデル化する。
本研究では,グローバルな位置から独立して全身のポーズを予測する新しいグローバルな動き分解手法を提案する。
本研究では,本手法を実験的に評価し,定性的に,定量的に,最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-12T07:46:50Z) - UnrealEgo: A New Dataset for Robust Egocentric 3D Human Motion Capture [70.59984501516084]
UnrealEgoは、エゴセントリックな3Dポーズ推定のための、新しい大規模博物学データセットである。
これは、2台の魚眼カメラを備えた高度な眼鏡のコンセプトに基づいており、制約のない環境で使用することができる。
本稿では,ステレオ入力のための2次元キーポイント推定モジュールを考案し,人間のポーズ推定を改善するための簡易かつ効果的なベンチマーク手法を提案する。
論文 参考訳(メタデータ) (2022-08-02T17:59:54Z) - Estimating Egocentric 3D Human Pose in the Wild with External Weak
Supervision [72.36132924512299]
本稿では,大規模な自己中心型データセットでトレーニング可能な,新たな自己中心型ポーズ推定手法を提案する。
本研究では,事前学習された外部視点のポーズ推定モデルにより抽出された高品質な特徴を用いて,エゴセントリックな特徴を監督する新しい学習戦略を提案する。
実験により,本手法は,1つの画像から正確な3Dポーズを予測し,定量的,定性的に,最先端の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-01-20T00:45:13Z) - Towards Robust Monocular Visual Odometry for Flying Robots on Planetary
Missions [49.79068659889639]
火星に着陸したばかりのIngenuityは、トラバーサビリティの影響を受けない新時代の探検の始まりとなるでしょう。
高速な光フロートラッキングを用いた高能率単分子オードメトリーアルゴリズムを提案する。
また、相対翻訳情報行列の主成分分析に基づいて、スケールドリフトの現在のリスクを推定する新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-12T12:52:20Z) - Estimating Egocentric 3D Human Pose in Global Space [70.7272154474722]
本稿では,魚眼カメラを用いた自己中心型3次元体姿勢推定法を提案する。
提案手法は, 定量的, 定性的に, 最先端の手法より優れている。
論文 参考訳(メタデータ) (2021-04-27T20:01:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。