論文の概要: Static Scene Reconstruction from Dynamic Egocentric Videos
- arxiv url: http://arxiv.org/abs/2603.22450v1
- Date: Mon, 23 Mar 2026 18:19:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.138184
- Title: Static Scene Reconstruction from Dynamic Egocentric Videos
- Title(参考訳): ダイナミックエゴセントリックビデオからの静的シーン再構成
- Authors: Qifei Cui, Patrick Chen,
- Abstract要約: エゴセントリックビデオは、迅速なカメラの動きと頻繁なダイナミックな相互作用による3D再構成のユニークな課題を示す。
静的な復元バックボーンを長めのエゴセントリックなビデオに適応させる頑健なパイプラインを提案する。
- 参考スコア(独自算出の注目度): 0.08594140167290099
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Egocentric videos present unique challenges for 3D reconstruction due to rapid camera motion and frequent dynamic interactions. State-of-the-art static reconstruction systems, such as MapAnything, often degrade in these settings, suffering from catastrophic trajectory drift and "ghost" geometry caused by moving hands. We bridge this gap by proposing a robust pipeline that adapts static reconstruction backbones to long-form egocentric video. Our approach introduces a mask-aware reconstruction mechanism that explicitly suppresses dynamic foreground in the attention layers, preventing hand artifacts from contaminating the static map. Furthermore, we employ a chunked reconstruction strategy with pose-graph stitching to ensure global consistency and eliminate long-term drift. Experiments on HD-EPIC and indoor drone datasets demonstrate that our pipeline significantly improves absolute trajectory error and yields visually clean static geometry compared to naive baselines, effectively extending the capability of foundation models to dynamic first-person scenes.
- Abstract(参考訳): エゴセントリックビデオは、迅速なカメラの動きと頻繁なダイナミックな相互作用による3D再構成のユニークな課題を示す。
MapAnythingのような最先端の静的再構築システムは、しばしばこれらの環境で劣化し、破滅的な軌道の漂流と手の動きによって引き起こされる「ゴースト」幾何学に悩まされる。
このギャップを埋めるために、静的な再構築バックボーンを長めのエゴセントリックなビデオに適応する堅牢なパイプラインを提案する。
本手法では,注意層における動的前景を明示的に抑制し,手工芸品が静的マップを汚染しないようにするマスク認識再構築機構を導入する。
さらに,大域的整合性を確保し,長期的ドリフトをなくすため,ポーズグラフ縫合によるチャンク再建戦略を採用した。
HD-EPICおよび屋内ドローンデータセットの実験により、パイプラインは絶対軌道誤差を大幅に改善し、自然なベースラインに比べて視覚的にクリーンな静的な形状が得られることが示され、ファンデーションモデルのダイナミックなファーストパーソンシーンへの拡張が効果的に行われた。
関連論文リスト
- MoRe: Motion-aware Feed-forward 4D Reconstruction Transformer [45.19539316971492]
MoReは、モノクロビデオから動的3Dシーンを効率よく回収するフィードフォワード4D再構成ネットワークである。
強力な静的再構築バックボーンを基盤として構築されたMoReは、静的構造から動的動作をアンタングルするために注意を強制する戦略を採用している。
複数のベンチマークの実験により、MoReは例外的な効率で高品質な動的再構成を実現することが示された。
論文 参考訳(メタデータ) (2026-03-05T11:51:07Z) - MUT3R: Motion-aware Updating Transformer for Dynamic 3D Reconstruction [24.474529522394405]
MUT3Rは,注意由来の動作キューを適用して,推論中の動的コンテンツを抑制する学習自由フレームワークである。
我々はモデルを再訓練したり微調整したりせず、事前訓練されたトランスフォーマーが自身の動きの手がかりを診断し、修正する。
論文 参考訳(メタデータ) (2025-12-03T16:36:53Z) - Back on Track: Bundle Adjustment for Dynamic Scene Reconstruction [86.099855111676]
従来のSLAMシステムは、カジュアルなビデオでよく見られる非常にダイナミックなシーンと格闘する。
この研究は3Dポイントトラッカーを利用して、カメラによる動的物体の動きからカメラによる動きを分離する。
私たちのフレームワークは、従来のSLAM -- バンドル調整 -- の中核を、堅牢な学習ベースの3Dトラッカーフロントエンドと組み合わせています。
論文 参考訳(メタデータ) (2025-04-20T07:29:42Z) - D$^2$USt3R: Enhancing 3D Reconstruction for Dynamic Scenes [54.886845755635754]
本研究は動的シーンにおける3次元再構成の課題に対処し,物体の動きが従来の3次元ポイントマップ回帰法の品質を劣化させる。
空間的側面と時間的側面の両方を明示的に組み込むことにより,提案した点マップに対する3次元密度対応のカプセル化に成功した。
論文 参考訳(メタデータ) (2025-04-08T17:59:50Z) - SMORE: Simultaneous Map and Object REconstruction [66.66729715211642]
本稿では,LiDARから大規模都市景観を動的に再現する手法を提案する。
我々は、世界が厳格に動く物体と背景に分解される動的なシーンの構成モデルを総合的に捉え、最適化する。
論文 参考訳(メタデータ) (2024-06-19T23:53:31Z) - RoDUS: Robust Decomposition of Static and Dynamic Elements in Urban Scenes [3.1224202646855903]
都市景観における静的および動的要素を分解するパイプラインであるRoDUSについて述べる。
提案手法では、4Dセマンティック情報と組み合わされた堅牢なカーネルベースの初期化を用いて学習プロセスを選択的にガイドする。
特に,KITTI-360およびPandasetデータセットを用いた実験により,挑戦的な都市景観を正確に静的かつ動的成分に分解する手法の有効性が示された。
論文 参考訳(メタデータ) (2024-03-14T14:08:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。