Fugu-MT 論文翻訳(概要): OmniLocalRF: Omnidirectional Local Radiance Fields from Dynamic Videos

論文の概要: OmniLocalRF: Omnidirectional Local Radiance Fields from Dynamic Videos

arxiv url: http://arxiv.org/abs/2404.00676v1
Date: Sun, 31 Mar 2024 12:55:05 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-04 02:20:51.101213
Title: OmniLocalRF: Omnidirectional Local Radiance Fields from Dynamic Videos
Title（参考訳）: OmniLocalRF:ダイナミックビデオからの全方位局所放射場
Authors: Dongyoung Choi, Hyeonjoong Jang, Min H. Kim,
Abstract要約: 我々はOmnidirectional Local Radiance Fields (OmniLocalRF)と呼ばれる新しいアプローチを導入し、静的のみのシーンビューをレンダリングする。本手法は局所放射界の原理と全方位光の双方向最適化を組み合わせたものである。実験により,OmniLocalRFは定性的,定量的に既存手法より優れていることを確認した。
参考スコア（独自算出の注目度）: 14.965321452764355
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Omnidirectional cameras are extensively used in various applications to provide a wide field of vision. However, they face a challenge in synthesizing novel views due to the inevitable presence of dynamic objects, including the photographer, in their wide field of view. In this paper, we introduce a new approach called Omnidirectional Local Radiance Fields (OmniLocalRF) that can render static-only scene views, removing and inpainting dynamic objects simultaneously. Our approach combines the principles of local radiance fields with the bidirectional optimization of omnidirectional rays. Our input is an omnidirectional video, and we evaluate the mutual observations of the entire angle between the previous and current frames. To reduce ghosting artifacts of dynamic objects and inpaint occlusions, we devise a multi-resolution motion mask prediction module. Unlike existing methods that primarily separate dynamic components through the temporal domain, our method uses multi-resolution neural feature planes for precise segmentation, which is more suitable for long 360-degree videos. Our experiments validate that OmniLocalRF outperforms existing methods in both qualitative and quantitative metrics, especially in scenarios with complex real-world scenes. In particular, our approach eliminates the need for manual interaction, such as drawing motion masks by hand and additional pose estimation, making it a highly effective and efficient solution.
Abstract（参考訳）: 方位カメラは様々な用途に広く使われ、広い視野の視界を提供する。しかし、カメラマンを含むダイナミックな物体が広い視野で必然的に存在するため、新しい視点を合成するという課題に直面している。本稿では,Omnidirectional Local Radiance Fields (OmniLocalRF) と呼ばれる新しいアプローチを提案する。本手法は局所放射場原理と全方位光の双方向最適化を組み合わせたものである。入力は全方位ビデオであり、前向きと現在のフレーム間の全角度の相互観察を評価する。動的物体のゴーストアーティファクトや絵画の閉塞を低減させるため,マルチレゾリューションモーションマスク予測モジュールを考案した。時間領域を通して動的成分を分離する既存の手法とは異なり、本手法は高解像度のニューラル特徴面を用いて正確なセグメンテーションを行い、より長い360度ビデオに向いている。実験により,OmniLocalRFは実世界の複雑な場面において,定性的・定量的に既存の手法よりも優れていたことが確認された。特に,手動マスクの描画や追加ポーズ推定などの手動操作の必要性を排除し,高効率かつ効率的な解法である。

関連論文リスト

Gear-NeRF: Free-Viewpoint Rendering and Tracking with Motion-aware Spatio-Temporal Sampling [70.34875558830241]
本研究では,シーンをレンダリングする動的領域の階層化モデリングを可能にする意味的セマンティックギアに基づく,時間的(4D)埋め込みの学習方法を提案する。同時に、ほぼ無償で、当社のトラッキングアプローチは、既存のNeRFベースのメソッドでまだ達成されていない機能である、自由視点(free-view of interest)を可能にします。
論文参考訳（メタデータ） (2024-06-06T03:37:39Z)
DyBluRF: Dynamic Neural Radiance Fields from Blurry Monocular Video [18.424138608823267]
動きのぼかしに影響を受ける単眼ビデオから鋭い新しいビューを合成する動的放射場アプローチであるDyBluRFを提案する。入力画像中の動きのぼかしを考慮し、シーン内のカメラ軌跡とオブジェクト離散コサイン変換(DCT)トラジェクトリを同時にキャプチャする。
論文参考訳（メタデータ） (2024-03-15T08:48:37Z)
CTNeRF: Cross-Time Transformer for Dynamic Neural Radiance Field from Monocular Video [25.551944406980297]
複雑でダイナミックなシーンのモノクロ映像から高品質な新しいビューを生成するための新しいアプローチを提案する。物体の動きの特徴を集約するために,時間領域と周波数領域の両方で動作するモジュールを導入する。実験により,動的シーンデータセットにおける最先端手法に対する大幅な改善が示された。
論文参考訳（メタデータ） (2024-01-10T00:40:05Z)
Point-DynRF: Point-based Dynamic Radiance Fields from a Monocular Video [19.0733297053322]
本稿では,大域的幾何情報とボリュームレンダリング処理を,それぞれニューラルネットワークと動的放射場を用いて学習する点ベース動的放射場について紹介する。具体的には、幾何学的プロキシから直接ニューラルポイント雲を再構成し、提案した損失を用いて放射場と幾何学的プロキシの両方を最適化する。提案手法の有効性をNVIDIA Dynamic Scenesデータセットと因果的に捉えたモノクロビデオクリップを用いて検証した。
論文参考訳（メタデータ） (2023-10-14T19:27:46Z)
Learning to Fuse Monocular and Multi-view Cues for Multi-frame Depth Estimation in Dynamic Scenes [51.20150148066458]
一般化されたマスクを必要とせず,ボリュームとして符号化された多視点と単眼のキューを融合させる新しい手法を提案する。実世界のデータセットを用いた実験は,提案手法の有効性と性能を実証する。
論文参考訳（メタデータ） (2023-04-18T13:55:24Z)
DynIBaR: Neural Dynamic Image-Based Rendering [79.44655794967741]
複雑な動的シーンを描写したモノクロ映像から新しいビューを合成する問題に対処する。我々は,近傍のビューから特徴を集約することで,新しい視点を合成するボリューム画像ベースのレンダリングフレームワークを採用する。動的シーンデータセットにおける最先端手法の大幅な改善を示す。
論文参考訳（メタデータ） (2022-11-20T20:57:02Z)
DeepMultiCap: Performance Capture of Multiple Characters Using Sparse Multiview Cameras [63.186486240525554]
deep multicapは、スパースマルチビューカメラを用いたマルチパーソンパフォーマンスキャプチャのための新しい手法である。本手法では,事前走査型テンプレートモデルを用いることなく,時間変化した表面の詳細をキャプチャできる。
論文参考訳（メタデータ） (2021-05-01T14:32:13Z)
Editable Free-viewpoint Video Using a Layered Neural Representation [35.44420164057911]
我々は,スパース16カメラのみを用いた大規模ダイナミックシーンの編集可能な自由視点映像生成のための最初のアプローチを提案する。私たちのアプローチの核心は、環境そのものを含む各動的エンティティがST-NeRFと呼ばれる時空コヒーレントな神経層放射線表現に定式化される新しい階層化された神経表現です。実験は,ダイナミックシーンにおける高品質,フォトリアリスティック,編集可能な自由視点映像生成を実現するための手法の有効性を示す。
論文参考訳（メタデータ） (2021-04-30T06:50:45Z)
Event-based Motion Segmentation with Spatio-Temporal Graph Cuts [51.17064599766138]
イベントベースカメラで取得したオブジェクトを独立に識別する手法を開発した。この方法は、予想される移動物体の数を事前に決定することなく、技術状態よりも同等以上の性能を発揮する。
論文参考訳（メタデータ） (2020-12-16T04:06:02Z)
D-NeRF: Neural Radiance Fields for Dynamic Scenes [72.75686949608624]
そこで我々は,D-NeRF(D-NeRF)を動的領域に拡張する手法を提案する。 D-NeRFは、周囲を動き回るカメラから、剛体で非剛体な動きの下で物体のイメージを再構成する。我々は,剛体・調音・非剛体動作下での物体のシーンに対するアプローチの有効性を実証した。
論文参考訳（メタデータ） (2020-11-27T19:06:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。