論文の概要: IDDR-NGP: Incorporating Detectors for Distractor Removal with Instant Neural Radiance Field
- arxiv url: http://arxiv.org/abs/2601.11030v1
- Date: Fri, 16 Jan 2026 06:51:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-19 20:21:50.381415
- Title: IDDR-NGP: Incorporating Detectors for Distractor Removal with Instant Neural Radiance Field
- Title(参考訳): IDDR-NGP:Instant Neural Radiance Fieldを用いたディトラクタ除去用検出器
- Authors: Xianliang Huang, Jiajie Gou, Shuhang Chen, Zhizhou Zhong, Jihong Guan, Shuigeng Zhou,
- Abstract要約: 本稿では,Instant-NPGを直接操作するIDDR-NGPという,最初の統合型トラクタ除去手法を提案する。
この方法では、スノーフレーク、紙吹雪、剥離、花びらなどの3Dシーンにおいて、幅広い注意をそらすことができる。
- 参考スコア(独自算出の注目度): 30.31998774369681
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents the first unified distractor removal method, named IDDR-NGP, which directly operates on Instant-NPG. The method is able to remove a wide range of distractors in 3D scenes, such as snowflakes, confetti, defoliation and petals, whereas existing methods usually focus on a specific type of distractors. By incorporating implicit 3D representations with 2D detectors, we demonstrate that it is possible to efficiently restore 3D scenes from multiple corrupted images. We design the learned perceptual image patch similarity~( LPIPS) loss and the multi-view compensation loss (MVCL) to jointly optimize the rendering results of IDDR-NGP, which could aggregate information from multi-view corrupted images. All of them can be trained in an end-to-end manner to synthesize high-quality 3D scenes. To support the research on distractors removal in implicit 3D representations, we build a new benchmark dataset that consists of both synthetic and real-world distractors. To validate the effectiveness and robustness of IDDR-NGP, we provide a wide range of distractors with corresponding annotated labels added to both realistic and synthetic scenes. Extensive experimental results demonstrate the effectiveness and robustness of IDDR-NGP in removing multiple types of distractors. In addition, our approach achieves results comparable with the existing SOTA desnow methods and is capable of accurately removing both realistic and synthetic distractors.
- Abstract(参考訳): 本稿では,Instant-NPGを直接操作するIDDR-NGPという,最初の統合型トラクタ除去手法を提案する。
この方法は、スノーフレーク、紙吹雪、剥離、花びらなどの3Dシーンで広範囲に散らばりを除去することができるが、既存の手法は通常、特定の種類の散らばりにフォーカスする。
暗黙的な3D表現を2D検出器に組み込むことで、複数の劣化画像から3Dシーンを効率よく復元できることを実証する。
学習した知覚的画像パッチ類似度~(LPIPS)損失と多視点補償損失(MVCL)を設計し、多視点劣化画像からの情報を集約できるIDDR-NGPのレンダリング結果を共同で最適化する。
これらはすべて、高品質な3Dシーンを合成するためにエンドツーエンドでトレーニングすることができる。
暗黙的な3次元表現におけるイントラクタ除去の研究を支援するため、我々は合成と現実世界の両方のイントラクタからなる新しいベンチマークデータセットを構築した。
IDDR-NGPの有効性とロバスト性を検証するため,実写シーンと合成シーンの両方にアノテートラベルを付加した多種多様なイントラクタを提供する。
広範囲な実験結果から,IDDR-NGPの多型間欠泉除去効果とロバスト性が確認された。
さらに,本手法は既存のSOTAデノウ法に匹敵する結果を達成し,現実的および合成的トラクタの両方を正確に除去することができる。
関連論文リスト
- Mono3DV: Monocular 3D Object Detection with 3D-Aware Bipartite Matching and Variational Query DeNoising [0.6423989407081764]
Mono3DVは3Dオブジェクト検出のためのトランスフォーマーベースの新しいフレームワークである。
我々は,3次元幾何情報を直接マッチングコストに組み込む3D-Aware Bipartite Matching戦略を開発した。
第二に、3D属性を統合する際に生じる不安定性を解決するために、バイパートマッチングを安定化させることが重要である。
論文 参考訳(メタデータ) (2026-01-03T02:06:28Z) - Robust 3D Gaussian Splatting for Novel View Synthesis in Presence of Distractors [44.55317154371679]
3D Gaussian Splattingは素晴らしいビュー合成結果を示している。
静的なシーンの入力データを汚染する動的オブジェクトに対して脆弱である。
提案手法は,多種多様な気晴らしに対して堅牢であり,気晴らしシーンのレンダリング品質を著しく向上することを示す。
論文 参考訳(メタデータ) (2024-08-21T15:21:27Z) - ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic
Reconstruction [62.599588577671796]
本稿では,RGB-Dフレームのストリームから3次元セマンティックマップを段階的に再構成するオンライン3次元セマンティックセマンティックセマンティクス手法を提案する。
オフラインの手法とは異なり、ロボット工学や混合現実のようなリアルタイムな制約のあるシナリオに直接適用できます。
論文 参考訳(メタデータ) (2023-11-29T20:30:18Z) - JOTR: 3D Joint Contrastive Learning with Transformers for Occluded Human
Mesh Recovery [84.67823511418334]
本稿では,3次元メッシュ復元のためのTRansformersフレームワークを用いた3次元ジョイントコントラスト学習について述べる。
提案手法は,2D$&$3D対応結果を得るために,2Dおよび3D表現を融合するエンコーダ・デコーダ変換器アーキテクチャを含む。
論文 参考訳(メタデータ) (2023-07-31T02:58:58Z) - DiffuPose: Monocular 3D Human Pose Estimation via Denoising Diffusion
Probabilistic Model [25.223801390996435]
本稿では,1つの2次元キーポイント検出から3次元ポーズを再構築することに焦点を当てた。
我々は,市販の2D検出器から多種多様な3Dポーズを効果的にサンプリングするための,拡散に基づく新しいフレームワークを構築した。
我々は,広く採用されているHuman3.6MとHumanEva-Iデータセットについて評価を行った。
論文 参考訳(メタデータ) (2022-12-06T07:22:20Z) - Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。
提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文 参考訳(メタデータ) (2022-04-02T03:48:03Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。