論文の概要: Object-Centric 2D Gaussian Splatting: Background Removal and Occlusion-Aware Pruning for Compact Object Models
- arxiv url: http://arxiv.org/abs/2501.08174v1
- Date: Tue, 14 Jan 2025 14:56:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-15 13:29:10.156063
- Title: Object-Centric 2D Gaussian Splatting: Background Removal and Occlusion-Aware Pruning for Compact Object Models
- Title(参考訳): 物体中心2次元ガウススプラッティング:コンパクト物体モデルに対する背景除去と咬合認識プルーニング
- Authors: Marcel Rogge, Didier Stricker,
- Abstract要約: 現在のガウシアン・スプレイティング・アプローチはシーン全体を再構築するのに有効であるが、特定の対象をターゲットするオプションがない。
本研究では,対象のマスクを応用して対象の再構成を可能にし,オブジェクト中心モデルを実現する手法を提案する。
提案手法は,オブジェクト中心のガウス表現とメッシュ表現を最大96%,学習速度を最大71%向上するコンパクトオブジェクトモデルを再構成する。
- 参考スコア(独自算出の注目度): 14.555667193538879
- License:
- Abstract: Current Gaussian Splatting approaches are effective for reconstructing entire scenes but lack the option to target specific objects, making them computationally expensive and unsuitable for object-specific applications. We propose a novel approach that leverages object masks to enable targeted reconstruction, resulting in object-centric models. Additionally, we introduce an occlusion-aware pruning strategy to minimize the number of Gaussians without compromising quality. Our method reconstructs compact object models, yielding object-centric Gaussian and mesh representations that are up to 96\% smaller and up to 71\% faster to train compared to the baseline while retaining competitive quality. These representations are immediately usable for downstream applications such as appearance editing and physics simulation without additional processing.
- Abstract(参考訳): 現在のガウシアン・スプレイティング・アプローチはシーン全体を再構築するのに有効であるが、特定の対象を対象とするオプションがないため、計算コストが高く、オブジェクト固有のアプリケーションには適さない。
本研究では,対象のマスクを応用して対象の再構成を可能にし,オブジェクト中心モデルを実現する手法を提案する。
さらに, 品質を損なうことなく, ガウス人の数を最小限に抑えるオクルージョン・アウェア・プルーニング戦略を導入する。
提案手法は, 物体中心のガウス表現とメッシュ表現を最大96 %, 学習速度が71 %まで向上し, 競争品質を維持しながら, コンパクトな物体モデルを再構成する。
これらの表現は、外見の編集や物理シミュレーションのような下流のアプリケーションに、追加の処理なしですぐに利用することができる。
関連論文リスト
- A Novel Unified Architecture for Low-Shot Counting by Detection and Segmentation [10.461109095311546]
ローショットオブジェクトカウンタは、注釈付き例題をほとんどあるいは全く使用せずに画像内のオブジェクト数を推定する。
既存のアプローチは、しばしば過一般化と偽陽性検出につながる。
本稿では,オブジェクト検出,セグメンテーション,カウント推定を行う新しいローショットカウンタであるGeCoを紹介する。
論文 参考訳(メタデータ) (2024-09-27T12:20:29Z) - GaussianObject: High-Quality 3D Object Reconstruction from Four Views with Gaussian Splatting [82.29476781526752]
高度にスパースな視点から3Dオブジェクトを再構成・レンダリングすることは、3Dビジョン技術の応用を促進する上で非常に重要である。
GaussianObjectは、Gaussian splattingで3Dオブジェクトを表現してレンダリングするフレームワークで、4つの入力イメージだけで高いレンダリング品質を実現する。
GaussianObjectは、MipNeRF360、OmniObject3D、OpenIllumination、および私たちが収集した未提示画像など、いくつかの挑戦的なデータセットで評価されている。
論文 参考訳(メタデータ) (2024-02-15T18:42:33Z) - Leveraging Positional Encoding for Robust Multi-Reference-Based Object
6D Pose Estimation [21.900422840817726]
物体の姿勢を正確に推定することは、コンピュータビジョンとロボット工学において重要な課題である。
本稿では,これらの制約を分析し,克服するための新しい戦略を提案する。
Linemod、Linemod-Occlusion、およびYCB-Videoデータセットに関する我々の実験は、我々のアプローチが既存の手法より優れていることを示している。
論文 参考訳(メタデータ) (2024-01-29T16:42:15Z) - Dynamic Tiling: A Model-Agnostic, Adaptive, Scalable, and
Inference-Data-Centric Approach for Efficient and Accurate Small Object
Detection [3.8332251841430423]
Dynamic Tilingは、小さなオブジェクト検出のためのモデルに依存しない、適応的でスケーラブルなアプローチである。
本手法は, フラグメントオブジェクトを効果的に解決し, 検出精度を向上し, 計算オーバーヘッドを最小限に抑える。
全体として、Dynamic Tilingは既存のモデルに依存しない一様収穫法よりも優れている。
論文 参考訳(メタデータ) (2023-09-20T05:25:12Z) - PoseMatcher: One-shot 6D Object Pose Estimation by Deep Feature Matching [51.142988196855484]
本稿では,PoseMatcherを提案する。
3ビューシステムに基づくオブジェクトと画像のマッチングのための新しいトレーニングパイプラインを作成します。
PoseMatcherは、画像とポイントクラウドの異なる入力モダリティに対応できるように、IO-Layerを導入します。
論文 参考訳(メタデータ) (2023-04-03T21:14:59Z) - Language model compression with weighted low-rank factorization [73.61874728240568]
本稿では,モデル予測に影響を及ぼすパラメータの重要性を評価するために,フィッシャー情報を紹介する。
結果のタスク精度は、元のモデルの性能にかなり近いことがわかった。
提案手法は,タスク固有のモデルを直接圧縮し,他のコンパクトモデル戦略よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-06-30T21:57:07Z) - IFOR: Iterative Flow Minimization for Robotic Object Rearrangement [92.97142696891727]
IFOR(Iterative Flow Minimization for Robotic Object Rearrangement)は、未知物体の物体再構成問題に対するエンドツーエンドの手法である。
本手法は,合成データのみを訓練しながら,散在するシーンや実世界に適用可能であることを示す。
論文 参考訳(メタデータ) (2022-02-01T20:03:56Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。