論文の概要: Informative Object-centric Next Best View for Object-aware 3D Gaussian Splatting in Cluttered Scenes
- arxiv url: http://arxiv.org/abs/2602.08266v1
- Date: Mon, 09 Feb 2026 04:50:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.067078
- Title: Informative Object-centric Next Best View for Object-aware 3D Gaussian Splatting in Cluttered Scenes
- Title(参考訳): クラッタシーンにおける物体認識型3次元ガウス平滑化のためのインフォーマティブオブジェクト中心の次のベストビュー
- Authors: Seunghoon Jeong, Eunho Lee, Jeongyun Kim, Ayoung Kim,
- Abstract要約: 我々は、オブジェクトの特徴を活用して未探索領域を優先する、インスタンス対応Next Best View(NBV)ポリシーを導入する。
具体的には、オブジェクト認識3DGSは、信頼度重み付け情報ゲインを計算するために使用される1ホットオブジェクトベクターにインスタンスレベル情報を蒸留する。
実験により、NBVポリシーは、合成データセットで77.14%、現実世界のGraspNetデータセットで34.10%まで深さ誤差を減少させることが示された。
- 参考スコア(独自算出の注目度): 7.75982375074512
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In cluttered scenes with inevitable occlusions and incomplete observations, selecting informative viewpoints is essential for building a reliable representation. In this context, 3D Gaussian Splatting (3DGS) offers a distinct advantage, as it can explicitly guide the selection of subsequent viewpoints and then refine the representation with new observations. However, existing approaches rely solely on geometric cues, neglect manipulation-relevant semantics, and tend to prioritize exploitation over exploration. To tackle these limitations, we introduce an instance-aware Next Best View (NBV) policy that prioritizes underexplored regions by leveraging object features. Specifically, our object-aware 3DGS distills instancelevel information into one-hot object vectors, which are used to compute confidence-weighted information gain that guides the identification of regions associated with erroneous and uncertain Gaussians. Furthermore, our method can be easily adapted to an object-centric NBV, which focuses view selection on a target object, thereby improving reconstruction robustness to object placement. Experiments demonstrate that our NBV policy reduces depth error by up to 77.14% on the synthetic dataset and 34.10% on the real-world GraspNet dataset compared to baselines. Moreover, compared to targeting the entire scene, performing NBV on a specific object yields an additional reduction of 25.60% in depth error for that object. We further validate the effectiveness of our approach through real-world robotic manipulation tasks.
- Abstract(参考訳): 避けられない閉塞と不完全な観察を伴う散在するシーンでは、信頼できる表現を構築するためには、情報的視点を選択することが不可欠である。
この文脈では、3D Gaussian Splatting (3DGS) は、後続の視点の選択を明示的にガイドし、新しい観測で表現を洗練できるので、明確な利点をもたらす。
しかし、既存のアプローチは幾何学的手がかりにのみ依存し、操作に関連する意味論を無視し、探索よりも搾取を優先する傾向にある。
これらの制限に対処するために、オブジェクトの機能を活用して未探索領域を優先する、インスタンス対応のNext Best View(NBV)ポリシーを導入します。
具体的には、オブジェクト認識3DGSは、インスタンスレベルの情報を1ホットのオブジェクトベクトルに蒸留し、信頼度重み付けされた情報ゲインを計算し、誤って不確実なガウスに関連付けられた領域の識別を誘導する。
さらに,対象物に対するビュー選択に焦点を当てたオブジェクト中心のNBVに容易に適用でき,オブジェクト配置に対する再構成堅牢性を向上させることができる。
実験により、我々のNBVポリシーは、合成データセットで77.14%、現実のGraspNetデータセットで34.10%まで深さ誤差を減少させることが示された。
さらに、シーン全体のターゲットと比較すると、特定のオブジェクト上でNBVを実行すると、そのオブジェクトの深さ誤差が25.60%減少する。
実世界のロボット操作タスクによるアプローチの有効性をさらに検証する。
関連論文リスト
- OUGS: Active View Selection via Object-aware Uncertainty Estimation in 3DGS [14.124481717283544]
OUGSは3DGSの原則的、物理的に根拠のある不確実性定式化である。
我々の中心となる革新は、3Dガウス原始体の明示的な物理的パラメータから直接不確実性を引き出すことである。
この基盤により、セマンティックセグメンテーションマスクをシームレスに統合し、ターゲットとするオブジェクト認識の不確実性スコアを生成することができる。
論文 参考訳(メタデータ) (2025-11-12T15:08:46Z) - Object-Centric Representation Learning for Enhanced 3D Scene Graph Prediction [3.7471945679132594]
3Dセマンティックシーングラフ予測は、3Dシーンにおけるオブジェクトとその意味的関係を検出することを目的としている。
これまでの研究はデータセットの制限に対処し、Open-Vocabulary設定など、さまざまなアプローチを模索してきた。
本研究では,オブジェクトの特徴の質が全体のシーングラフの精度を決定する上で重要な役割を担っていることを示す。
論文 参考訳(メタデータ) (2025-10-06T11:33:09Z) - V-DETR: DETR with Vertex Relative Position Encoding for 3D Object
Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。
限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。
挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文 参考訳(メタデータ) (2023-08-08T17:14:14Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Objects as Spatio-Temporal 2.5D points [5.588892124219713]
本研究では,ネットワークの単一フィードフォワードパスにおける2次元物体検出シーンの深度予測を協調学習することにより,物体の3次元位置を推定する弱い教師付き手法を提案する。
提案手法は,単点型オブジェクト検出装置を拡張し,各オブジェクトを時間的にBEVとしてモデル化し,クエリ時に3DやBEVアノテーションやLiDARデータを必要としない新しいオブジェクト表現を提案する。
論文 参考訳(メタデータ) (2022-12-06T05:14:30Z) - ImpDet: Exploring Implicit Fields for 3D Object Detection [74.63774221984725]
我々は、境界ボックス回帰を暗黙の関数として見る新しい視点を導入する。
これは、Implicit DetectionまたはImpDetと呼ばれる提案されたフレームワークにつながります。
我々のImpDetは、異なる局所的な3次元空間の点に特定の値を割り当て、高品質な境界を生成することができる。
論文 参考訳(メタデータ) (2022-03-31T17:52:12Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - Object as Hotspots: An Anchor-Free 3D Object Detection Approach via
Firing of Hotspots [37.16690737208046]
オブジェクトレベルのアンカーを用いた既存のメソッドとは逆のアプローチを論じる。
構成モデルに着想を得て、内部の空でないボクセルの組成として、ホットスポットと呼ばれる物体を提案する。
提案手法は,OHSに基づく新しい地中真理割当て戦略を用いたアンカーフリー検出ヘッドを提案する。
論文 参考訳(メタデータ) (2019-12-30T03:02:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。