論文の概要: Has Anything Changed? 3D Change Detection by 2D Segmentation Masks
- arxiv url: http://arxiv.org/abs/2312.01148v1
- Date: Sat, 2 Dec 2023 14:30:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-05 18:52:19.678497
- Title: Has Anything Changed? 3D Change Detection by 2D Segmentation Masks
- Title(参考訳): 何か変わったか?
2次元分割マスクによる3次元変化検出
- Authors: Aikaterini Adam, Konstantinos Karantzalos, Lazaros Grammatikopoulos,
Torsten Sattler
- Abstract要約: 内部空間の3次元スキャンを日常的に取得する。
この情報は、没入型仮想体験で操作するために、ロボットやAR、VRデバイスにとって重要である。
本研究では,シーン内に存在するオブジェクトの事前知識を必要とせずに,オブジェクトの追加,移動,削除を未監視で検出するオブジェクト発見手法を提案する。
- 参考スコア(独自算出の注目度): 27.15724607877779
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As capturing devices become common, 3D scans of interior spaces are acquired
on a daily basis. Through scene comparison over time, information about objects
in the scene and their changes is inferred. This information is important for
robots and AR and VR devices, in order to operate in an immersive virtual
experience. We thus propose an unsupervised object discovery method that
identifies added, moved, or removed objects without any prior knowledge of what
objects exist in the scene. We model this problem as a combination of a 3D
change detection and a 2D segmentation task. Our algorithm leverages generic 2D
segmentation masks to refine an initial but incomplete set of 3D change
detections. The initial changes, acquired through render-and-compare likely
correspond to movable objects. The incomplete detections are refined through
graph optimization, distilling the information of the 2D segmentation masks in
the 3D space. Experiments on the 3Rscan dataset prove that our method
outperforms competitive baselines, with SoTA results.
- Abstract(参考訳): 捕獲装置が一般的になると、内部空間の3dスキャンは日常的に取得される。
シーン比較を通じて、シーン内のオブジェクトとその変更に関する情報が推測される。
この情報は、没入型仮想体験で操作するために、ロボットやAR、VRデバイスにとって重要である。
そこで我々は,シーン内に存在するオブジェクトを事前に知ることなく,追加,移動,削除したオブジェクトを識別する教師なしオブジェクト発見手法を提案する。
この問題を3次元変化検出と2次元分割タスクの組み合わせとしてモデル化する。
提案アルゴリズムは汎用2次元セグメンテーションマスクを利用して,初期かつ不完全な3次元変化検出を改良する。
レンダリングとコンプリートによって取得された最初の変更は、おそらく可動オブジェクトに対応する。
不完全検出は、グラフ最適化により洗練され、3次元空間における2次元セグメンテーションマスクの情報を蒸留する。
3Rscanデータセットの実験は、SoTAの結果により、我々の手法が競争ベースラインより優れていることを証明している。
関連論文リスト
- 3DGS-CD: 3D Gaussian Splatting-based Change Detection for Physical Object Rearrangement [2.2122801766964795]
3DGS-CDは3Dシーンにおける物体の物理的配置を検出する最初の3Dガウス散乱(3DGS)に基づく手法である。
提案手法では,異なる時間に撮影された2つの不整合画像を比較して3次元オブジェクトレベルの変化を推定する。
本手法は,18秒以内のスパース・ポスト・チェンジ画像を用いて,1枚の新しい画像のみを用いて,散在する環境の変化を検出できる。
論文 参考訳(メタデータ) (2024-11-06T07:08:41Z) - Segment Anything in 3D with Radiance Fields [83.14130158502493]
本稿では,Segment Anything Model (SAM) を一般化して3次元オブジェクトをセグメント化する。
提案手法をSA3D, 略してSegment Anything in 3Dと呼ぶ。
実験では,SA3Dが様々なシーンに適応し,数秒で3Dセグメンテーションを実現することを示す。
論文 参考訳(メタデータ) (2023-04-24T17:57:15Z) - CMR3D: Contextualized Multi-Stage Refinement for 3D Object Detection [57.44434974289945]
本稿では,3次元オブジェクト検出(CMR3D)フレームワークのためのコンテキスト型マルチステージリファインメントを提案する。
我々のフレームワークは3Dシーンを入力として取り、シーンの有用なコンテキスト情報を明示的に統合しようと試みている。
3Dオブジェクトの検出に加えて,3Dオブジェクトカウント問題に対するフレームワークの有効性について検討する。
論文 参考訳(メタデータ) (2022-09-13T05:26:09Z) - Objects Can Move: 3D Change Detection by Geometric Transformation
Constistency [32.07372152138814]
AR/VRアプリケーションとロボットは、シーンがいつ変わったかを知る必要がある。
本研究では,シーン変化のみに基づく3次元オブジェクト探索手法を提案する。
我々の手法は、オブジェクトが何であるかの仮定を符号化する必要はないが、その代わりに、一貫性のある動きを利用してオブジェクトを発見する。
論文 参考訳(メタデータ) (2022-08-21T11:32:47Z) - HyperDet3D: Learning a Scene-conditioned 3D Object Detector [154.84798451437032]
本研究では3次元物体検出のためのシーン条件付き事前知識を探索するためにHyperDet3Dを提案する。
我々のHyperDet3Dは、ScanNetとSUN RGB-Dデータセットの3Dオブジェクト検出ベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2022-04-12T07:57:58Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection [78.00922683083776]
一般的な2D検出器をこの3Dタスクで動作させることは簡単ではない。
本報告では,完全畳み込み型単段検出器を用いた手法を用いてこの問題を考察する。
私たちのソリューションは、NeurIPS 2020のnuScenes 3D検出チャレンジのすべてのビジョンのみの方法の中で1位を獲得します。
論文 参考訳(メタデータ) (2021-04-22T09:35:35Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。