論文の概要: CAOA -- Completion-Assisted Object-CAD Alignment
- arxiv url: http://arxiv.org/abs/2606.18429v2
- Date: Thu, 18 Jun 2026 23:30:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-23 13:41:30.924147
- Title: CAOA -- Completion-Assisted Object-CAD Alignment
- Title(参考訳): CAOA -- 補完支援オブジェクトCADアライメント
- Authors: Hiranya Garbha Kumar, Minhas Kamal, Balakrishnan Prabhakaran,
- Abstract要約: 本稿では,意味的に認識された点群クラウド補完モジュールと対称性を考慮した相対的なポーズ推定アルゴリズムを統合する手法であるCompletion-Assisted Object-CAD Alignment (CAOA)を提案する。
既存の補完法は通常、合成データセットに基づいて訓練され、評価されるが、しばしば実世界のスキャンに一般化できない。
Scan2CADベンチマークでは、CAOAは最先端の手法よりも17%精度が向上している。
- 参考スコア(独自算出の注目度): 2.3895981099137535
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurately aligning CAD models to their corresponding objects in indoor RGB-D scans is a central challenge in 3D semantic reconstruction. The task requires estimating a 9-Degree-of-Freedom (DoF) pose-position, rotation, and scale along three axes-but is hindered by noisy and incomplete scans, as well as segmentation errors that cause geometric distortions. We present Completion-Assisted Object-CAD Alignment (CAOA), a method that integrates a semantically and contextually aware point cloud completion module with a symmetry-aware relative pose estimation algorithm, enabling precise alignment of CAD models to scanned objects. Existing completion methods are typically trained and evaluated on synthetic datasets, which often fail to generalize to real-world scans. To bridge this gap, we introduce a synthetic data generation strategy tailored to indoor scenes, significantly reducing the synthetic-to-real domain gap-validated through quantitative comparisons with widely used completion datasets. In addition, we release S2C-Completion, an expert-annotated dataset of over 8,500 object-CAD pairs from Scan2CAD, created for real-world indoor single-object completion and intended as a new benchmark for this task. For object-CAD alignment, we incorporate symmetry information via a symmetry-aware loss, improving robustness to symmetric ambiguities. On the Scan2CAD benchmark, CAOA achieves a 17% accuracy improvement over state-of-the-art methods.
- Abstract(参考訳): 屋内RGB-DスキャンにおいてCADモデルを対応するオブジェクトに正確に整列させることは,3Dセマンティック再構築において重要な課題である。
このタスクは、9自由度(DoF)のポーズ位置、回転、スケールを3つの軸に沿って推定する必要があるが、ノイズや不完全なスキャン、および幾何学的歪みを引き起こすセグメンテーション誤差によって妨げられる。
本稿では,意味的および文脈的に認識される点クラウド補完モジュールと対称性を考慮した相対ポーズ推定アルゴリズムを統合し,CADモデルをスキャン対象に正確にアライメントする手法であるCompletion-Assisted Object-CAD Alignment (CAOA)を提案する。
既存の補完法は通常、合成データセットに基づいて訓練され、評価されるが、しばしば実世界のスキャンに一般化できない。
このギャップを埋めるために,室内シーンに適した合成データ生成戦略を導入する。
さらに,Scan2CADから8,500以上のオブジェクト-CADペアからなるエキスパートアノテーション付きデータセットであるS2C-Completionをリリースし,本課題の新たなベンチマークを意図した。
オブジェクト-CADアライメントには、対称認識損失による対称性情報を導入し、対称性のあいまいさに対するロバスト性を改善する。
Scan2CADベンチマークでは、CAOAは最先端の手法よりも17%精度が向上している。
関連論文リスト
- CAD-to-CT Registration of Cylindrical Objects via Ellipse-Based Axis Estimation [29.039962620404822]
円筒状物体(電離チャンバー)の2段階形状登録法を提案する。
まず,3次元回転軸をCTスライスを横切る楕円断面を検出し,エッジ検出輪郭に楕円を嵌合させ,RANSAC除去後の楕円中心にPCAを施すことにより推定する。
第2に,CADモデルのボキセル化を行い,検出した軸に沿ってオリエントし,CTスキャンとのボリュームオーバーラップを最大化する。
論文 参考訳(メタデータ) (2026-06-01T22:33:40Z) - SPAN: Spatial-Projection Alignment for Monocular 3D Object Detection [49.12928389918159]
既存の単分子3D検出器は典型的には、切り離された予測パラダイムを通じて、3D境界ボックスの顕著な非線形回帰をテームする。
本稿では2つの主成分を持つ新しい空間射影アライメント(SPAN)を提案する。
SPANは、予測された3次元境界ボックスと接地した3次元境界ボックスの間に明らかに大域的な空間的制約を課し、それによって非結合な特性回帰による空間的ドリフトを補正する。
3D-2Dプロジェクションアライメントは、投影された3Dボックスが、画像平面上の対応する2D検出バウンディングボックス内に密に整列していることを保証する。
論文 参考訳(メタデータ) (2025-11-10T04:48:48Z) - Zero-shot Inexact CAD Model Alignment from a Single Image [53.37898107159792]
1つの画像から3Dシーン構造を推測する実践的なアプローチは、データベースから密に一致する3Dモデルを検索し、画像内のオブジェクトと整列させることである。
既存のメソッドは、イメージによる教師付きトレーニングとアノテーションのポーズに依存しており、オブジェクトカテゴリの狭いセットに制限されている。
ポーズアノテーションを必要とせず、未知のカテゴリに一般化する不正確な3次元モデルの弱い教師付き9-DoFアライメント法を提案する。
論文 参考訳(メタデータ) (2025-07-04T04:46:59Z) - GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency [50.11520458252128]
既存の3Dアベイランス学習手法は、注釈付きデータに制限があるため、一般化と堅牢性に苦慮している。
本稿では,大規模事前学習型2Dモデルを活用することで,3次元アベイランス学習の一般化と堅牢性を高めるための新しいフレームワークであるGEALを提案する。
GEALは、既存のメソッドと、新しいオブジェクトカテゴリ、および破損したデータにおいて、一貫して優れています。
論文 参考訳(メタデータ) (2024-12-12T17:59:03Z) - DiffCAD: Weakly-Supervised Probabilistic CAD Model Retrieval and Alignment from an RGB Image [34.47379913018661]
本稿では,RGB画像からのCAD検索とアライメントに対する,最初の弱教師付き確率的アプローチであるDiffCADを提案する。
我々はこれを条件付き生成タスクとして定式化し、拡散を利用して画像中のCADオブジェクトの形状、ポーズ、スケールをキャプチャする暗黙の確率モデルを学ぶ。
提案手法は, 合成データのみを用いて学習し, 単眼深度とマスク推定を利用して, 種々の実対象領域へのロバストなゼロショット適応を実現する。
論文 参考訳(メタデータ) (2023-11-30T15:10:21Z) - SCoDA: Domain Adaptive Shape Completion for Real Scans [78.92028595499245]
点雲からの3D形状の完成は、特に現実世界のオブジェクトのスキャンによる難しい作業である。
合成データから実スキャン形状完了の領域適応のための新しいタスクであるSCoDAを提案する。
本稿では,知識伝達のための新しいクロスドメイン機能融合手法と,実データからの堅牢な学習のための新しいボリューム一貫性の自己学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-20T09:38:26Z) - Weakly-Supervised End-to-End CAD Retrieval to Scan Objects [25.41908065938424]
本稿では,意味的および構造的に類似したCADモデルをクエリ3Dスキャンシーンに検索する手法を提案する。
提案手法では,トップモデルとスキャンクエリとの幾何的および知覚的類似性により,エンド・ツー・エンドのトレーニングを可能にする。
論文 参考訳(メタデータ) (2022-03-24T06:30:47Z) - Geometry-Contrastive Transformer for Generalized 3D Pose Transfer [95.56457218144983]
この研究の直感は、与えられたメッシュ間の幾何学的不整合を強力な自己認識機構で知覚することである。
本研究では,グローバルな幾何学的不整合に対する3次元構造的知覚能力を有する新しい幾何学コントラスト変換器を提案する。
本稿では, クロスデータセット3次元ポーズ伝達タスクのための半合成データセットとともに, 潜時等尺正則化モジュールを提案する。
論文 参考訳(メタデータ) (2021-12-14T13:14:24Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - SceneCAD: Predicting Object Alignments and Layouts in RGB-D Scans [24.06640371472068]
本稿では,コモディティRGB-Dセンサからスキャンした3D環境の軽量CADによる表現を再構築する手法を提案する。
私たちのキーとなるアイデアは、CADモデルのアライメントとスキャンされたシーンのレイアウト推定の両方を共同で最適化することです。
論文 参考訳(メタデータ) (2020-03-27T20:17:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。