論文の概要: DinoComplete: 3D Shape Completion with Distilled Semantic Priors and State Space Models
- arxiv url: http://arxiv.org/abs/2605.26949v1
- Date: Tue, 26 May 2026 12:40:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.091567
- Title: DinoComplete: 3D Shape Completion with Distilled Semantic Priors and State Space Models
- Title(参考訳): DinoComplete: 蒸留セマンティックプリミティブと状態空間モデルによる3次元形状補完
- Authors: Furkan Mert Algan, Eckehard Steinbach,
- Abstract要約: 本稿では,Dino特徴から抽出したセマンティックプリエントを用いて幾何学的再構築を行うフレームワークであるDinoCompleteを紹介する。
未確認のShapeNetカテゴリとScanNetオブジェクトの実験により、DinoCompleteは、以前の決定論的および生成的ベースコンプリートメソッドよりも高いコンプリート品質を達成することが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D shape completion from partial scans remains challenging for unseen categories and noisy real-world observations, where geometry alone is often insufficient for inferring missing structure. We present DinoComplete, a deterministic and efficient shape completion framework that augments geometric reconstruction with voxel-aligned semantic priors distilled from DINO features. First, we construct multi-view DINO feature volumes aligned with ShapeNet data and train a student network to predict dense semantic features directly from incomplete shapes. These predicted features capture global structure and part-aware semantic context while remaining aligned with the underlying geometry. We then integrate these distilled features into a completion network, where geometric and semantic voxel representations are fused through voxel state-space modeling. To enable efficient long-range reasoning without sacrificing resolution, we introduce a multi-scale voxel Mamba module that refines the fused features by combining full-grid and chunk-wise sequence modeling. Experiments on unseen ShapeNet categories and ScanNet objects show that DinoComplete achieves stronger completion quality than prior deterministic and generative based completion methods while using fewer parameters, requiring lower memory, and achieving faster inference. Our results demonstrate that distilling semantic priors from visual foundation models improves generalization and robustness in 3D shape completion.
- Abstract(参考訳): 部分走査による3次元形状の完成は、未知のカテゴリーやノイズの多い実世界の観測では依然として困難であり、幾何学だけでは欠落した構造を推測するには不十分である。
DINOの特徴から抽出したボクセル配列のセマンティック・プレセットを用いて幾何学的再構成を増強する決定論的かつ効率的な形状完備化フレームワークであるDinoCompleteを提案する。
まず,ShapeNetデータに整合した多視点DINO特徴量を構築し,不完全形状から直接密接な意味的特徴を予測するために学生ネットワークを訓練する。
これらの予測機能は、下層の幾何学と整合しながら、グローバル構造と部分認識のセマンティックコンテキストをキャプチャする。
次に、これらの蒸留された特徴を補完ネットワークに統合し、幾何学的および意味的なボクセル表現をボクセル状態空間モデリングによって融合する。
分解能を犠牲にすることなく、効率的な長距離推論を可能にするために、フルグリッドとチャンクワイド・シーケンス・モデリングを組み合わせることで、融合した特徴を洗練するマルチスケールのボクセル・マンバ・モジュールを導入する。
未確認のShapeNetカテゴリとScanNetオブジェクトの実験では、DinoCompleteは、パラメータを少なくし、メモリを小さくし、より高速な推論をしながら、以前の決定的および生成的な補完方法よりも高い完成品質を達成する。
本研究は, 視覚基盤モデルから抽出したセマンティックオーダが, 3次元形状完成における一般化とロバスト性を向上させることを実証した。
関連論文リスト
- Rethinking Multimodal Point Cloud Completion: A Completion-by-Correction Perspective [8.276620253870338]
ポイント雲の完成は、部分的な観測から完全な3次元形状を再構築することを目的としている。
ほとんどのメソッドは、いまだにCompletion-by-Inpaintingパラダイムに従っている。
完全形状から始まるコンプリーション・バイ・コレクション(Completion-by-Correction)を提案する。
論文 参考訳(メタデータ) (2025-11-15T11:51:13Z) - ArchComplete: Autoregressive 3D Architectural Design Generation with Hierarchical Diffusion-Based Upsampling [0.0]
ArchCompleteはベクトル量子化モデルからなる2段階のボクセルベースの3D生成パイプラインである。
パイプラインのキーとなるのは、(i) 2.5Dの知覚的損失とともに最適化された、ローカルなパッチ埋め込みのコンテキスト的にリッチなコードブックを学習することです。
ArchCompleteは643ドルという解像度で自動回帰的にモデルを生成し、それを5123ドルまで改良する。
論文 参考訳(メタデータ) (2024-12-23T20:13:27Z) - Unsupervised 3D Point Cloud Completion via Multi-view Adversarial Learning [61.14132533712537]
MAL-UPCは、領域レベルとカテゴリ固有の幾何学的類似性の両方を効果的に活用するフレームワークである。
我々のMAL-UPCは3Dの完全な監視を一切必要とせず、トレーニングセットにおける一視点部分的な観察のみを必要とする。
論文 参考訳(メタデータ) (2024-07-13T06:53:39Z) - Robust 3D Tracking with Quality-Aware Shape Completion [67.9748164949519]
そこで本研究では,高密度および完全点の雲からなる合成対象表現について,ロバストな3次元追跡のための形状完備化により正確に表現する。
具体的には, 形状が整ったボキセル化3次元追跡フレームワークを設計し, ノイズのある歴史的予測の悪影響を軽減するために, 品質に配慮した形状完備化機構を提案する。
論文 参考訳(メタデータ) (2023-12-17T04:50:24Z) - DeFormer: Integrating Transformers with Deformable Models for 3D Shape
Abstraction from a Single Image [31.154786931081087]
本稿では,パラメータ化デフォルマブルモデルと統合された新しいバイチャネルトランスフォーマアーキテクチャを提案し,プリミティブのグローバルおよび局所的な変形を同時に推定する。
DeFormerは、最先端技術よりもより良い再構築精度を実現し、一貫したセマンティック対応で可視化し、解釈性を向上させる。
論文 参考訳(メタデータ) (2023-09-22T02:46:43Z) - DiffComplete: Diffusion-based Generative 3D Shape Completion [114.43353365917015]
3次元レンジスキャンにおける形状完成のための拡散に基づく新しいアプローチを提案する。
私たちはリアリズム、マルチモダリティ、高忠実さのバランスを取ります。
DiffCompleteは2つの大規模3次元形状補完ベンチマークに新しいSOTA性能を設定する。
論文 参考訳(メタデータ) (2023-06-28T16:07:36Z) - Variational Relational Point Completion Network for Robust 3D
Classification [59.80993960827833]
可変点雲補完法は、局所的な詳細を欠くため、大域的な形状の骨格を生成する傾向がある。
本稿では2つの魅力的な特性を持つ変分フレームワークであるポイントコンプリートネットワーク(VRCNet)を提案する。
VRCNetは、現実世界のポイントクラウドスキャンにおいて、非常に一般化性と堅牢性を示している。
論文 参考訳(メタデータ) (2023-04-18T17:03:20Z) - MFM-Net: Unpaired Shape Completion Network with Multi-stage Feature
Matching [38.63975659511946]
我々は、幾何学的対応の学習を多段階に分解する、MFM-Netと呼ばれる新しい不対形状完備ネットワークを提案する。
MFM-Netは、完全な形状と不完全な形状の間の幾何学的対応を確立するために、より包括的な理解を利用する。
論文 参考訳(メタデータ) (2021-11-23T16:10:06Z) - Implicit Functions in Feature Space for 3D Shape Reconstruction and
Completion [53.885984328273686]
Implicit Feature Networks (IF-Nets) は連続的な出力を提供し、複数のトポロジを扱える。
IF-NetsはShapeNetにおける3次元オブジェクト再構成における先行作業よりも明らかに優れており、より正確な3次元人間の再構成が得られる。
論文 参考訳(メタデータ) (2020-03-03T11:14:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。