論文の概要: Benefit from Reference: Retrieval-Augmented Cross-modal Point Cloud Completion
- arxiv url: http://arxiv.org/abs/2507.14485v1
- Date: Sat, 19 Jul 2025 04:57:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:31.908755
- Title: Benefit from Reference: Retrieval-Augmented Cross-modal Point Cloud Completion
- Title(参考訳): Retrieval-Augmented Cross-modal Cloud Completion
- Authors: Hongye Hou, Liu Zhan, Yang Yang,
- Abstract要約: 本稿では,新たな検索強化ポイントクラウド補完フレームワークを提案する。
中心となる考え方は、クロスモーダル検索を完了タスクに組み込んで、構造的事前情報を学ぶことである。
本手法は細粒度点雲の生成に有効であることを示す。
- 参考スコア(独自算出の注目度): 3.2899630403451985
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Completing the whole 3D structure based on an incomplete point cloud is a challenging task, particularly when the residual point cloud lacks typical structural characteristics. Recent methods based on cross-modal learning attempt to introduce instance images to aid the structure feature learning. However, they still focus on each particular input class, limiting their generation abilities. In this work, we propose a novel retrieval-augmented point cloud completion framework. The core idea is to incorporate cross-modal retrieval into completion task to learn structural prior information from similar reference samples. Specifically, we design a Structural Shared Feature Encoder (SSFE) to jointly extract cross-modal features and reconstruct reference features as priors. Benefiting from a dual-channel control gate in the encoder, relevant structural features in the reference sample are enhanced and irrelevant information interference is suppressed. In addition, we propose a Progressive Retrieval-Augmented Generator (PRAG) that employs a hierarchical feature fusion mechanism to integrate reference prior information with input features from global to local. Through extensive evaluations on multiple datasets and real-world scenes, our method shows its effectiveness in generating fine-grained point clouds, as well as its generalization capability in handling sparse data and unseen categories.
- Abstract(参考訳): 不完全点雲に基づく3D構造全体の補完は、特に残差点雲が典型的な構造的特徴を欠いている場合、難しい作業である。
クロスモーダル学習に基づく最近の手法は、構造的特徴学習を支援するためにインスタンスイメージを導入しようとするものである。
しかし、それでも個々の入力クラスに集中し、生成能力を制限している。
本研究では,新たな検索強化点クラウド補完フレームワークを提案する。
その中核となる考え方は、クロスモーダル検索を完了タスクに組み込んで、類似した参照サンプルから構造的事前情報を学ぶことである。
具体的には,構造共有特徴エンコーダ (SSFE) を設計し, クロスモーダルな特徴を共同で抽出し, 参照特徴を先行として再構成する。
エンコーダの二重チャネル制御ゲートから恩恵を受け、基準試料の関連構造的特徴を高め、無関係な情報干渉を抑制する。
さらに、階層的な特徴融合機構を用いて、参照先行情報とグローバルからローカルへの入力特徴を統合するプログレッシブ検索拡張ジェネレータ(PRAG)を提案する。
提案手法は,複数のデータセットや実世界のシーンに対する広範な評価を通じて,細粒度点雲の生成における効果と,スパースデータや未知のカテゴリの処理における一般化能力を示す。
関連論文リスト
- RefComp: A Reference-guided Unified Framework for Unpaired Point Cloud Completion [53.28542050638217]
未完成のポイントクラウドコンプリートタスクは、基礎的な真実を持たないモデルを使用して、部分的なポイントクラウドを完成させることを目的としている。
既存の未ペアのポイントクラウド補完メソッドはクラスアウェアであり、すなわち、各オブジェクトクラスに別々のモデルが必要である。
そこで本稿では,Reference-guided Completion (RefComp) フレームワークを新たに提案する。
論文 参考訳(メタデータ) (2025-04-18T16:40:16Z) - Human as Points: Explicit Point-based 3D Human Reconstruction from Single-view RGB Images [71.91424164693422]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。
提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。
我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文 参考訳(メタデータ) (2023-11-06T05:52:29Z) - Point Cloud Completion Guided by Prior Knowledge via Causal Inference [19.935868881427226]
本稿では,ポイントPCと呼ばれる新たなクラウド完了タスクを提案する。
Point-PCはメモリネットワークを用いて形状の先行情報を検索し、因果推論モデルを設計し、欠落した形状情報をフィルタリングする。
ShapeNet-55、PCN、KITTIデータセットの実験結果から、Point-PCは最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-05-28T16:33:35Z) - FBNet: Feedback Network for Point Cloud Completion [35.89264923599902]
本稿では,ポイントクラウド補完のための新しいフィードバックネットワーク(FBNet)を提案する。
フィードバック接続を構築する上での最大の課題は、現在の機能とその後の機能とのミスマッチである。
これを解決するために、クロスアテンション戦略を通じて、クロスアテンショントランスフォーマーはフィードバック機能からの効率的な情報を利用する。
論文 参考訳(メタデータ) (2022-10-08T09:12:37Z) - MAPLE: Masked Pseudo-Labeling autoEncoder for Semi-supervised Point
Cloud Action Recognition [160.49403075559158]
本稿では,Pseudo-Labeling autoEncoder (textbfMAPLE) フレームワークを提案する。
特に、MAPLEのバックボーンとして、新規で効率的なtextbfDecoupled textbfspatial-textbftemporal TranstextbfFormer(textbfDestFormer)を設計する。
MAPLEは3つの公開ベンチマークにおいて優れた結果を得て、MSR-Action3の精度を8.08%向上させる。
論文 参考訳(メタデータ) (2022-09-01T12:32:40Z) - Point cloud completion on structured feature map with feedback network [28.710494879042002]
本稿では,FSNetを提案する。FSNetは,ポイントワイドな特徴を適応的に2次元構造的特徴マップに集約できる機能構造化モジュールである。
2次元畳み込みニューラルネットワークを用いて、FSNetから粗い完全点クラウドに特徴マップをデコードする。
点雲アップサンプリングネットワークを用いて、部分入力と粗い中間出力から高密度点雲を生成する。
論文 参考訳(メタデータ) (2022-02-17T10:59:40Z) - SRPCN: Structure Retrieval based Point Completion Network [9.456072124396231]
構造検索に基づくポイントコンプリートネットワーク(SRPCN)を提案する。
最初はk平均クラスタリングを使用して構造点を抽出し、それを分布に分散し、その後、完全な構造点雲を見つけるための計量としてKLディバージェンス(英語版)が用いられる。
実験により,本手法はより正確な結果が得られ,より強力な一般化能力を有することが示された。
論文 参考訳(メタデータ) (2022-02-06T01:20:50Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - Cascaded Refinement Network for Point Cloud Completion with
Self-supervision [74.80746431691938]
形状整形のための2分岐ネットワークを提案する。
第1分枝は、完全なオブジェクトを合成するためのカスケード形状補完サブネットワークである。
第2のブランチは、元の部分入力を再構築する自動エンコーダである。
論文 参考訳(メタデータ) (2020-10-17T04:56:22Z) - Detail Preserved Point Cloud Completion via Separated Feature
Aggregation [26.566021924980706]
ポイントクラウド形状の完成は、3Dビジョンとロボティクスにおいて難しい問題である。
グローバル・ローカル・フィーチャー・アグリゲーション(GLFA)と残像アグリゲーション(RFA)という2つの異なる特徴アグリゲーション戦略を提案する。
提案するネットワークは,特に細部保存における最先端技術よりも優れている。
論文 参考訳(メタデータ) (2020-07-05T16:11:55Z) - Point Cloud Completion by Skip-attention Network with Hierarchical
Folding [61.59710288271434]
本研究では,3Dポイントクラウド補完のためのSkip-Attention Network (SA-Net)を提案する。
まず,不完全点雲の局所構造を効果的に活用するためのスキップアテンション機構を提案する。
第二に、異なる解像度でスキップアテンション機構によって符号化された選択された幾何情報を完全に活用するために、新しい構造保存デコーダを提案する。
論文 参考訳(メタデータ) (2020-05-08T06:23:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。