論文の概要: PuzzleFusion++: Auto-agglomerative 3D Fracture Assembly by Denoise and Verify
- arxiv url: http://arxiv.org/abs/2406.00259v1
- Date: Sat, 1 Jun 2024 01:49:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 07:54:19.455048
- Title: PuzzleFusion++: Auto-agglomerative 3D Fracture Assembly by Denoise and Verify
- Title(参考訳): PuzzleFusion++: DenoiseとVerifyによる自動凝集型3Dフラクチャアセンブリ
- Authors: Zhengqing Wang, Jiacheng Chen, Yasutaka Furukawa,
- Abstract要約: 本稿では,人間が空間パズルを解く方法に類似した,新しい「自動凝集型」3次元フラクチャーアセンブリ手法であるPuzzleFusion++を提案する。
Breaking Badデータセットの実験は、PuzzleFusion++が他の最先端技術よりも優れていることを示している。
- 参考スコア(独自算出の注目度): 22.056283158354137
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a novel "auto-agglomerative" 3D fracture assembly method, PuzzleFusion++, resembling how humans solve challenging spatial puzzles. Starting from individual fragments, the approach 1) aligns and merges fragments into larger groups akin to agglomerative clustering and 2) repeats the process iteratively in completing the assembly akin to auto-regressive methods. Concretely, a diffusion model denoises the 6-DoF alignment parameters of the fragments simultaneously, and a transformer model verifies and merges pairwise alignments into larger ones, whose process repeats iteratively. Extensive experiments on the Breaking Bad dataset show that PuzzleFusion++ outperforms all other state-of-the-art techniques by significant margins across all metrics, in particular by over 10% in part accuracy and 50% in Chamfer distance. The code will be available on our project page: https://puzzlefusion-plusplus.github.io.
- Abstract(参考訳): 本稿では,人間が難解な空間パズルを解く方法に類似した,新しい「自動凝集型」3次元フラクチャーアセンブリ手法であるPuzzleFusion++を提案する。
個々の断片から始まるアプローチ
1) フラグメントをアグリメティブクラスタリングに似た大きなグループにアライメントし、マージする。
2) 自動回帰法に似たアセンブリの完了時に反復的にプロセスを繰り返す。
具体的には、拡散モデルがフラグメントの6-DoFアライメントパラメータを同時に認知し、トランスフォーマーモデルがペアワイズアライメントを検証してマージし、そのプロセスが反復的に繰り返される。
Breaking Badデータセットに関する大規模な実験によると、PuzzleFusion++はすべてのメトリクス、特に部分精度が10%以上、Chamfer距離が50%以上、他の最先端技術よりも優れています。
コードはプロジェクトのページで公開されます。
関連論文リスト
- 3D Geometric Shape Assembly via Efficient Point Cloud Matching [59.241448711254485]
Proxy Match Transform (PMT) は、部品の配向面間の信頼性の高いマッチングを可能にする、高次特徴変換層である。
PMT を基盤として,幾何学的組立作業のための新しいフレームワーク Proxy Match TransformeR (PMTR) を導入する。
我々は,Breaking Badの大規模3次元幾何形状集合ベンチマークデータセットを用いてPMTRの評価を行った。
論文 参考訳(メタデータ) (2024-07-15T08:50:02Z) - DiffAssemble: A Unified Graph-Diffusion Model for 2D and 3D Reassembly [21.497180110855975]
グラフニューラルネットワーク(GNN)ベースのアーキテクチャであるDiffAssembleを導入する。
本手法は,空間グラフのノードとして,2次元パッチや3次元オブジェクトフラグメントなどの集合の要素を扱う。
我々は、最も高速な最適化に基づくパズル解法よりも11倍高速に実行された、実行時間の大幅な削減を強調した。
論文 参考訳(メタデータ) (2024-02-29T16:09:12Z) - DiffComplete: Diffusion-based Generative 3D Shape Completion [114.43353365917015]
3次元レンジスキャンにおける形状完成のための拡散に基づく新しいアプローチを提案する。
私たちはリアリズム、マルチモダリティ、高忠実さのバランスを取ります。
DiffCompleteは2つの大規模3次元形状補完ベンチマークに新しいSOTA性能を設定する。
論文 参考訳(メタデータ) (2023-06-28T16:07:36Z) - PuzzleFusion: Unleashing the Power of Diffusion Models for Spatial
Puzzle Solving [17.781484376483707]
本稿では,空間パズル解決のための拡散モデルに基づくエンドツーエンドのニューラルネットワークアーキテクチャを提案する。
驚くべき発見は、拡散モデルを用いることで、条件生成プロセスとしてこれらの困難な空間パズルタスクを効果的に解決できるということである。
エンド・ツー・エンドのニューラル・システムの学習を可能にするため,本論文では,地軸配置による新しいデータセットを提案する。
論文 参考訳(メタデータ) (2022-11-24T20:06:11Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - GANzzle: Reframing jigsaw puzzle solving as a retrieval task using a
generative mental image [15.132848477903314]
すべての部品からメンタルなイメージを推測し、その部品を爆発を避けるためにマッチさせることができる。
本研究では,未整列片の集合が与えられた画像の再構成方法を学び,各部品の符号化を発電機の収穫層に整合させる共同埋め込み空間を学習する。
このような場合、我々のモデルはパズルのサイズに依存しないが、従来の1つの大きさの深層学習法とは対照的である。
論文 参考訳(メタデータ) (2022-07-12T16:02:00Z) - MaskGroup: Hierarchical Point Grouping and Masking for 3D Instance
Segmentation [36.28586460186891]
本稿では,ロボット工学や拡張現実といった現実的な応用の多種多様な3Dインスタンスセグメンテーション問題について検討する。
本稿では,3Dインスタンスをグループ化し,洗練するための新しいフレームワークを提案する。
提案手法は,ScanNetV2テストセットの0.5IoU閾値で66.4%のmAPを達成する。
論文 参考訳(メタデータ) (2022-03-28T11:22:58Z) - Augmenting Convolutional networks with attention-based aggregation [55.97184767391253]
我々は,非局所的推論を実現するために,注目に基づくグローバルマップを用いた畳み込みネットワークの強化方法を示す。
この学習集約層を2つのパラメータ(幅と深さ)でパラメータ化した単純パッチベースの畳み込みネットワークで接続する。
これは、特にメモリ消費の点で、精度と複雑さの間の驚くほど競争力のあるトレードオフをもたらす。
論文 参考訳(メタデータ) (2021-12-27T14:05:41Z) - MFM-Net: Unpaired Shape Completion Network with Multi-stage Feature
Matching [38.63975659511946]
我々は、幾何学的対応の学習を多段階に分解する、MFM-Netと呼ばれる新しい不対形状完備ネットワークを提案する。
MFM-Netは、完全な形状と不完全な形状の間の幾何学的対応を確立するために、より包括的な理解を利用する。
論文 参考訳(メタデータ) (2021-11-23T16:10:06Z) - Deep Hough Voting for Robust Global Registration [52.40611370293272]
6次元変換パラメータ空間におけるハフ投票を利用した実世界の3Dスキャンのペア登録のための効率的なフレームワークを提案する。
提案手法は, 3DMatch と 3DLoMatch のベンチマークにおいて, KITTI odometry データセットで同等の性能を達成しながら, 最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-09-09T14:38:06Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。