論文の概要: PolyDiffuse: Polygonal Shape Reconstruction via Guided Set Diffusion
Models
- arxiv url: http://arxiv.org/abs/2306.01461v2
- Date: Mon, 25 Dec 2023 03:55:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 22:45:56.918128
- Title: PolyDiffuse: Polygonal Shape Reconstruction via Guided Set Diffusion
Models
- Title(参考訳): ポリディフューズ:ガイド付き集合拡散モデルによる多角形状再構成
- Authors: Jiacheng Chen, Ruizhi Deng, Yasutaka Furukawa
- Abstract要約: PolyDiffuseは、視覚センサデータを拡散モデル(DM)で多角形に変換する新しい構造化再構成アルゴリズムである。
DMは、生成AIが爆発する中、新興機械であり、センサデータに条件付けされた生成プロセスとして再構築を定式化している。
我々は,多角形の集合としてのフロアプランと,一組のポリラインとしての自律走行車用HDマップという,2種類の多角形形状を再構築するためのアプローチを評価した。
- 参考スコア(独自算出の注目度): 26.819929072916363
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents PolyDiffuse, a novel structured reconstruction algorithm
that transforms visual sensor data into polygonal shapes with Diffusion Models
(DM), an emerging machinery amid exploding generative AI, while formulating
reconstruction as a generation process conditioned on sensor data. The task of
structured reconstruction poses two fundamental challenges to DM: 1) A
structured geometry is a ``set'' (e.g., a set of polygons for a floorplan
geometry), where a sample of $N$ elements has $N!$ different but equivalent
representations, making the denoising highly ambiguous; and 2) A
``reconstruction'' task has a single solution, where an initial noise needs to
be chosen carefully, while any initial noise works for a generation task. Our
technical contribution is the introduction of a Guided Set Diffusion Model
where 1) the forward diffusion process learns guidance networks to control
noise injection so that one representation of a sample remains distinct from
its other permutation variants, thus resolving denoising ambiguity; and 2) the
reverse denoising process reconstructs polygonal shapes, initialized and
directed by the guidance networks, as a conditional generation process subject
to the sensor data. We have evaluated our approach for reconstructing two types
of polygonal shapes: floorplan as a set of polygons and HD map for autonomous
cars as a set of polylines. Through extensive experiments on standard
benchmarks, we demonstrate that PolyDiffuse significantly advances the current
state of the art and enables broader practical applications.
- Abstract(参考訳): 本稿では,視覚センサデータを拡散モデル(dm)を用いて多角形に変換する新しい構造化再構成アルゴリズムであるpolydiffuseを提案する。
構造復元の課題は2つの基本課題である。
1)構造化幾何は ``set'''(例えば、フロアプラン幾何の多角形の集合)であり、ここでは$n$要素のサンプルは$n!
異なるが同等の表現であり、発音が極めて曖昧である。
2) `reconstruction'タスクは単一のソリューションを持ち、初期ノイズは慎重に選択する必要があるが、初期ノイズは生成タスクで機能する。
我々の技術的貢献は、ガイドセット拡散モデルの導入である。
1)前方拡散プロセスは、サンプルの1つの表現が他の置換変種と区別されるようにノイズ注入を制御するための誘導網を学習し、あいまいさを解消する。
2) 逆復調処理は、センサデータに基づく条件生成プロセスとして、誘導網によって初期化および誘導される多角形を再構成する。
我々は,多角形集合としてのフロアプランと,一組のポリラインとしての自律走行車用HDマップの2種類の多角形形状を再構築するためのアプローチを評価した。
標準ベンチマークに関する広範囲な実験を通じて、ポリディフュースが現在の技術を大きく進歩させ、より広範な実用的応用を可能にすることを実証する。
関連論文リスト
- P2PFormer: A Primitive-to-polygon Method for Regular Building Contour Extraction from Remote Sensing Images [5.589842901102337]
既存の方法は不規則な輪郭、丸い角、冗長点に悩まされている。
本稿では,ポストプロセッシングを使わずに通常の建物輪郭を生成する,新しい合理化パイプラインを提案する。
P2PFormerは、WHU、CrowdAI、WHU-Mixデータセット上で、最先端のパフォーマンスを新たに実現している。
論文 参考訳(メタデータ) (2024-06-05T04:38:45Z) - Mesh Denoising Transformer [104.5404564075393]
Mesh Denoisingは、入力メッシュからノイズを取り除き、特徴構造を保存することを目的としている。
SurfaceFormerはTransformerベースのメッシュDenoisingフレームワークのパイオニアだ。
局所曲面記述子(Local Surface Descriptor)として知られる新しい表現は、局所幾何学的複雑さをキャプチャする。
Denoising Transformerモジュールは、マルチモーダル情報を受信し、効率的なグローバル機能アグリゲーションを実現する。
論文 参考訳(メタデータ) (2024-05-10T15:27:43Z) - PolyDiff: Generating 3D Polygonal Meshes with Diffusion Models [15.846449180313778]
PolyDiffは、現実的で多様な3Dポリゴンメッシュを直接生成できる最初の拡散ベースのアプローチである。
我々のモデルは、下流3Dに統合可能な高品質な3D多角形メッシュを生成することができる。
論文 参考訳(メタデータ) (2023-12-18T18:19:26Z) - NeuSD: Surface Completion with Multi-View Text-to-Image Diffusion [56.98287481620215]
本稿では,対象物の一部のみを捉えた複数の画像から3次元表面再構成を行う手法を提案する。
提案手法は, 表面の可視部分の再構成に神経放射場を用いた表面再構成法と, SDS (Score Distillation Sampling) 方式で事前学習した2次元拡散モデルを用いて, 可観測領域の形状を再現する手法である。
論文 参考訳(メタデータ) (2023-12-07T19:30:55Z) - HiT: Building Mapping with Hierarchical Transformers [43.31497052507252]
階層変換器を用いた簡易かつ斬新な建物マッピング手法HiTを提案する。
HiTは、分類とバウンディングボックス回帰ヘッドに平行なポリゴンヘッドを追加することによって、2段階検出アーキテクチャの上に構築される。
本手法は, 最先端手法と比較して, 事例分割と多角形メトリクスの両面において, 新たな最先端化を実現している。
論文 参考訳(メタデータ) (2023-09-18T10:24:25Z) - T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified
Visual Modalities [69.16656086708291]
拡散確率場(DPF)は、距離空間上で定義された連続関数の分布をモデル化する。
本稿では,局所構造学習に着目したビューワイズサンプリングアルゴリズムによる新しいモデルを提案する。
モデルは、複数のモダリティを統一しながら、高解像度のデータを生成するためにスケールすることができる。
論文 参考訳(メタデータ) (2023-05-24T03:32:03Z) - Recurrent Generic Contour-based Instance Segmentation with Progressive
Learning [111.31166268300817]
本稿では,一般的な輪郭型インスタンスセグメンテーションのための新しいディープネットワークアーキテクチャ,すなわちPolySnakeを提案する。
従来のSnakeアルゴリズムに動機付け,提案したPolySnakeはより優れた,堅牢なセグメンテーション性能を実現する。
論文 参考訳(メタデータ) (2023-01-21T05:34:29Z) - Towards General-Purpose Representation Learning of Polygonal Geometries [62.34832826705641]
我々は,多角形形状を埋め込み空間に符号化できる汎用多角形符号化モデルを開発した。
1)MNISTに基づく形状分類,2)DBSR-46KとDBSR-cplx46Kという2つの新しいデータセットに基づく空間関係予測を行う。
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
論文 参考訳(メタデータ) (2022-09-29T15:59:23Z) - Neural Template: Topology-aware Reconstruction and Disentangled
Generation of 3D Meshes [52.038346313823524]
本稿では,Distangled Topologyによる3次元メッシュ再構成と生成のためのDTNetという新しいフレームワークを提案する。
提案手法は,最先端の手法と比較して,特に多様なトポロジで高品質なメッシュを生成することができる。
論文 参考訳(メタデータ) (2022-06-10T08:32:57Z) - AutoPoly: Predicting a Polygonal Mesh Construction Sequence from a
Silhouette Image [17.915067368873018]
AutoPolyはシルエット画像から多角形メッシュ構築シーケンスを生成するハイブリッド手法である。
提案手法はトポロジを修正できるが,最近提案された微分可能レンダリングを用いた逆形状推定法は固定トポロジのみを処理できる。
論文 参考訳(メタデータ) (2022-03-29T04:48:47Z) - Automated LoD-2 Model Reconstruction from Very-HighResolution
Satellite-derived Digital Surface Model and Orthophoto [1.2691047660244335]
本稿では,LoD-2ビルディングモデルを「分解最適化最適化」パラダイムに従って再構成するモデル駆動手法を提案する。
提案手法は,既存の手法に対するいくつかの技術的問題点に対処し,その有効性を実証した。
論文 参考訳(メタデータ) (2021-09-08T19:03:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。