論文の概要: HEAT: Holistic Edge Attention Transformer for Structured Reconstruction
- arxiv url: http://arxiv.org/abs/2111.15143v1
- Date: Tue, 30 Nov 2021 06:01:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 15:08:58.675534
- Title: HEAT: Holistic Edge Attention Transformer for Structured Reconstruction
- Title(参考訳): 構造再構築のための熱:全体的エッジアテンショントランスフォーマ
- Authors: Jiacheng Chen, Yiming Qian, Yasutaka Furukawa
- Abstract要約: 本稿では,構造化再構成のための新しいアテンションベースニューラルネットワークを提案する。
入力として2次元画像を取得し、下層の幾何学的構造を表す平面グラフを再構成する。
このアプローチはコーナーを検出し、コーナー間のエッジ候補をエンドツーエンドで分類する。
- 参考スコア(独自算出の注目度): 36.910604284201355
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel attention-based neural network for structured
reconstruction, which takes a 2D raster image as an input and reconstructs a
planar graph depicting an underlying geometric structure. The approach detects
corners and classifies edge candidates between corners in an end-to-end manner.
Our contribution is a holistic edge classification architecture, which 1)
initializes the feature of an edge candidate by a trigonometric positional
encoding of its end-points; 2) fuses image feature to each edge candidate by
deformable attention; 3) employs two weight-sharing Transformer decoders to
learn holistic structural patterns over the graph edge candidates; and 4) is
trained with a masked learning strategy. The corner detector is a variant of
the edge classification architecture, adapted to operate on pixels as corner
candidates. We conduct experiments on two structured reconstruction tasks:
outdoor building architecture and indoor floorplan planar graph reconstruction.
Extensive qualitative and quantitative evaluations demonstrate the superiority
of our approach over the state of the art. We will share code and models.
- Abstract(参考訳): 本稿では,2次元ラスター画像を入力として,基礎となる幾何学構造を表す平面グラフを再構成する,新しい注意に基づく構造化再構成ニューラルネットワークを提案する。
このアプローチはコーナーを検出し、コーナー間のエッジ候補をエンドツーエンドで分類する。
私たちの貢献は包括的エッジ分類アーキテクチャです。
1) 端点の三角位置符号化により,辺候補の特徴を初期化する。
2) 画像特徴を各エッジ候補に変形可能な注意で融合させる。
3)2つのウェイトシェアリングトランスフォーマーデコーダを使用して,グラフエッジ候補の全体構造パターンを学習する。
4) マスク付き学習戦略で訓練する。
コーナー検出器はエッジ分類アーキテクチャの変種であり、コーナー候補としてピクセルで動作するように適合している。
屋外ビル建築と屋内フロアプラン平面グラフ復元の2つの構造的再構築課題について実験を行った。
広汎な質的,定量的評価は,最先端技術に対する我々のアプローチの優位性を示している。
コードとモデルを共有します。
関連論文リスト
- Enhancing Polygonal Building Segmentation via Oriented Corners [0.3749861135832072]
本稿では,入力画像から直接ポリゴンを抽出する,OriCornerNetという新しいディープ畳み込みニューラルネットワークを提案する。
我々のアプローチは、隣接する角への方向を示すフットプリントマスク、コーナー、配向ベクトルを予測できる深いモデルを含む。
SpaceNet VegasとCrowdAIの小さなデータセットで行った性能評価は、我々のアプローチの競争力を示すものである。
論文 参考訳(メタデータ) (2024-07-17T01:59:06Z) - DeepBranchTracer: A Generally-Applicable Approach to Curvilinear
Structure Reconstruction Using Multi-Feature Learning [12.047523258256088]
本稿では,外部画像の特徴と内部幾何学的特徴の両方を学習し,曲線構造を再構築するDeepBranchTracerを紹介する。
既存のセグメンテーション法や再構成法よりも優れた性能を示すため,2次元データセットと3次元データセットの両方でモデルを広範囲に評価した。
論文 参考訳(メタデータ) (2024-02-02T07:13:07Z) - CornerFormer: Boosting Corner Representation for Fine-Grained Structured
Reconstruction [20.04081992616026]
構造復元のための改良されたコーナー表現法を提案する。
隣接する角や小さな縁など、きめ細かい構造を再構築する方がよい。
コーナーでは+1.9%@F-1、エッジでは+3.0%@F-1である。
論文 参考訳(メタデータ) (2023-04-14T11:51:26Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Hierarchical Graph Networks for 3D Human Pose Estimation [50.600944798627786]
最近の2次元から3次元の人間のポーズ推定は、人間の骨格のトポロジーによって形成されたグラフ構造を利用する傾向がある。
この骨格トポロジーは体の構造を反映するには小さすぎるため、重度の2次元から3次元のあいまいさに悩まされていると我々は主張する。
本稿では,これらの弱点を克服するために,新しいグラフ畳み込みネットワークアーキテクチャである階層グラフネットワークを提案する。
論文 参考訳(メタデータ) (2021-11-23T15:09:03Z) - Building-GAN: Graph-Conditioned Architectural Volumetric Design
Generation [10.024367148266721]
本稿では,入力プログラムグラフに基づくボリュームデザイン生成について述べる。
密度の高い3次元ボクセルを出力する代わりに、ジオメトリを構築するためにコンパクトかつ表現性の高い新しい3次元表現であるボクセルグラフを提案する。
私たちのジェネレータは、入力プログラムグラフと出力ボキセルグラフを接続するためのポインタメカニズムを使用するクロスモーダルグラフニューラルネットワークであり、パイプライン全体が逆のフレームワークを使用して訓練されます。
論文 参考訳(メタデータ) (2021-04-27T16:49:34Z) - Self-supervised Geometric Perception [96.89966337518854]
自己教師付き幾何知覚(self-supervised geometric perception)は、基底幾何モデルラベルなしで対応マッチングのための特徴記述子を学ぶためのフレームワークである。
また,SGPは,地上トラスラベルを用いて訓練した教師付きオークルよりも同等か優れる最先端性能を達成できることを示す。
論文 参考訳(メタデータ) (2021-03-04T15:34:43Z) - Learning Geometry-Disentangled Representation for Complementary
Understanding of 3D Object Point Cloud [50.56461318879761]
3次元画像処理のためのGDANet(Geometry-Disentangled Attention Network)を提案する。
GDANetは、点雲を3Dオブジェクトの輪郭と平らな部分に切り離し、それぞれ鋭い変化成分と穏やかな変化成分で表される。
3Dオブジェクトの分類とセグメンテーションベンチマークの実験は、GDANetがより少ないパラメータで最先端の処理を実現していることを示している。
論文 参考訳(メタデータ) (2020-12-20T13:35:00Z) - Roof-GAN: Learning to Generate Roof Geometry and Relations for
Residential Houses [37.6686237027665]
Roof-GANは、住宅用屋根構造の構造的幾何を屋根原始体の集合として生成する、新しい生成的敵ネットワークである。
ジェネレータは、グラフとして構造化された屋根モデルを生成し、1)各ノードの画像としてのプリミティブジオメトリ、2)各エッジのプリミティブコリナー/コプラナー関係、および3)各ノードのベクトル形式のプリミティブジオメトリからなる。
判別器は、プリミティブな幾何学、プリミティブな関係、および完全にエンドツーエンドのアーキテクチャにおけるプリミティブなベクトル幾何学を評価するために訓練される。
論文 参考訳(メタデータ) (2020-12-17T00:47:57Z) - Neural Subdivision [58.97214948753937]
本稿では,データ駆動型粗粒度モデリングの新しいフレームワークであるNeural Subdivisionを紹介する。
すべてのローカルメッシュパッチで同じネットワーク重みのセットを最適化するため、特定の入力メッシュや固定属、カテゴリに制約されないアーキテクチャを提供します。
単一の高分解能メッシュでトレーニングしても,本手法は新規な形状に対して合理的な区分を生成する。
論文 参考訳(メタデータ) (2020-05-04T20:03:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。