論文の概要: Towards General-Purpose Representation Learning of Polygonal Geometries
- arxiv url: http://arxiv.org/abs/2209.15458v1
- Date: Thu, 29 Sep 2022 15:59:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 14:14:32.576798
- Title: Towards General-Purpose Representation Learning of Polygonal Geometries
- Title(参考訳): 多角形状の汎用表現学習に向けて
- Authors: Gengchen Mai, Chiyu Jiang, Weiwei Sun, Rui Zhu, Yao Xuan, Ling Cai,
Krzysztof Janowicz, Stefano Ermon, Ni Lao
- Abstract要約: 我々は,多角形形状を埋め込み空間に符号化できる汎用多角形符号化モデルを開発した。
1)MNISTに基づく形状分類,2)DBSR-46KとDBSR-cplx46Kという2つの新しいデータセットに基づく空間関係予測を行う。
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
- 参考スコア(独自算出の注目度): 62.34832826705641
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neural network representation learning for spatial data is a common need for
geographic artificial intelligence (GeoAI) problems. In recent years, many
advancements have been made in representation learning for points, polylines,
and networks, whereas little progress has been made for polygons, especially
complex polygonal geometries. In this work, we focus on developing a
general-purpose polygon encoding model, which can encode a polygonal geometry
(with or without holes, single or multipolygons) into an embedding space. The
result embeddings can be leveraged directly (or finetuned) for downstream tasks
such as shape classification, spatial relation prediction, and so on. To
achieve model generalizability guarantees, we identify a few desirable
properties: loop origin invariance, trivial vertex invariance, part permutation
invariance, and topology awareness. We explore two different designs for the
encoder: one derives all representations in the spatial domain; the other
leverages spectral domain representations. For the spatial domain approach, we
propose ResNet1D, a 1D CNN-based polygon encoder, which uses circular padding
to achieve loop origin invariance on simple polygons. For the spectral domain
approach, we develop NUFTspec based on Non-Uniform Fourier Transformation
(NUFT), which naturally satisfies all the desired properties. We conduct
experiments on two tasks: 1) shape classification based on MNIST; 2) spatial
relation prediction based on two new datasets - DBSR-46K and DBSR-cplx46K. Our
results show that NUFTspec and ResNet1D outperform multiple existing baselines
with significant margins. While ResNet1D suffers from model performance
degradation after shape-invariance geometry modifications, NUFTspec is very
robust to these modifications due to the nature of the NUFT.
- Abstract(参考訳): 空間データに対するニューラルネットワーク表現学習は、地理人工知能(GeoAI)問題にとって共通のニーズである。
近年では、点、ポリライン、ネットワークの表現学習において多くの進歩がなされているが、ポリゴン、特に複雑な多角形幾何学ではほとんど進歩していない。
本研究では,多角形幾何学を(単多角形や多角形の有無にかかわらず)埋め込み空間にエンコードできる汎用多角形符号化モデルの開発に着目する。
結果の埋め込みは、形状分類や空間関係予測などの下流タスクに直接(あるいは微調整)することができる。
モデル一般化可能性を保証するために、ループ原点不変性、自明な頂点不変性、部分置換不変性、位相認識といういくつかの望ましい性質を同定する。
エンコーダの2つの異なる設計を探索する: 1つは空間領域内のすべての表現を導出し、もう1つはスペクトル領域表現を利用する。
空間領域のアプローチとして,1次元CNNベースのポリゴンエンコーダResNet1Dを提案する。
スペクトル領域のアプローチでは、全ての特性を自然に満足する非普遍フーリエ変換(NUFT)に基づくNUFTspecを開発する。
2つの課題について実験を行います
1)MNISTに基づく形状分類
2)DBSR-46KとDBSR-cplx46Kの2つの新しいデータセットに基づく空間関係予測
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
ResNet1Dは形状不変幾何修正後のモデル性能劣化に悩まされているが、NUFTspecはNUFTの性質上、これらの変更に対して非常に堅牢である。
関連論文リスト
- Poly2Vec: Polymorphic Encoding of Geospatial Objects for Spatial Reasoning with Deep Neural Networks [6.1981153537308336]
Poly2Vecは、異なる地理空間オブジェクトのモデリングを統一するエンコーディングフレームワークである。
我々は2次元フーリエ変換のパワーを利用して、形状や位置などの有用な空間特性を符号化する。
この統一されたアプローチは、異なる空間タイプごとに別々のモデルを開発し、訓練する必要がない。
論文 参考訳(メタデータ) (2024-08-27T06:28:35Z) - PolygonGNN: Representation Learning for Polygonal Geometries with Heterogeneous Visibility Graph [8.971120205703887]
本稿では,多角形空間,特に多角形空間の表現を学習するためのフレームワークを提案する。
計算効率を向上し,グラフ冗長性を最小化するために,不均一なスパンニングツリーサンプリング手法を実装した。
また、可視性グラフに固有の空間的・意味的不均一性を活かした新しいモデルであるMultipolygon-GNNを導入する。
論文 参考訳(メタデータ) (2024-06-30T16:07:49Z) - Geometry-Aware Network for Domain Adaptive Semantic Segmentation [64.00345743710653]
本稿では,ドメイン間のギャップを小さくするために,ドメイン適応のための幾何学的ネットワーク(GANDA)を提案する。
我々は、RGB-D画像から生成された点雲上の3Dトポロジを利用して、対象領域における座標色歪みと擬似ラベルの微細化を行う。
我々のモデルは,GTA5->CityscapesとSynTHIA->Cityscapesの最先端技術より優れている。
論文 参考訳(メタデータ) (2022-12-02T00:48:44Z) - Revisiting Transformation Invariant Geometric Deep Learning: Are Initial
Representations All You Need? [80.86819657126041]
変換不変および距離保存初期表現は変換不変性を達成するのに十分であることを示す。
具体的には、多次元スケーリングを変更することで、変換不変かつ距離保存された初期点表現を実現する。
我々は、TinvNNが変換不変性を厳密に保証し、既存のニューラルネットワークと組み合わせられるほど汎用的で柔軟なことを証明した。
論文 参考訳(メタデータ) (2021-12-23T03:52:33Z) - PolyWorld: Polygonal Building Extraction with Graph Neural Networks in
Satellite Images [10.661430927191205]
本稿では、画像から直接建物頂点を抽出し、それらを正しく接続して正確なポリゴンを生成するニューラルネットワークであるPolyWorldを紹介する。
PolyWorldは、ポリゴン化の構築における最先端を著しく上回る。
論文 参考訳(メタデータ) (2021-11-30T15:23:17Z) - PolyNet: Polynomial Neural Network for 3D Shape Recognition with
PolyShape Representation [51.147664305955495]
3次元形状表現とその処理は3次元形状認識に大きな影響を及ぼす。
我々は、ディープニューラルネットワークに基づく手法(PolyNet)と特定のポリゴン表現(PolyShape)を提案する。
本研究では,3次元形状分類と検索作業におけるPolyNetの長所と長所を実証した。
論文 参考訳(メタデータ) (2021-10-15T06:45:59Z) - ResNet-LDDMM: Advancing the LDDMM Framework Using Deep Residual Networks [86.37110868126548]
本研究では,eulerの離散化スキームに基づく非定常ode(フロー方程式)の解法として,深層残留ニューラルネットワークを用いた。
複雑なトポロジー保存変換の下での3次元形状の多種多様な登録問題について述べる。
論文 参考訳(メタデータ) (2021-02-16T04:07:13Z) - PUGeo-Net: A Geometry-centric Network for 3D Point Cloud Upsampling [103.09504572409449]
PUGeo-Netと呼ばれる新しいディープニューラルネットワークを用いた一様高密度点雲を生成する手法を提案する。
その幾何学中心の性質のおかげで、PUGeo-Netはシャープな特徴を持つCADモデルとリッチな幾何学的詳細を持つスキャンされたモデルの両方でうまく機能する。
論文 参考訳(メタデータ) (2020-02-24T14:13:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。