論文の概要: Poly2Vec: Polymorphic Encoding of Geospatial Objects for Spatial Reasoning with Deep Neural Networks
- arxiv url: http://arxiv.org/abs/2408.14806v1
- Date: Tue, 27 Aug 2024 06:28:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-28 14:54:56.750393
- Title: Poly2Vec: Polymorphic Encoding of Geospatial Objects for Spatial Reasoning with Deep Neural Networks
- Title(参考訳): Poly2Vec:深部ニューラルネットワークを用いた空間推論のための地理空間オブジェクトの多形符号化
- Authors: Maria Despoina Siampou, Jialiang Li, John Krumm, Cyrus Shahabi, Hua Lu,
- Abstract要約: Poly2Vecは、異なる地理空間オブジェクトのモデリングを統一するエンコーディングフレームワークである。
我々は2次元フーリエ変換のパワーを利用して、形状や位置などの有用な空間特性を符号化する。
この統一されたアプローチは、異なる空間タイプごとに別々のモデルを開発し、訓練する必要がない。
- 参考スコア(独自算出の注目度): 6.1981153537308336
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Encoding geospatial data is crucial for enabling machine learning (ML) models to perform tasks that require spatial reasoning, such as identifying the topological relationships between two different geospatial objects. However, existing encoding methods are limited as they are typically customized to handle only specific types of spatial data, which impedes their applicability across different downstream tasks where multiple data types coexist. To address this, we introduce Poly2Vec, an encoding framework that unifies the modeling of different geospatial objects, including 2D points, polylines, and polygons, irrespective of the downstream task. We leverage the power of the 2D Fourier transform to encode useful spatial properties, such as shape and location, from geospatial objects into fixed-length vectors. These vectors are then inputted into neural network models for spatial reasoning tasks.This unified approach eliminates the need to develop and train separate models for each distinct spatial type. We evaluate Poly2Vec on both synthetic and real datasets of mixed geometry types and verify its consistent performance across several downstream spatial reasoning tasks.
- Abstract(参考訳): 地理空間データの符号化は、2つの異なる地理空間オブジェクト間のトポロジ的関係を識別するなど、空間的推論を必要とするタスクを機械学習(ML)モデルで実行可能にするために重要である。
しかし、既存の符号化手法は、通常、特定の種類の空間データのみを扱うようにカスタマイズされるため、複数のデータ型が共存する下流の様々なタスクに適用性が阻害されるため、制限されている。
これを解決するために、下流のタスクに関係なく、2Dポイント、ポリライン、ポリゴンを含む異なる地理空間オブジェクトのモデリングを統一する符号化フレームワークであるPoly2Vecを紹介する。
我々は2次元フーリエ変換のパワーを利用して、地理空間オブジェクトから固定長ベクトルへの形状や位置などの有用な空間特性を符号化する。
これらのベクトルは、空間的推論タスクのためにニューラルネットワークモデルに入力され、この統一されたアプローチにより、異なる空間タイプごとに別々のモデルを開発し、訓練する必要がなくなる。
混合幾何型の合成データセットと実データの両方でPoly2Vecを評価し,その一貫した性能を下流空間推論タスクで検証した。
関連論文リスト
- GeoFormer: A Multi-Polygon Segmentation Transformer [10.097953939411868]
リモートセンシングでは、建物のような物体のスケール不変な形状を学習する必要がある。
このような課題に対処する新しいアーキテクチャであるGeoFormerを導入し、マルチポリゴンをエンドツーエンドに生成する方法を学習する。
キーポイントを自動回帰方式で空間依存トークンとしてモデル化することにより、GeoFormerは、衛星画像から構築対象を指示する既存の作業より優れている。
論文 参考訳(メタデータ) (2024-11-25T17:54:44Z) - Geometry Distributions [51.4061133324376]
本稿では,分布として幾何学をモデル化する新しい幾何学的データ表現を提案する。
提案手法では,新しいネットワークアーキテクチャを用いた拡散モデルを用いて表面点分布の学習を行う。
本研究では,多種多様な対象に対して質的かつ定量的に表現を評価し,その有効性を実証した。
論文 参考訳(メタデータ) (2024-11-25T04:06:48Z) - Sphere2Vec: A General-Purpose Location Representation Learning over a
Spherical Surface for Large-Scale Geospatial Predictions [73.60788465154572]
現在の2Dおよび3D位置エンコーダはユークリッド空間における点距離をモデル化するために設計されている。
本研究では,球面上の点座標を符号化する場合に,球面距離を保存できるSphere2Vecというマルチスケール位置エンコーダを提案する。
論文 参考訳(メタデータ) (2023-06-30T12:55:02Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Geometry-Aware Network for Domain Adaptive Semantic Segmentation [64.00345743710653]
本稿では,ドメイン間のギャップを小さくするために,ドメイン適応のための幾何学的ネットワーク(GANDA)を提案する。
我々は、RGB-D画像から生成された点雲上の3Dトポロジを利用して、対象領域における座標色歪みと擬似ラベルの微細化を行う。
我々のモデルは,GTA5->CityscapesとSynTHIA->Cityscapesの最先端技術より優れている。
論文 参考訳(メタデータ) (2022-12-02T00:48:44Z) - Towards General-Purpose Representation Learning of Polygonal Geometries [62.34832826705641]
我々は,多角形形状を埋め込み空間に符号化できる汎用多角形符号化モデルを開発した。
1)MNISTに基づく形状分類,2)DBSR-46KとDBSR-cplx46Kという2つの新しいデータセットに基づく空間関係予測を行う。
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
論文 参考訳(メタデータ) (2022-09-29T15:59:23Z) - Sphere2Vec: Multi-Scale Representation Learning over a Spherical Surface
for Geospatial Predictions [4.754823920235069]
本稿では,Sphere2Vecと呼ばれるマルチスケール位置符号化モデルを提案する。
球面上の点座標を直接符号化し、地図投影歪問題を回避する。
Sphere2Vec符号化が任意の2点間の球面距離を保存することの理論的証明を提供する。
論文 参考訳(メタデータ) (2022-01-25T17:34:29Z) - Spatially Invariant Unsupervised 3D Object Segmentation with Graph
Neural Networks [23.729853358582506]
本研究では,空間混合モデルとして点雲をモデル化するフレームワークSPAIR3Dを提案する。
変分オートエンコーダ(VAE)を用いて3次元の多目的表現とセグメンテーションを共同で学習する。
実験の結果,SPAIR3Dは外見情報のない可変物体を検出・分割できることがわかった。
論文 参考訳(メタデータ) (2021-06-10T09:20:16Z) - Cylindrical Convolutional Networks for Joint Object Detection and
Viewpoint Estimation [76.21696417873311]
3次元空間で定義された畳み込みカーネルの円筒形表現を利用する学習可能なモジュールである円筒型畳み込みネットワーク(CCN)を導入する。
CCNはビュー固有の畳み込みカーネルを通してビュー固有の特徴を抽出し、各視点におけるオブジェクトカテゴリスコアを予測する。
本実験は,円柱状畳み込みネットワークが関節物体の検出と視点推定に与える影響を実証する。
論文 参考訳(メタデータ) (2020-03-25T10:24:58Z) - Multi-Scale Representation Learning for Spatial Feature Distributions
using Grid Cells [11.071527762096053]
本研究では,位置の絶対位置と空間的関係を符号化するスペース2Vecという表現学習モデルを提案する。
その結果、Space2Vecはマルチスケール表現のため、確立されたMLアプローチよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-02-16T04:22:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。