論文の概要: Poly2Vec: Polymorphic Encoding of Geospatial Objects for Spatial Reasoning with Deep Neural Networks
- arxiv url: http://arxiv.org/abs/2408.14806v1
- Date: Tue, 27 Aug 2024 06:28:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-08-28 14:54:56.750393
- Title: Poly2Vec: Polymorphic Encoding of Geospatial Objects for Spatial Reasoning with Deep Neural Networks
- Title(参考訳): Poly2Vec:深部ニューラルネットワークを用いた空間推論のための地理空間オブジェクトの多形符号化
- Authors: Maria Despoina Siampou, Jialiang Li, John Krumm, Cyrus Shahabi, Hua Lu,
- Abstract要約: Poly2Vecは、異なる地理空間オブジェクトのモデリングを統一するエンコーディングフレームワークである。
我々は2次元フーリエ変換のパワーを利用して、形状や位置などの有用な空間特性を符号化する。
この統一されたアプローチは、異なる空間タイプごとに別々のモデルを開発し、訓練する必要がない。
- 参考スコア(独自算出の注目度): 6.1981153537308336
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Encoding geospatial data is crucial for enabling machine learning (ML) models to perform tasks that require spatial reasoning, such as identifying the topological relationships between two different geospatial objects. However, existing encoding methods are limited as they are typically customized to handle only specific types of spatial data, which impedes their applicability across different downstream tasks where multiple data types coexist. To address this, we introduce Poly2Vec, an encoding framework that unifies the modeling of different geospatial objects, including 2D points, polylines, and polygons, irrespective of the downstream task. We leverage the power of the 2D Fourier transform to encode useful spatial properties, such as shape and location, from geospatial objects into fixed-length vectors. These vectors are then inputted into neural network models for spatial reasoning tasks.This unified approach eliminates the need to develop and train separate models for each distinct spatial type. We evaluate Poly2Vec on both synthetic and real datasets of mixed geometry types and verify its consistent performance across several downstream spatial reasoning tasks.
- Abstract(参考訳): 地理空間データの符号化は、2つの異なる地理空間オブジェクト間のトポロジ的関係を識別するなど、空間的推論を必要とするタスクを機械学習(ML)モデルで実行可能にするために重要である。
しかし、既存の符号化手法は、通常、特定の種類の空間データのみを扱うようにカスタマイズされるため、複数のデータ型が共存する下流の様々なタスクに適用性が阻害されるため、制限されている。
これを解決するために、下流のタスクに関係なく、2Dポイント、ポリライン、ポリゴンを含む異なる地理空間オブジェクトのモデリングを統一する符号化フレームワークであるPoly2Vecを紹介する。
我々は2次元フーリエ変換のパワーを利用して、地理空間オブジェクトから固定長ベクトルへの形状や位置などの有用な空間特性を符号化する。
これらのベクトルは、空間的推論タスクのためにニューラルネットワークモデルに入力され、この統一されたアプローチにより、異なる空間タイプごとに別々のモデルを開発し、訓練する必要がなくなる。
混合幾何型の合成データセットと実データの両方でPoly2Vecを評価し,その一貫した性能を下流空間推論タスクで検証した。
関連論文リスト
- Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - Topo-VM-UNetV2: Encoding Topology into Vision Mamba UNet for Polyp Segmentation [4.856498016044607]
Topo-VMUNetV2を提案する。これはMambaベースのポリプセグメンテーションモデルVMUNetV2にトポロジ的特徴をエンコードする。
提案手法は2つの段階から構成される: VMUNetV2はトレーニングおよびテスト画像の確率マップ(PM)を生成するために使用され、トポロジ注意マップの計算に使用される。
論文 参考訳(メタデータ) (2025-05-09T17:41:13Z) - AnySat: One Earth Observation Model for Many Resolutions, Scales, and Modalities [5.767156832161819]
本稿では,JEPAとスケール適応型空間エンコーダに基づくマルチモーダルモデルであるAnySatを提案する。
この統一アプローチの利点を示すために、5ドルのマルチモーダルデータセットのコレクションであるGeoPlexをコンパイルする。
次に、これらの多様なデータセット上で、単一の強力なモデルを同時にトレーニングします。
論文 参考訳(メタデータ) (2024-12-18T18:11:53Z) - GeoFormer: A Multi-Polygon Segmentation Transformer [10.097953939411868]
リモートセンシングでは、建物のような物体のスケール不変な形状を学習する必要がある。
このような課題に対処する新しいアーキテクチャであるGeoFormerを導入し、マルチポリゴンをエンドツーエンドに生成する方法を学習する。
キーポイントを自動回帰方式で空間依存トークンとしてモデル化することにより、GeoFormerは、衛星画像から構築対象を指示する既存の作業より優れている。
論文 参考訳(メタデータ) (2024-11-25T17:54:44Z) - Geometry Distributions [51.4061133324376]
本稿では,分布として幾何学をモデル化する新しい幾何学的データ表現を提案する。
提案手法では,新しいネットワークアーキテクチャを用いた拡散モデルを用いて表面点分布の学習を行う。
本研究では,多種多様な対象に対して質的かつ定量的に表現を評価し,その有効性を実証した。
論文 参考訳(メタデータ) (2024-11-25T04:06:48Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - Sphere2Vec: A General-Purpose Location Representation Learning over a
Spherical Surface for Large-Scale Geospatial Predictions [73.60788465154572]
現在の2Dおよび3D位置エンコーダはユークリッド空間における点距離をモデル化するために設計されている。
本研究では,球面上の点座標を符号化する場合に,球面距離を保存できるSphere2Vecというマルチスケール位置エンコーダを提案する。
論文 参考訳(メタデータ) (2023-06-30T12:55:02Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Fusing Visual Appearance and Geometry for Multi-modality 6DoF Object
Tracking [21.74515335906769]
視覚的な外観や形状から情報を融合してオブジェクトのポーズを推定する多モードトラッカーを開発した。
このアルゴリズムは、幾何学的手法であるICGを拡張し、表面の外観をさらに考慮する。
論文 参考訳(メタデータ) (2023-02-22T15:53:00Z) - Geometry-Aware Network for Domain Adaptive Semantic Segmentation [64.00345743710653]
本稿では,ドメイン間のギャップを小さくするために,ドメイン適応のための幾何学的ネットワーク(GANDA)を提案する。
我々は、RGB-D画像から生成された点雲上の3Dトポロジを利用して、対象領域における座標色歪みと擬似ラベルの微細化を行う。
我々のモデルは,GTA5->CityscapesとSynTHIA->Cityscapesの最先端技術より優れている。
論文 参考訳(メタデータ) (2022-12-02T00:48:44Z) - Towards General-Purpose Representation Learning of Polygonal Geometries [62.34832826705641]
我々は,多角形形状を埋め込み空間に符号化できる汎用多角形符号化モデルを開発した。
1)MNISTに基づく形状分類,2)DBSR-46KとDBSR-cplx46Kという2つの新しいデータセットに基づく空間関係予測を行う。
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
論文 参考訳(メタデータ) (2022-09-29T15:59:23Z) - Sphere2Vec: Multi-Scale Representation Learning over a Spherical Surface
for Geospatial Predictions [4.754823920235069]
本稿では,Sphere2Vecと呼ばれるマルチスケール位置符号化モデルを提案する。
球面上の点座標を直接符号化し、地図投影歪問題を回避する。
Sphere2Vec符号化が任意の2点間の球面距離を保存することの理論的証明を提供する。
論文 参考訳(メタデータ) (2022-01-25T17:34:29Z) - Spatially Invariant Unsupervised 3D Object Segmentation with Graph
Neural Networks [23.729853358582506]
本研究では,空間混合モデルとして点雲をモデル化するフレームワークSPAIR3Dを提案する。
変分オートエンコーダ(VAE)を用いて3次元の多目的表現とセグメンテーションを共同で学習する。
実験の結果,SPAIR3Dは外見情報のない可変物体を検出・分割できることがわかった。
論文 参考訳(メタデータ) (2021-06-10T09:20:16Z) - Spatial Object Recommendation with Hints: When Spatial Granularity
Matters [42.51352610054967]
空間的粒度の異なるレベルで、トップK空間オブジェクト推奨をサポートする方法を検討する。
関心のポイント(POI)間の空間的包摂関係をキャプチャするPOI木の利用を提案する。
我々はMPR(Multi-level POI Recommendation)と呼ばれる新しいマルチタスク学習モデルを設計し、各タスクは特定の空間的粒度レベルでトップk POIを返すことを目的としている。
論文 参考訳(メタデータ) (2021-01-08T11:39:51Z) - Cylindrical Convolutional Networks for Joint Object Detection and
Viewpoint Estimation [76.21696417873311]
3次元空間で定義された畳み込みカーネルの円筒形表現を利用する学習可能なモジュールである円筒型畳み込みネットワーク(CCN)を導入する。
CCNはビュー固有の畳み込みカーネルを通してビュー固有の特徴を抽出し、各視点におけるオブジェクトカテゴリスコアを予測する。
本実験は,円柱状畳み込みネットワークが関節物体の検出と視点推定に与える影響を実証する。
論文 参考訳(メタデータ) (2020-03-25T10:24:58Z) - PUGeo-Net: A Geometry-centric Network for 3D Point Cloud Upsampling [103.09504572409449]
PUGeo-Netと呼ばれる新しいディープニューラルネットワークを用いた一様高密度点雲を生成する手法を提案する。
その幾何学中心の性質のおかげで、PUGeo-Netはシャープな特徴を持つCADモデルとリッチな幾何学的詳細を持つスキャンされたモデルの両方でうまく機能する。
論文 参考訳(メタデータ) (2020-02-24T14:13:29Z) - Multi-Scale Representation Learning for Spatial Feature Distributions
using Grid Cells [11.071527762096053]
本研究では,位置の絶対位置と空間的関係を符号化するスペース2Vecという表現学習モデルを提案する。
その結果、Space2Vecはマルチスケール表現のため、確立されたMLアプローチよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-02-16T04:22:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。