論文の概要: GeoFormer: A Multi-Polygon Segmentation Transformer
- arxiv url: http://arxiv.org/abs/2411.16616v1
- Date: Mon, 25 Nov 2024 17:54:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:20:12.696010
- Title: GeoFormer: A Multi-Polygon Segmentation Transformer
- Title(参考訳): GeoFormer: マルチポリゴンセグメンテーション変換器
- Authors: Maxim Khomiakov, Michael Riis Andersen, Jes Frellsen,
- Abstract要約: リモートセンシングでは、建物のような物体のスケール不変な形状を学習する必要がある。
このような課題に対処する新しいアーキテクチャであるGeoFormerを導入し、マルチポリゴンをエンドツーエンドに生成する方法を学習する。
キーポイントを自動回帰方式で空間依存トークンとしてモデル化することにより、GeoFormerは、衛星画像から構築対象を指示する既存の作業より優れている。
- 参考スコア(独自算出の注目度): 10.097953939411868
- License:
- Abstract: In remote sensing there exists a common need for learning scale invariant shapes of objects like buildings. Prior works relies on tweaking multiple loss functions to convert segmentation maps into the final scale invariant representation, necessitating arduous design and optimization. For this purpose we introduce the GeoFormer, a novel architecture which presents a remedy to the said challenges, learning to generate multipolygons end-to-end. By modeling keypoints as spatially dependent tokens in an auto-regressive manner, the GeoFormer outperforms existing works in delineating building objects from satellite imagery. We evaluate the robustness of the GeoFormer against former methods through a variety of parameter ablations and highlight the advantages of optimizing a single likelihood function. Our study presents the first successful application of auto-regressive transformer models for multi-polygon predictions in remote sensing, suggesting a promising methodological alternative for building vectorization.
- Abstract(参考訳): リモートセンシングでは、建物のような物体のスケール不変な形状を学習する必要がある。
それまでの作業では、セグメント化マップを最終的なスケール不変表現に変換するために複数の損失関数を微調整し、厳密な設計と最適化を必要としていた。
この目的のために、我々はGeoFormerという新しいアーキテクチャを紹介し、その課題に対処し、マルチポリゴンをエンドツーエンドに生成する方法を学ぶ。
キーポイントを自動回帰方式で空間依存トークンとしてモデル化することにより、GeoFormerは、衛星画像から構築対象を指示する既存の作業より優れている。
我々は,GeoFormerの従来の手法に対するロバスト性について,様々なパラメータによる評価を行い,単一の可能性関数を最適化する利点を強調した。
本研究では,リモートセンシングにおけるマルチポリゴン予測のための自動回帰トランスフォーマーモデルの最初の成功例を示し,ベクトル化の手法として有望な方法を提案する。
関連論文リスト
- Poly2Vec: Polymorphic Encoding of Geospatial Objects for Spatial Reasoning with Deep Neural Networks [6.1981153537308336]
Poly2Vecは、異なる地理空間オブジェクトのモデリングを統一するエンコーディングフレームワークである。
我々は2次元フーリエ変換のパワーを利用して、形状や位置などの有用な空間特性を符号化する。
この統一されたアプローチは、異なる空間タイプごとに別々のモデルを開発し、訓練する必要がない。
論文 参考訳(メタデータ) (2024-08-27T06:28:35Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - DoughNet: A Visual Predictive Model for Topological Manipulation of Deformable Objects [27.194896819729113]
弾塑性物体との相互作用を計画するトランスフォーマーアーキテクチャ
DoughNetはロボット操作の計画を可能にし、ロボットや人間が作った目標を再現するために、適切なツール、ポーズ、開口幅を選択する。
論文 参考訳(メタデータ) (2024-04-18T21:55:23Z) - HiT: Building Mapping with Hierarchical Transformers [43.31497052507252]
階層変換器を用いた簡易かつ斬新な建物マッピング手法HiTを提案する。
HiTは、分類とバウンディングボックス回帰ヘッドに平行なポリゴンヘッドを追加することによって、2段階検出アーキテクチャの上に構築される。
本手法は, 最先端手法と比較して, 事例分割と多角形メトリクスの両面において, 新たな最先端化を実現している。
論文 参考訳(メタデータ) (2023-09-18T10:24:25Z) - Automatic Parameterization for Aerodynamic Shape Optimization via Deep
Geometric Learning [60.69217130006758]
空力形状最適化のための形状パラメータ化を完全に自動化する2つの深層学習モデルを提案する。
どちらのモデルも、深い幾何学的学習を通じてパラメータ化し、人間の事前知識を学習された幾何学的パターンに埋め込むように最適化されている。
2次元翼の形状最適化実験を行い、2つのモデルに適用可能なシナリオについて論じる。
論文 参考訳(メタデータ) (2023-05-03T13:45:40Z) - Towards General-Purpose Representation Learning of Polygonal Geometries [62.34832826705641]
我々は,多角形形状を埋め込み空間に符号化できる汎用多角形符号化モデルを開発した。
1)MNISTに基づく形状分類,2)DBSR-46KとDBSR-cplx46Kという2つの新しいデータセットに基づく空間関係予測を行う。
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
論文 参考訳(メタデータ) (2022-09-29T15:59:23Z) - Learning to Complete Object Shapes for Object-level Mapping in Dynamic
Scenes [30.500198859451434]
本研究では,動的シーンにおけるオブジェクトの分割,追跡,再構築を同時に行うオブジェクトレベルのマッピングシステムを提案する。
さらに、深度入力とカテゴリレベルの前の形状からの再構成を条件にすることで、完全なジオメトリを予測し、完成させることができる。
実世界の合成シーケンスと実世界のシーケンスの両方で定量的に定性的にテストすることで,その有効性を評価する。
論文 参考訳(メタデータ) (2022-08-09T22:56:33Z) - AutoPoly: Predicting a Polygonal Mesh Construction Sequence from a
Silhouette Image [17.915067368873018]
AutoPolyはシルエット画像から多角形メッシュ構築シーケンスを生成するハイブリッド手法である。
提案手法はトポロジを修正できるが,最近提案された微分可能レンダリングを用いた逆形状推定法は固定トポロジのみを処理できる。
論文 参考訳(メタデータ) (2022-03-29T04:48:47Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - Rethinking Learnable Tree Filter for Generic Feature Transform [71.77463476808585]
Learnable Tree Filterはセマンティックセグメンテーションのためのモデル構造保存関係に対する顕著なアプローチを示す。
幾何学的制約を緩和するために,マルコフ確率場として再構成して解析を行い,学習可能な不定項を導入する。
セマンティックセグメンテーションでは、ベルとホイッスルなしでCityscapesベンチマークでトップパフォーマンス(82.1% mIoU)を達成しています。
論文 参考訳(メタデータ) (2020-12-07T07:16:47Z) - Gated Path Selection Network for Semantic Segmentation [72.44994579325822]
我々は,適応的な受容場を学習することを目的とした,GPSNetという新しいネットワークを開発した。
GPSNetにおいて、我々はまず2次元のマルチスケールネットワーク、SuperNetを設計する。
望ましいセマンティックコンテキストを動的に選択するために、ゲート予測モジュールがさらに導入される。
論文 参考訳(メタデータ) (2020-01-19T12:32:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。