論文の概要: PolyR-CNN: R-CNN for end-to-end polygonal building outline extraction
- arxiv url: http://arxiv.org/abs/2407.14912v1
- Date: Sat, 20 Jul 2024 15:48:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-23 20:09:56.892491
- Title: PolyR-CNN: R-CNN for end-to-end polygonal building outline extraction
- Title(参考訳): PolyR-CNN: エンド・ツー・エンド多角形アウトライン抽出のためのR-CNN
- Authors: Weiqin Jiao, Claudio Persello, George Vosselman,
- Abstract要約: PolyR-CNNは、リモートセンシング画像から直接ベクトル化されたビルディングポリゴンとバウンディングボックスを予測するための効率的で完全に統合されたアプローチである。
また,PolyR-CNNは最先端手法と比較して競争精度が高いことを示す。
CrowdAIデータセットで実施された実験によると、PolyR-CNNは平均精度79.2(AP)を達成した。
- 参考スコア(独自算出の注目度): 1.6616351977656307
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Polygonal building outline extraction has been a research focus in recent years. Most existing methods have addressed this challenging task by decomposing it into several subtasks and employing carefully designed architectures. Despite their accuracy, such pipelines often introduce inefficiencies during training and inference. This paper presents an end-to-end framework, denoted as PolyR-CNN, which offers an efficient and fully integrated approach to predict vectorized building polygons and bounding boxes directly from remotely sensed images. Notably, PolyR-CNN leverages solely the features of the Region of Interest (RoI) for the prediction, thereby mitigating the necessity for complex designs. Furthermore, we propose a novel scheme with PolyR-CNN to extract detailed outline information from polygon vertex coordinates, termed vertex proposal feature, to guide the RoI features to predict more regular buildings. PolyR-CNN demonstrates the capacity to deal with buildings with holes through a simple post-processing method on the Inria dataset. Comprehensive experiments conducted on the CrowdAI dataset show that PolyR-CNN achieves competitive accuracy compared to state-of-the-art methods while significantly improving computational efficiency, i.e., achieving 79.2 Average Precision (AP), exhibiting a 15.9 AP gain and operating 2.5 times faster and four times lighter than the well-established end-to-end method PolyWorld. Replacing the backbone with a simple ResNet-50, PolyR-CNN maintains a 71.1 AP while running four times faster than PolyWorld.
- Abstract(参考訳): 近年,多角形建築物のアウトライン抽出が研究の焦点となっている。
既存のほとんどのメソッドは、これをいくつかのサブタスクに分解し、慎重に設計されたアーキテクチャを採用することで、この課題に対処してきた。
その正確さにもかかわらず、これらのパイプラインはトレーニングと推論の間に非効率をもたらすことが多い。
本稿では,ポリR-CNN(PolyR-CNN)と呼ばれるエンド・ツー・エンドのフレームワークを提案する。
特に、PolyR-CNNは興味領域(RoI)の特徴のみを予測に利用しており、複雑な設計の必要性を軽減している。
さらに,PolyR-CNNを用いて,ポリゴン頂点座標から詳細なアウトライン情報を抽出し,より規則的な建物を予測するためのRoI特徴を導出する手法を提案する。
PolyR-CNNは、Inriaデータセット上の単純な後処理を通じて、穴のある建物を扱う能力を示している。
CrowdAIデータセットで実施された総合的な実験によると、PolyR-CNNは最先端の手法と比較して競争精度が向上し、計算効率は79.2 Average Precision (AP) を著しく向上し、15.9 APのゲインを示し、確立されたエンドツーエンドのPolyWorldよりも2.5倍高速で4倍軽くなる。
バックボーンを単純なResNet-50で置き換えると、PolyR-CNNは71.1 APを維持し、PolyWorldの4倍高速である。
関連論文リスト
- LION: Linear Group RNN for 3D Object Detection in Point Clouds [85.97541374148508]
本稿では,LInear grOup RNN上に構築されたウィンドウベースフレームワークを提案する。
3次元空間特徴記述器を導入し,それを線形群 RNN 演算子に統合して空間特徴を増強する。
高分散点雲の課題にさらに対処するため,前景の特徴を密度化するための3次元ボクセル生成戦略を提案する。
論文 参考訳(メタデータ) (2024-07-25T17:50:32Z) - RoIPoly: Vectorized Building Outline Extraction Using Vertex and Logit Embeddings [5.093758132026397]
航空画像や衛星画像から建物概要を抽出する新しいクエリベースの手法を提案する。
クエリとして各ポリゴンを定式化し、潜在的ビルディングの最も関連性の高い領域に対してクエリの注意を拘束する。
本手法は,2次元フロアプラン再構築データセットであるStructured3Dを用いて,ベクトル化建物アウトライン抽出データセット(CrowdAI)と2次元フロアプラン再構築データセット(Structured3D)について評価する。
論文 参考訳(メタデータ) (2024-07-20T16:12:51Z) - Enhancing Polygonal Building Segmentation via Oriented Corners [0.3749861135832072]
本稿では,入力画像から直接ポリゴンを抽出する,OriCornerNetという新しいディープ畳み込みニューラルネットワークを提案する。
我々のアプローチは、隣接する角への方向を示すフットプリントマスク、コーナー、配向ベクトルを予測できる深いモデルを含む。
SpaceNet VegasとCrowdAIの小さなデータセットで行った性能評価は、我々のアプローチの競争力を示すものである。
論文 参考訳(メタデータ) (2024-07-17T01:59:06Z) - P2PFormer: A Primitive-to-polygon Method for Regular Building Contour Extraction from Remote Sensing Images [5.589842901102337]
既存の方法は不規則な輪郭、丸い角、冗長点に悩まされている。
本稿では,ポストプロセッシングを使わずに通常の建物輪郭を生成する,新しい合理化パイプラインを提案する。
P2PFormerは、WHU、CrowdAI、WHU-Mixデータセット上で、最先端のパフォーマンスを新たに実現している。
論文 参考訳(メタデータ) (2024-06-05T04:38:45Z) - Defining Neural Network Architecture through Polytope Structures of Dataset [53.512432492636236]
本稿では, ニューラルネットワーク幅の上下境界を定義し, 問題となるデータセットのポリトープ構造から情報を得る。
本研究では,データセットのポリトープ構造を学習したニューラルネットワークから推定できる逆条件を探索するアルゴリズムを開発した。
MNIST、Fashion-MNIST、CIFAR10といった一般的なデータセットは、顔の少ない2つ以上のポリトップを用いて効率的にカプセル化できることが確立されている。
論文 参考訳(メタデータ) (2024-02-04T08:57:42Z) - PolyGNN: Polyhedron-based Graph Neural Network for 3D Building
Reconstruction from Point Clouds [20.299248281970957]
PolyGNNは、ポイントクラウドから再構築する3D構築のためのグラフニューラルネットワークである。
グラフノード分類を用いて,多面分解により得られたプリミティブを組み立てることを学ぶ。
都市間および実世界の点雲上での移動可能性解析を行う。
論文 参考訳(メタデータ) (2023-07-17T16:52:25Z) - TransNetR: Transformer-based Residual Network for Polyp Segmentation
with Multi-Center Out-of-Distribution Testing [2.3293678240472517]
大腸ポリープ分割のためのトランスフォーマーを用いたResidual Network(TransNetR)を提案する。
TransNetRは、トレーニング済みのResNet50をエンコーダとして、3つのデコーダブロックと、ネットワークの終端にあるアップサンプリング層で構成されるエンコーダ・デコーダネットワークである。
高いダイス係数は0.8706、平均インターセクションは0.8016であり、Kvasir-SEGデータセット上でのリアルタイム処理速度は54.60である。
論文 参考訳(メタデータ) (2023-03-13T19:11:17Z) - Towards General-Purpose Representation Learning of Polygonal Geometries [62.34832826705641]
我々は,多角形形状を埋め込み空間に符号化できる汎用多角形符号化モデルを開発した。
1)MNISTに基づく形状分類,2)DBSR-46KとDBSR-cplx46Kという2つの新しいデータセットに基づく空間関係予測を行う。
以上の結果から,NUFTspec と ResNet1D は,既存のベースラインよりも有意なマージンで優れていた。
論文 参考訳(メタデータ) (2022-09-29T15:59:23Z) - Geometry-Guided Progressive NeRF for Generalizable and Efficient Neural
Human Rendering [139.159534903657]
我々は、高忠実度自由視点人体詳細のための一般化可能で効率的なニューラルレーダランス・フィールド(NeRF)パイプラインを開発した。
自己閉塞性を改善するため,幾何誘導型多視点機能統合手法を考案した。
高いレンダリング効率を達成するため,幾何誘導型プログレッシブレンダリングパイプラインを導入する。
論文 参考訳(メタデータ) (2021-12-08T14:42:10Z) - Voxel-based Network for Shape Completion by Leveraging Edge Generation [76.23436070605348]
エッジ生成(VE-PCN)を利用した点雲補完のためのボクセルネットワークを開発した。
まず点雲を正規のボクセル格子に埋め込み、幻覚した形状のエッジの助けを借りて完全な物体を生成する。
この分離されたアーキテクチャとマルチスケールのグリッド機能学習は、より現実的な表面上の詳細を生成することができる。
論文 参考訳(メタデータ) (2021-08-23T05:10:29Z) - Rank-R FNN: A Tensor-Based Learning Model for High-Order Data
Classification [69.26747803963907]
Rank-R Feedforward Neural Network (FNN)は、そのパラメータにCanonical/Polyadic分解を課すテンソルベースの非線形学習モデルである。
まず、入力をマルチリニアアレイとして扱い、ベクトル化の必要性を回避し、すべてのデータ次元に沿って構造情報を十分に活用することができる。
Rank-R FNNの普遍的な近似と学習性の特性を確立し、実世界のハイパースペクトルデータセットのパフォーマンスを検証する。
論文 参考訳(メタデータ) (2021-04-11T16:37:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。