論文の概要: Automatic Cadastral Boundary Detection of Very High Resolution Images
Using Mask R-CNN
- arxiv url: http://arxiv.org/abs/2309.16708v1
- Date: Thu, 17 Aug 2023 10:47:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 05:46:28.683346
- Title: Automatic Cadastral Boundary Detection of Very High Resolution Images
Using Mask R-CNN
- Title(参考訳): Mask R-CNNを用いた超高解像度画像の自動カダストラム境界検出
- Authors: Neda Rahimpour Anaraki, Alireza Azadbakht, Maryam Tahmasbi, Hadi
Farahani, Saeed Reza Kheradpisheh, Alireza Javaheri
- Abstract要約: 本稿では,ディープラーニングに着目し,作業の質を向上させるための3つの幾何学的後処理手法を提案する。
最初の部分では、ImageNetデータセット上で、事前トレーニングされたResNet-50のバックボーンでMask R-CNNを使用します。
第2段階では、3つの幾何学的後処理法を第1部の出力に適用し、全体的な出力を改善する。
- 参考スコア(独自算出の注目度): 1.0019706819513459
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recently, there has been a high demand for accelerating and improving the
detection of automatic cadastral mapping. As this problem is in its starting
point, there are many methods of computer vision and deep learning that have
not been considered yet. In this paper, we focus on deep learning and provide
three geometric post-processing methods that improve the quality of the work.
Our framework includes two parts, each of which consists of a few phases. Our
solution to this problem uses instance segmentation. In the first part, we use
Mask R-CNN with the backbone of pre-trained ResNet-50 on the ImageNet dataset.
In the second phase, we apply three geometric post-processing methods to the
output of the first part to get better overall output. Here, we also use
computational geometry to introduce a new method for simplifying lines which we
call it pocket-based simplification algorithm. For evaluating the quality of
our solution, we use popular formulas in this field which are recall, precision
and F-score. The highest recall we gain is 95 percent which also maintains high
Precision of 72 percent. This resulted in an F-score of 82 percent.
Implementing instance segmentation using Mask R-CNN with some geometric
post-processes to its output gives us promising results for this field. Also,
results show that pocket-based simplification algorithms work better for
simplifying lines than Douglas-Puecker algorithm.
- Abstract(参考訳): 近年,自動キャダストラムマッピングの検出の高速化と改善が求められている。
この問題は出発点にあるため、コンピュータビジョンやディープラーニングには、まだ考慮されていない多くの方法がある。
本稿では,深層学習に着目し,作業の質を向上させる3つの幾何学的後処理手法を提案する。
私たちのフレームワークには2つの部分が含まれています。
この問題の解決策はインスタンスセグメンテーションを使います。
最初の部分では、ImageNetデータセット上で事前トレーニングされたResNet-50のバックボーンでMask R-CNNを使用します。
第2フェーズでは,3つの幾何学的後処理手法を第1部の出力に適用し,全体の出力を改善する。
また, 計算幾何学を用いて, ポケット型単純化アルゴリズムと呼ばれる, 直線を単純化する新しい手法を提案する。
ソリューションの品質を評価するために、この分野で人気のある公式は、リコール、精度、およびf-scoreである。
最も高いリコールは95%で、72%の精度を維持しています。
その結果、Fスコアは82%となった。
Mask R-CNN を用いたインスタンスセグメンテーションの実装とその出力に対する幾何的な後処理により、この分野で有望な結果が得られる。
また,pocket-based simplification アルゴリズムはdouglas-puecker アルゴリズムよりもシンプルに動作することを示した。
関連論文リスト
- Deep Gaussian mixture model for unsupervised image segmentation [1.3654846342364308]
多くのタスクにおいて、十分なピクセルレベルのラベルを得るのは非常に困難である。
本稿では,ガウス混合モデル(GMM)と教師なしディープラーニング技術を組み合わせた手法を提案する。
マルチシーケンスMRI画像における梗塞領域分割の例について, 様々な実験において本手法の利点を実証する。
論文 参考訳(メタデータ) (2024-04-18T15:20:59Z) - Improving Pixel-based MIM by Reducing Wasted Modeling Capability [77.99468514275185]
浅い層から低レベルの特徴を明示的に利用して画素再構成を支援する手法を提案する。
私たちの知る限りでは、等方的アーキテクチャのためのマルチレベル特徴融合を体系的に研究するのは、私たちは初めてです。
提案手法は, 微調整では1.2%, 線形探索では2.8%, セマンティックセグメンテーションでは2.6%など, 大幅な性能向上をもたらす。
論文 参考訳(メタデータ) (2023-08-01T03:44:56Z) - PixMIM: Rethinking Pixel Reconstruction in Masked Image Modeling [83.67628239775878]
Masked Image Modeling (MIM) は Masked Autoencoders (MAE) と BEiT の出現によって有望な進歩を遂げた。
本稿では,画素再構成の観点からMIMの基本解析を行う。
我々は,2つの戦略を包含する極めて単純で効果的な方法,weelmethodを提案する。
論文 参考訳(メタデータ) (2023-03-04T13:38:51Z) - Towards Better Out-of-Distribution Generalization of Neural Algorithmic
Reasoning Tasks [51.8723187709964]
ニューラルネットワーク推論タスクのOOD一般化について検討する。
目標は、ディープニューラルネットワークを使用して入出力ペアからアルゴリズムを学ぶことである。
論文 参考訳(メタデータ) (2022-11-01T18:33:20Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - Human Body Model Fitting by Learned Gradient Descent [48.79414884222403]
画像に3次元の人体形状を適合させる新しいアルゴリズムを提案する。
このアルゴリズムは高速(約120ms収束)で、データセットに頑健であり、公開評価データセットの最先端結果が得られることを示す。
論文 参考訳(メタデータ) (2020-08-19T14:26:47Z) - TextureWGAN: Texture Preserving WGAN with MLE Regularizer for Inverse
Problems [4.112614964808275]
提案手法の中で最も一般的で効果的な方法は平均二乗誤差(MSE)を持つ畳み込みニューラルネットワーク(CNN)である。
逆問題に対するWGAN(Wasserstein GAN)に基づく新しい手法を提案する。
We showed that the WGAN-based method was effective to maintain image texture, it also also used a maximum max estimation regularizer (MLE) to maintain pixel fidelity。
論文 参考訳(メタデータ) (2020-08-11T17:06:34Z) - A deep primal-dual proximal network for image restoration [8.797434238081372]
我々は、プリミティブ・デュアル・イテレーションから構築されたディープPDNetというディープネットワークを設計し、前もって分析を行い、標準的なペナル化可能性の最小化を図った。
フルラーニング」と「パートラーニング」の2つの異なる学習戦略が提案され、第1は最も効率的な数値である。
以上の結果から,提案したDeepPDNetは,MNISTと,より複雑なBSD68,BSD100,SET14データセットにおいて,画像復元と単一画像超解像処理に優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-02T08:29:52Z) - FarSee-Net: Real-Time Semantic Segmentation by Efficient Multi-scale
Context Aggregation and Feature Space Super-resolution [14.226301825772174]
Cascaded Factorized Atrous Space Pyramid Pooling (CF-ASPP) と呼ばれる新しい効率的なモジュールについて紹介する。
これは畳み込みニューラルネットワーク(CNN)のための軽量なカスケード構造であり、コンテキスト情報を効率的に活用する。
我々は1枚のNivida Titan X (Maxwell) GPUカードでCityscapesテストセットの84fpsで68.4% mIoUを達成した。
論文 参考訳(メタデータ) (2020-03-09T03:53:57Z) - BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation [103.74690082121079]
本研究では,インスタンスレベルの情報とセマンティックな情報と,低レベルの微細な粒度を効果的に組み合わせることで,マスク予測の改善を実現する。
私たちの主な貢献は、トップダウンとボトムアップの両方のインスタンスセグメンテーションアプローチからインスピレーションを得たブレンダーモジュールです。
BlendMaskは、非常に少ないチャネルで、ピクセルあたりの高密度な位置感受性インスタンス機能を効果的に予測し、単一の畳み込み層で各インスタンスの注意マップを学習することができる。
論文 参考訳(メタデータ) (2020-01-02T03:30:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。