論文の概要: Fast building segmentation from satellite imagery and few local labels
- arxiv url: http://arxiv.org/abs/2206.05377v1
- Date: Fri, 10 Jun 2022 23:39:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-19 13:32:14.051778
- Title: Fast building segmentation from satellite imagery and few local labels
- Title(参考訳): 衛星画像といくつかのローカルラベルからの高速建物セグメンテーション
- Authors: Caleb Robinson, Anthony Ortiz, Hogeun Park, Nancy Lozano Gracia, Jon
Kher Kaw, Tina Sederholm, Rahul Dodhia, Juan M. Lavista Ferres
- Abstract要約: 非常に高解像度の衛星画像で建物セグメンテーション問題を解決するために,驚くほど少ないラベルが必要であることを示す。
たった527個のスパースポリゴンアノテーションでトレーニングした最良のモデルは、200×200メートルの窓に建つ建物数を数える作業において、足跡の保持よりも0.87個、R2が0.93個をリコールしています。
ヨルダンのアムマンの高分解能画像にモデルを適用し,都市変動検出の事例研究を行った。
- 参考スコア(独自算出の注目度): 4.46034200978842
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Innovations in computer vision algorithms for satellite image analysis can
enable us to explore global challenges such as urbanization and land use change
at the planetary level. However, domain shift problems are a common occurrence
when trying to replicate models that drive these analyses to new areas,
particularly in the developing world. If a model is trained with imagery and
labels from one location, then it usually will not generalize well to new
locations where the content of the imagery and data distributions are
different. In this work, we consider the setting in which we have a single
large satellite imagery scene over which we want to solve an applied problem --
building footprint segmentation. Here, we do not necessarily need to worry
about creating a model that generalizes past the borders of our scene but can
instead train a local model. We show that surprisingly few labels are needed to
solve the building segmentation problem with very high-resolution (0.5m/px)
satellite imagery with this setting in mind. Our best model trained with just
527 sparse polygon annotations (an equivalent of 1500 x 1500 densely labeled
pixels) has a recall of 0.87 over held out footprints and a R2 of 0.93 on the
task of counting the number of buildings in 200 x 200-meter windows. We apply
our models over high-resolution imagery in Amman, Jordan in a case study on
urban change detection.
- Abstract(参考訳): 衛星画像解析のためのコンピュータビジョンアルゴリズムの革新は、都市化や惑星レベルでの土地利用の変化といったグローバルな課題を探求することができる。
しかし、特に発展途上国において、これらの分析を新しい領域に導くモデルを複製しようとすると、ドメインシフト問題はよく発生する。
モデルが1つの場所からの画像とラベルで訓練された場合、通常、画像とデータ分布のコンテンツが異なる新しい場所にはうまく一般化されない。
本研究では,1つの大きな衛星画像シーンを配置し,その上にフットプリントのセグメンテーションを構築するという課題を解決したいと考える。
ここでは、シーンの境界を越えて一般化するモデルを作成する必要はなく、代わりにローカルモデルをトレーニングすることができます。
この設定を念頭に置いて、高解像度(0.5m/px)の衛星画像で建物セグメンテーション問題を解決するために、驚くほど少ないラベルが必要であることを示す。
我々の最良のモデルは、わずか527個のスパースポリゴンアノテーション(1500×1500ピクセルの高密度ラベル付きピクセルに相当する)でトレーニングされ、200×200メートルの窓の建物数をカウントするタスクにおいて、持ち上げられたフットプリントに対して0.87のリコールとR2の0.93のリコールがある。
ヨルダンのアムマンの高分解能画像にモデルを適用し,都市変動検出の事例研究を行った。
関連論文リスト
- xT: Nested Tokenization for Larger Context in Large Images [79.37673340393475]
xTは、グローバルコンテキストを局所的な詳細で集約するビジョントランスフォーマーのフレームワークである。
我々は、挑戦的な分類タスクにおいて、精度を最大8.6%向上させることができる。
論文 参考訳(メタデータ) (2024-03-04T10:29:58Z) - Constraint Model for the Satellite Image Mosaic Selection Problem [4.187648622335092]
衛星画像ソリューションは、地球のさまざまな領域を調査・監視するために広く利用されている。
より大きな関心領域が研究される場合、複数の画像を縫合して単一の大きな画像を作成する必要がある。
本研究では、衛星のSPOT、Pl'eiades、Pl'eiades Neoによって撮影された、現実的で困難な画像のデータセットを提案する。
論文 参考訳(メタデータ) (2023-12-07T10:52:16Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - Inspecting the Geographical Representativeness of Images from
Text-to-Image Models [52.80961012689933]
本研究では,27カ国540人の参加者からなるクラウドソーシング調査を用いて,生成された画像の地理的代表性を測定した。
国名のない故意に特定されていない入力に対して、生成された画像は、主にアメリカの周囲を反映しており、その後インドが続く。
多くの国でのスコアは依然として低いままで、将来のモデルがより地理的に包括的である必要性を強調している。
論文 参考訳(メタデータ) (2023-05-18T16:08:11Z) - Visual Cross-View Metric Localization with Dense Uncertainty Estimates [11.76638109321532]
本研究は、屋外ロボティクスにおける視覚的クロスビューメトリックローカライゼーションに対処する。
地上レベルのカラー画像と局地的な環境を含む衛星パッチが与えられた場合、衛星パッチ内の地上カメラの位置を特定することが課題である。
我々は、より高密度な衛星記述子、ボトルネックにおける類似性マッチング、およびマルチモーダルなローカライゼーションの曖昧さを捉えるための出力としての密度空間分布を備えた新しいネットワークアーキテクチャを考案した。
論文 参考訳(メタデータ) (2022-08-17T20:12:23Z) - Beyond Cross-view Image Retrieval: Highly Accurate Vehicle Localization
Using Satellite Image [91.29546868637911]
本稿では,地上画像と架空衛星地図とをマッチングすることにより,車載カメラのローカライゼーションの問題に対処する。
鍵となる考え方は、タスクをポーズ推定として定式化し、ニューラルネットベースの最適化によってそれを解くことである。
標準自動運転車のローカライゼーションデータセットの実験により,提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2022-04-10T19:16:58Z) - There is a Time and Place for Reasoning Beyond the Image [63.96498435923328]
画像は人間の目へのピクセルだけでなく、他のソースからのコンテキスト情報から推論、関連付け、推論して、推論することで、より完全な画像を確立することができる。
我々は、ニューヨーク・タイムズ(NYT)から自動的に抽出された16k画像と関連するニュース、時間、位置のデータセットTARAと、WITから離れた監視対象として追加で61k例を紹介した。
我々は、最先端のジョイントモデルと人間のパフォーマンスの間に70%のギャップがあることを示し、これは、セグメントワイズ推論を用いて高レベルな視覚言語ジョイントモデルを動機づける提案モデルによってわずかに満たされている。
論文 参考訳(メタデータ) (2022-03-01T21:52:08Z) - Sci-Net: a Scale Invariant Model for Building Detection from Aerial
Images [0.0]
本研究では,空間分解能の異なる空間画像に存在している建物を分割できるスケール不変ニューラルネットワーク(Sci-Net)を提案する。
具体的には,U-Netアーキテクチャを改良し,それを高密度なASPP(Atrous Space Pyramid Pooling)で融合し,微細なマルチスケール表現を抽出した。
論文 参考訳(メタデータ) (2021-11-12T16:45:20Z) - Cross-Region Building Counting in Satellite Imagery using Counting
Consistency [8.732274235941974]
都市分析、災害管理、公共政策決定に欠かせない要素である。
衛星画像のローカライズとカウントのためのディープラーニング手法は、実現可能で安価な代替手段として機能する。
しかし、これらのアルゴリズムは、訓練されていない領域に適用した場合、性能劣化に悩まされる。
論文 参考訳(メタデータ) (2021-10-26T10:36:56Z) - Generating Physically-Consistent Satellite Imagery for Climate Visualizations [53.61991820941501]
我々は,将来的な洪水や森林再生イベントの合成衛星画像を作成するために,生成的敵ネットワークを訓練する。
純粋なディープラーニングベースのモデルでは、洪水の可視化を生成することができるが、洪水の影響を受けない場所では幻覚的な洪水が発生する。
我々は,地球観測におけるセグメンテーションガイドによる画像と画像の変換のためのコードとデータセットを公開している。
論文 参考訳(メタデータ) (2021-04-10T15:00:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。