論文の概要: Assessment of a new GeoAI foundation model for flood inundation mapping
- arxiv url: http://arxiv.org/abs/2309.14500v4
- Date: Fri, 3 Nov 2023 21:58:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 20:50:31.181398
- Title: Assessment of a new GeoAI foundation model for flood inundation mapping
- Title(参考訳): 洪水浸水マッピングのための新しいGeoAI基盤モデルの評価
- Authors: Wenwen Li, Hyunho Lee, Sizhe Wang, Chia-Yu Hsu, Samantha T. Arundel
- Abstract要約: そこで本稿は,IBM-NASAのPrithviによる地空間基盤モデルの性能評価を行い,地空間解析の重要課題である洪水浸水マッピングを支援する。
実験では、ベンチマークデータセットであるSen1Floods11を使用し、モデルの予測可能性、一般化可能性、転送可能性を評価する。
以上の結果から, 未確認領域におけるセグメンテーションにおけるPrithviモデルの性能上の優位性が示された。
- 参考スコア(独自算出の注目度): 4.312965283062856
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision foundation models are a new frontier in Geospatial Artificial
Intelligence (GeoAI), an interdisciplinary research area that applies and
extends AI for geospatial problem solving and geographic knowledge discovery,
because of their potential to enable powerful image analysis by learning and
extracting important image features from vast amounts of geospatial data. This
paper evaluates the performance of the first-of-its-kind geospatial foundation
model, IBM-NASA's Prithvi, to support a crucial geospatial analysis task: flood
inundation mapping. This model is compared with convolutional neural network
and vision transformer-based architectures in terms of mapping accuracy for
flooded areas. A benchmark dataset, Sen1Floods11, is used in the experiments,
and the models' predictability, generalizability, and transferability are
evaluated based on both a test dataset and a dataset that is completely unseen
by the model. Results show the good transferability of the Prithvi model,
highlighting its performance advantages in segmenting flooded areas in
previously unseen regions. The findings also indicate areas for improvement for
the Prithvi model in terms of adopting multi-scale representation learning,
developing more end-to-end pipelines for high-level image analysis tasks, and
offering more flexibility in terms of input data bands.
- Abstract(参考訳): ビジョンファウンデーションモデルは、地理空間的問題解決と地理知識発見のためにAIを適用し拡張する学際的な研究領域であるGeoAI(Geospatial Artificial Intelligence)の新しいフロンティアである。
そこで本稿は,IBM-NASAのPrithviによる地空間基盤モデルの性能評価を行い,地空間解析の重要課題である洪水浸水マッピングを支援する。
このモデルは、畳み込みニューラルネットワークや視覚トランスフォーマーベースのアーキテクチャと、浸水した地域のマッピング精度で比較される。
ベンチマークデータセットであるsen1floods11を実験に使用し、そのモデルによって完全に認識されていないテストデータセットとデータセットの両方に基づいて、モデルの予測可能性、一般化性、転送性を評価する。
以上の結果から, 未確認領域におけるセグメンテーションにおけるPrithviモデルの性能上の優位性が示された。
また,マルチスケールな表現学習の導入,高レベルの画像解析タスクのためのエンドツーエンドパイプラインの開発,入力データバンドの柔軟性の向上などにより,Prithviモデルの改善を図っている。
関連論文リスト
- Segment Anything Model Can Not Segment Anything: Assessing AI Foundation
Model's Generalizability in Permafrost Mapping [19.307294875969827]
本稿では,AI基盤モデルとその定義特性を紹介する。
我々は、大規模AIビジョンモデル、特にMetaのセグメンション・アプライシング・モデル(SAM)の性能を評価する。
結果は、SAMには将来性はあるものの、AIの拡張された地形マッピングをサポートするための改善の余地があることを示している。
論文 参考訳(メタデータ) (2024-01-16T19:10:09Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Recognize Any Regions [59.08881073582635]
RegionSpotは、ローカライゼーション基盤モデルから位置認識のローカライゼーション知識と、ViLモデルから抽出されたセマンティック情報を統合するように設計されている。
我々のモデルは平均的精度(mAP)でGLIPを6.5%上回り、より困難で稀なカテゴリーではさらに14.8%の差がある。
論文 参考訳(メタデータ) (2023-11-02T16:31:49Z) - GEO-Bench: Toward Foundation Models for Earth Monitoring [139.77907168809085]
6つの分類と6つのセグメンテーションタスクからなるベンチマークを提案する。
このベンチマークは、さまざまな地球観測タスクの進行の原動力となる。
論文 参考訳(メタデータ) (2023-06-06T16:16:05Z) - On the Opportunities and Challenges of Foundation Models for Geospatial
Artificial Intelligence [39.86997089245117]
ファンデーションモデル(FM)は、微調整、少数ショット、ゼロショット学習によって、幅広い下流タスクに適応することができる。
我々は,GeoAIのためのFMを開発する上で大きな課題の一つとして,地理空間的タスクのマルチモーダル性に対処することを提案する。
論文 参考訳(メタデータ) (2023-04-13T19:50:17Z) - GeoNet: Benchmarking Unsupervised Adaptation across Geographies [71.23141626803287]
地理的ロバスト性の問題について検討し、3つの主要な貢献を行う。
まず,地理的適応のための大規模データセットGeoNetを紹介する。
第2に、シーンコンテキストにおける大きな変化から、ドメインシフトの主な原因が生じるという仮説を立てる。
第3に、最先端の教師なしドメイン適応アルゴリズムとアーキテクチャを広範囲に評価する。
論文 参考訳(メタデータ) (2023-03-27T17:59:34Z) - Explainable GeoAI: Can saliency maps help interpret artificial
intelligence's learning process? An empirical study on natural feature
detection [4.52308938611108]
本稿では,GeoAIと深層学習モデルの推論行動の解釈において,一般的なサリエンシマップ生成手法とその長所と短所を比較した。
実験では、2つのGeoAI対応データセットを使用して、研究結果の一般化性を実証した。
論文 参考訳(メタデータ) (2023-03-16T21:37:29Z) - Towards Geospatial Foundation Models via Continual Pretraining [22.825065739563296]
資源コストと炭素の影響を最小限に抑えた高効率基礎モデルを構築するための新しいパラダイムを提案する。
まず、複数のソースからコンパクトだが多様なデータセットを構築し、GeoPileと呼ぶ特徴の多様性を促進する。
次に,大規模なImageNet-22kモデルからの継続事前学習の可能性について検討し,多目的連続事前学習パラダイムを提案する。
論文 参考訳(メタデータ) (2023-02-09T07:39:02Z) - A General Purpose Neural Architecture for Geospatial Systems [142.43454584836812]
本稿では,空間的帰納バイアスを持つ汎用ニューラルアーキテクチャ(GPNA)の構築に向けたロードマップを示す。
このようなモデルがコミュニティのメンバー間の協力をいかに促進するかを考察する。
論文 参考訳(メタデータ) (2022-11-04T09:58:57Z) - PetroGAN: A novel GAN-based approach to generate realistic, label-free
petrographic datasets [0.0]
本研究では,GAN(Generative Adversarial Network)に基づく新しいディープラーニングフレームワークを開発し,最初のリアルな合成石油写真データセットを作成する。
トレーニングデータセットは、平面光と横偏光の両方で岩石の薄い部分の10070枚の画像で構成されている。
このアルゴリズムは264のGPU時間で訓練され、ペトログラフ画像のFr'echet Inception Distance(FID)スコアが12.49に達した。
論文 参考訳(メタデータ) (2022-04-07T01:55:53Z) - Structured Landmark Detection via Topology-Adapting Deep Graph Learning [75.20602712947016]
解剖学的顔と医学的ランドマーク検出のための新しいトポロジ適応深層グラフ学習手法を提案する。
提案手法は局所像特徴と大域形状特徴の両方を利用するグラフ信号を構成する。
3つの公開顔画像データセット(WFLW、300W、COFW-68)と3つの現実世界のX線医学データセット(ケパロメトリ、ハンド、ペルビス)で実験を行った。
論文 参考訳(メタデータ) (2020-04-17T11:55:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。