論文の概要: Improving Satellite Imagery Masking using Multi-task and Transfer Learning
- arxiv url: http://arxiv.org/abs/2412.08545v1
- Date: Wed, 11 Dec 2024 17:00:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 14:02:08.837994
- Title: Improving Satellite Imagery Masking using Multi-task and Transfer Learning
- Title(参考訳): マルチタスク・トランスファー学習による衛星画像のマスキング改善
- Authors: Rangel Daroya, Luisa Vieira Lucchese, Travis Simmons, Punwath Prum, Tamlin Pavelsky, John Gardner, Colin J. Gleason, Subhransu Maji,
- Abstract要約: マスキングの速度/精度の異なるトレードオフを提供するモデル群を提示する。
従来の水画素識別法と比較して,F1スコアは9%向上した。
- 参考スコア(独自算出の注目度): 13.987883100675438
- License:
- Abstract: Many remote sensing applications employ masking of pixels in satellite imagery for subsequent measurements. For example, estimating water quality variables, such as Suspended Sediment Concentration (SSC) requires isolating pixels depicting water bodies unaffected by clouds, their shadows, terrain shadows, and snow and ice formation. A significant bottleneck is the reliance on a variety of data products (e.g., satellite imagery, elevation maps), and a lack of precision in individual steps affecting estimation accuracy. We propose to improve both the accuracy and computational efficiency of masking by developing a system that predicts all required masks from Harmonized Landsat and Sentinel (HLS) imagery. Our model employs multi-tasking to share computation and enable higher accuracy across tasks. We experiment with recent advances in deep network architectures and show that masking models can benefit from these, especially when combined with pre-training on large satellite imagery datasets. We present a collection of models offering different speed/accuracy trade-offs for masking. MobileNet variants are the fastest, and perform competitively with larger architectures. Transformer-based architectures are the slowest, but benefit the most from pre-training on large satellite imagery datasets. Our models provide a 9% F1 score improvement compared to previous work on water pixel identification. When integrated with an SSC estimation system, our models result in a 30x speedup while reducing estimation error by 2.64 mg/L, allowing for global-scale analysis. We also evaluate our model on a recently proposed cloud and cloud shadow estimation benchmark, where we outperform the current state-of-the-art model by at least 6% in F1 score.
- Abstract(参考訳): 多くのリモートセンシングアプリケーションは、その後の測定のために衛星画像にピクセルのマスキングを用いる。
例えば、SSC (Suspended Sediment concentration) のような水質変動を推定するには、雲、その影、地形の影、雪や氷の形成に影響を受けない水域を表す画素を分離する必要がある。
重要なボトルネックは、さまざまなデータ製品(衛星画像、標高マップなど)への依存と、推定精度に影響を与える個々のステップにおける精度の欠如である。
本研究では,ハロゲン化ランドサットとセンチネル(HLS)の画像から必要なマスクをすべて予測するシステムを開発することにより,マスキングの精度と計算効率を改善することを提案する。
我々のモデルはマルチタスクを用いて計算を共有し、タスク間で高い精度を実現する。
我々は、近年のディープネットワークアーキテクチャの進歩を実験し、特に大規模な衛星画像データセットの事前トレーニングと組み合わせることで、マスキングモデルがこれらの恩恵を受けることを示す。
マスキングの速度/精度の異なるトレードオフを提供するモデル群を提示する。
MobileNetは最も高速で、より大きなアーキテクチャと競合する。
トランスフォーマーベースのアーキテクチャは最も遅いが、大きな衛星画像データセットの事前トレーニングの恩恵を受ける。
従来の水画素識別法と比較して,F1スコアは9%向上した。
SSC推定システムと統合すると,推定誤差を2.64mg/L削減し,30倍の高速化を実現した。
我々はまた、最近提案されたクラウドとクラウドのシャドウ推定ベンチマークでモデルを評価し、F1スコアの少なくとも6%は現在の最先端モデルよりも優れています。
関連論文リスト
- Edge-Cloud Collaborative Satellite Image Analysis for Efficient Man-Made Structure Recognition [2.110762118285028]
本稿では,エッジとクラウドコンピューティングを組み合わせた新しい衛星画像処理アーキテクチャを提案する。
エッジに軽量モデルを採用することで、当初は衛星画像から人造構造を特定できる。
これらの識別された画像はクラウドに送信され、より複雑なモデルによって分類が洗練される。
論文 参考訳(メタデータ) (2024-10-08T03:31:32Z) - Seeing Through the Clouds: Cloud Gap Imputation with Prithvi Foundation Model [1.2374541748245838]
マルチスペクトル衛星画像の時系列において,視覚変換器(ViT)モデルと基本条件生成逆数ネットワーク(CGAN)モデルを比較した。
現実のクラウドマスクを用いて衛星画像の時系列をランダムにマスキングし、各モデルをトレーニングし、欠落したピクセルを再構築する。
論文 参考訳(メタデータ) (2024-04-30T15:03:27Z) - Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - CLiSA: A Hierarchical Hybrid Transformer Model using Orthogonal Cross
Attention for Satellite Image Cloud Segmentation [5.178465447325005]
ディープラーニングアルゴリズムは画像セグメンテーション問題を解決するための有望なアプローチとして登場してきた。
本稿では,Lipschitz Stable Attention NetworkによるCLiSA - Cloudセグメンテーションという,効果的なクラウドマスク生成のためのディープラーニングモデルを提案する。
Landsat-8, Sentinel-2, Cartosat-2sを含む複数の衛星画像データセットの質的および定量的な結果を示す。
論文 参考訳(メタデータ) (2023-11-29T09:31:31Z) - Diffusion Models for Interferometric Satellite Aperture Radar [73.01013149014865]
確率拡散モデル (Probabilistic Diffusion Models, PDMs) は、最近、非常に有望な生成モデルのクラスとして登場した。
ここでは、PDMを活用して、レーダーベースの衛星画像データセットを複数生成する。
PDMは複雑で現実的な構造を持つ画像を生成することに成功したが、サンプリング時間は依然として問題である。
論文 参考訳(メタデータ) (2023-08-31T16:26:17Z) - An Adversarial Active Sampling-based Data Augmentation Framework for
Manufacturable Chip Design [55.62660894625669]
リソグラフィーモデリングは、チップ設計マスクが製造可能であることを保証するため、チップ設計において重要な問題である。
機械学習の最近の進歩は、時間を要するリソグラフィーシミュレーションをディープニューラルネットワークに置き換えるための代替ソリューションを提供している。
本稿では,限られたデータのジレンマを解消し,機械学習モデルの性能を向上させるために,データ拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-27T20:53:39Z) - SatMAE: Pre-training Transformers for Temporal and Multi-Spectral
Satellite Imagery [74.82821342249039]
Masked Autoencoder(MAE)に基づく時間・マルチスペクトル衛星画像の事前学習フレームワークであるSatMAEについて述べる。
時間的情報を活用するために、時間にわたって画像パッチを個別にマスキングする時間的埋め込みを含む。
論文 参考訳(メタデータ) (2022-07-17T01:35:29Z) - Deep Learning for Real Time Satellite Pose Estimation on Low Power Edge
TPU [58.720142291102135]
本稿では,ニューラルネットワークアーキテクチャを利用したポーズ推定ソフトウェアを提案する。
我々は、低消費電力の機械学習アクセラレーターが宇宙での人工知能の活用を可能にしていることを示す。
論文 参考訳(メタデータ) (2022-04-07T08:53:18Z) - Analysis and Adaptation of YOLOv4 for Object Detection in Aerial Images [0.0]
本研究は,空中画像中の物体とその位置を予測するためのYOLOv4フレームワークの適応性を示す。
トレーニングされたモデルは平均的な平均精度(mAP)が45.64%となり、推論速度はTesla K80 GPUで8.7FPSに達した。
いくつかの現代の空中物体検出器との比較研究により、YOLOv4はより優れた性能を示し、航空プラットフォームに組み込むのにより適した検出アルゴリズムが示唆された。
論文 参考訳(メタデータ) (2022-03-18T23:51:09Z) - 2-speed network ensemble for efficient classification of incremental
land-use/land-cover satellite image chips [2.362412515574206]
衛星画像データの増大は、産業や政府にとって、データ駆動的な決定を下すことの難しさを浮き彫りにしている。
ビッグデータのコンテキストにおける再トレーニングのコストは,新たなイメージデータやクラスをトレーニングコーパスに追加する場合に,現実的な課題となる。
提案されたアンサンブルとスタッガードトレーニングスケジュールは、スケーラブルで費用対効果の高い衛星画像分類スキームを提供する。
論文 参考訳(メタデータ) (2022-03-15T21:36:05Z) - Lidar Light Scattering Augmentation (LISA): Physics-based Simulation of
Adverse Weather Conditions for 3D Object Detection [60.89616629421904]
ライダーベースの物体検出器は、自動運転車のような自律ナビゲーションシステムにおいて、3D知覚パイプラインの重要な部分である。
降雨、雪、霧などの悪天候に敏感で、信号-雑音比(SNR)と信号-背景比(SBR)が低下している。
論文 参考訳(メタデータ) (2021-07-14T21:10:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。