論文の概要: Generating Satellite Imagery Data for Wildfire Detection through Mask-Conditioned Generative AI
- arxiv url: http://arxiv.org/abs/2604.02479v1
- Date: Thu, 02 Apr 2026 19:25:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.184405
- Title: Generating Satellite Imagery Data for Wildfire Detection through Mask-Conditioned Generative AI
- Title(参考訳): Mask-Conditioned Generative AIによる山火事検出のための衛星画像データの作成
- Authors: Valeria Martin, K. Brent Venable, Derek Morgan,
- Abstract要約: ペイントベースのパイプラインは、すべてのメトリクスでフルタイル生成を一貫して上回る。
VLMによる塗装は手作りのプロンプトと競合する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The scarcity of labeled satellite imagery remains a fundamental bottleneck for deep-learning (DL)-based wildfire monitoring systems. This paper investigates whether a diffusion-based foundation model for Earth Observation (EO), EarthSynth, can synthesize realistic post-wildfire Sentinel-2 RGB imagery conditioned on existing burn masks, without task-specific retraining. Using burn masks derived from the CalFireSeg-50 dataset (Martin et al., 2025), we design and evaluate six controlled experimental configurations that systematically vary: (i) pipeline architecture (mask-only full generation vs. inpainting with pre-fire context), (ii) prompt engineering strategy (three hand-crafted prompts and a VLM-generated prompt via Qwen2-VL), and (iii) a region-wise color-matching post-processing step. Quantitative assessment on 10 stratified test samples uses four complementary metrics: Burn IoU, burn-region color distance (ΔC_burn), Darkness Contrast, and Spectral Plausibility. Results show that inpainting-based pipelines consistently outperform full-tile generation across all metrics, with the structured inpainting prompt achieving the best spatial alignment (Burn IoU = 0.456) and burn saliency (Darkness Contrast = 20.44), while color matching produces the lowest color distance (ΔC_burn = 63.22) at the cost of reduced burn saliency. VLM-assisted inpainting is competitive with hand-crafted prompts. These findings provide a foundation for incorporating generative data augmentation into wildfire detection pipelines. Code and experiments are available at: https://www.kaggle.com/code/valeriamartinh/genai-all-runned
- Abstract(参考訳): ラベル付き衛星画像の不足は、ディープラーニング(DL)ベースの山火事監視システムにおいて、依然として根本的ボトルネックとなっている。
本研究では,地球観測のための拡散基盤モデルであるEarthSynthが,タスク固有のリトレーニングを伴わずに既存の燃焼マスクに条件付された実戦後センチネル-2 RGB画像の合成が可能かどうかを考察する。
CalFireSeg-50データセット(Martin et al , 2025)から得られたバーンマスクを使用して、系統的に異なる6つの制御された実験構成を設計し、評価する。
(i)パイプラインアーキテクチャ(マスクのみのフルジェネレーション対プレファイアコンテキストの塗装)
(二)プロンプトエンジニアリング戦略(3つの手作りプロンプト及びQwen2-VLによるVLM生成プロンプト)及び
三 地域ごとの色合わせ後処理の工程
層状試料10試料の定量評価には, バーンIoU, バーン領域色距離(ΔC_burn), ダークネスコントラスト, スペクトルプラウザビリティの4つの相補的指標を用いる。
以上の結果から, 塗装系パイプラインは全測定値のフルタイル生成を一貫して上回り, 被塗布が最高の空間アライメント(Burn IoU = 0.456)とバーンサリエンシ(Darkness Contrast = 20.44)を達成し, カラーマッチングは最も低い色距離(ΔC_burn = 63.22)を低減できることがわかった。
VLMによる塗装は手作りのプロンプトと競合する。
これらの知見は、生成的データ拡張を山火事検出パイプラインに組み込む基盤となる。
コードと実験は、https://www.kaggle.com/code/valeriamartinh/genai-all-runned.comで公開されている。
関連論文リスト
- PyroFocus: A Deep Learning Approach to Real-Time Wildfire Detection in Multispectral Remote Sensing Imagery [0.0]
迅速かつ正確な山火事検出は、緊急対応と環境管理に不可欠である。
空中飛行と宇宙飛行のミッションでは、リアルタイムアルゴリズムは火災、活動的な火災、および発射後の条件を区別しなければならない。
火の分類を行い,火の放射力(FRP)レグレッションやセグメンテーションを施した2段パイプラインであるPyroFocusを導入する。
論文 参考訳(メタデータ) (2025-12-02T21:59:45Z) - Seeing Heat with Color -- RGB-Only Wildfire Temperature Inference from SAM-Guided Multimodal Distillation using Radiometric Ground Truth [5.343932820859596]
本稿では,RGB入力のみを用いた画素レベルの山火事温度予測とセグメンテーションのための新しいフレームワークSAM-TIFFを紹介する。
対のRGB-サーマル画像とラジオメトリックのTIFF地上真実を訓練したマルチモーダル教師ネットワークは、知識を単調なRGB学生ネットワークに蒸留し、熱センサレス推論を可能にする。
提案手法は,RGB UAVデータから画素あたりの温度レグレッションを初めて行い,最近のFLAME 3データセットに強い一般化を示すものである。
論文 参考訳(メタデータ) (2025-05-03T00:23:11Z) - DeepArUco++: Improved detection of square fiducial markers in challenging lighting conditions [3.783609886054562]
フィデューシャルマーカー(Fiducial marker)は、オブジェクトのポーズ推定と検出に使用されるコンピュータビジョンツールである。
DeepArUco++は、困難な照明条件下でマーカー検出とデコードを実行するフレームワークである。
システム評価に使用する照明条件に挑戦するために,第2のArUcoマーカーのリアルタイムデータセットを提示する。
論文 参考訳(メタデータ) (2024-11-08T13:18:31Z) - CVT-xRF: Contrastive In-Voxel Transformer for 3D Consistent Radiance Fields from Sparse Inputs [65.80187860906115]
スパース入力によるNeRFの性能向上のための新しい手法を提案する。
まず, サンプル線が, 3次元空間内の特定のボクセルと交差することを保証するために, ボクセルを用いた放射線サンプリング戦略を採用する。
次に、ボクセル内の追加点をランダムにサンプリングし、トランスフォーマーを適用して各線上の他の点の特性を推測し、ボリュームレンダリングに組み込む。
論文 参考訳(メタデータ) (2024-03-25T15:56:17Z) - Implicit Event-RGBD Neural SLAM [54.74363487009845]
神経性SLAMは近年顕著な進歩を遂げている。
既存の手法は、非理想的なシナリオにおいて重大な課題に直面します。
本稿では,最初のイベントRGBD暗黙的ニューラルSLAMフレームワークであるEN-SLAMを提案する。
論文 参考訳(メタデータ) (2023-11-18T08:48:58Z) - ShadowSense: Unsupervised Domain Adaptation and Feature Fusion for
Shadow-Agnostic Tree Crown Detection from RGB-Thermal Drone Imagery [7.2038295985918825]
本稿では,リモートセンシングデータから木冠の影を検出する新しい手法を提案する。
提案手法(ShadowSense)は完全に自己教師型であり,ソースドメインアノテーションを使わずにドメインの敵対的トレーニングを活用する。
その後、両モードの相補的な情報を融合し、RGBで訓練された検出器の予測を効果的に改善する。
論文 参考訳(メタデータ) (2023-10-24T22:01:14Z) - Obscured Wildfire Flame Detection By Temporal Analysis of Smoke Patterns
Captured by Unmanned Aerial Systems [0.799536002595393]
本研究は,RGBカメラのみを搭載したドローンを用いて,隠された山火事をリアルタイムに検出する課題について論じる。
本稿では,ビデオシーケンス中の煙のパターンの時間的解析に基づくセマンティックセグメンテーションを用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2023-06-30T19:45:43Z) - Unsupervised Spike Depth Estimation via Cross-modality Cross-domain Knowledge Transfer [53.413305467674434]
スパイク深度推定をサポートするためにオープンソースのRGBデータを導入し,そのアノテーションと空間情報を活用する。
教師なしスパイク深さ推定を実現するために,クロスモーダルクロスドメイン(BiCross)フレームワークを提案する。
提案手法は,RGB指向の教師なし深度推定法と比較して,最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-08-26T09:35:20Z) - Multitask AET with Orthogonal Tangent Regularity for Dark Object
Detection [84.52197307286681]
暗黒環境下でのオブジェクト検出を強化するために,新しいマルチタスク自動符号化変換(MAET)モデルを提案する。
自己超越的な方法で、MAETは、現実的な照明劣化変換を符号化して復号することで、本質的な視覚構造を学習する。
我々は,合成および実世界のデータセットを用いて最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-05-06T16:27:14Z) - Speak2Label: Using Domain Knowledge for Creating a Large Scale Driver
Gaze Zone Estimation Dataset [55.391532084304494]
ワイルド・データセットのドライバ・ゲイズには、夕方を含む1日の異なる時間に撮影された586の録音が含まれている。
ワイルド・データセットのドライバ・ゲイズには338人の被験者がおり、年齢は18-63歳である。
論文 参考訳(メタデータ) (2020-04-13T14:47:34Z) - UC-Net: Uncertainty Inspired RGB-D Saliency Detection via Conditional
Variational Autoencoders [81.5490760424213]
データラベリングプロセスから学習することで、RGB-Dサリエンシ検出に不確実性を利用するための第1のフレームワーク(UCNet)を提案する。
そこで本研究では,サリエンシデータラベリングにヒントを得て,確率的RGB-Dサリエンシ検出ネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-13T04:12:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。