論文の概要: Fighting Fires from Space: Leveraging Vision Transformers for Enhanced Wildfire Detection and Characterization
- arxiv url: http://arxiv.org/abs/2504.13776v1
- Date: Fri, 18 Apr 2025 16:25:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-28 14:59:51.486026
- Title: Fighting Fires from Space: Leveraging Vision Transformers for Enhanced Wildfire Detection and Characterization
- Title(参考訳): 宇宙からの消火:野生火災検出・評価のための視覚変換器の活用
- Authors: Aman Agarwal, James Gearon, Raksha Rank, Etienne Chenevert,
- Abstract要約: 森林火災は、人為的な気候変動の結果、世界中の広い地域での強度、頻度、持続時間が増加している。
近年の研究では、衛星画像に基づいて訓練された畳み込みニューラルネットワーク(CNN)による自動山火事検出が、精度の高い結果をもたらすことが証明されている。
ビジョントランスフォーマー (ViT) は, 学習の効率化と, 地域情報とグローバル情報の両方を組み込む能力で, 人気を博している。
- 参考スコア(独自算出の注目度): 0.5374800961359304
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Wildfires are increasing in intensity, frequency, and duration across large parts of the world as a result of anthropogenic climate change. Modern hazard detection and response systems that deal with wildfires are under-equipped for sustained wildfire seasons. Recent work has proved automated wildfire detection using Convolutional Neural Networks (CNNs) trained on satellite imagery are capable of high-accuracy results. However, CNNs are computationally expensive to train and only incorporate local image context. Recently, Vision Transformers (ViTs) have gained popularity for their efficient training and their ability to include both local and global contextual information. In this work, we show that ViT can outperform well-trained and specialized CNNs to detect wildfires on a previously published dataset of LandSat-8 imagery. One of our ViTs outperforms the baseline CNN comparison by 0.92%. However, we find our own implementation of CNN-based UNet to perform best in every category, showing their sustained utility in image tasks. Overall, ViTs are comparably capable in detecting wildfires as CNNs, though well-tuned CNNs are still the best technique for detecting wildfire with our UNet providing an IoU of 93.58%, better than the baseline UNet by some 4.58%.
- Abstract(参考訳): 森林火災は、人為的な気候変動の結果として、世界中の広い地域での強度、頻度、持続時間が増加している。
森林火災に対処する現代の危険検知と応答システムは、持続的な山火事の季節には不十分である。
近年の研究では、衛星画像に基づいて訓練された畳み込みニューラルネットワーク(CNN)による自動山火事検出が、精度の高い結果をもたらすことが証明されている。
しかし、CNNは訓練に費用がかかり、ローカル画像コンテキストのみを取り入れている。
近年、ビジョントランスフォーマー(ViT)は、効率的なトレーニングと、ローカルとグローバルの両方のコンテキスト情報を含む能力で人気を集めている。
本研究では,以前公開されたLandSat-8画像のデータセットを用いて,VTがよく訓練された,専門的なCNNよりも優れていることを示す。
私たちのViTの1つは、ベースラインのCNN比較を0.92%上回っている。
しかし,CNNをベースとしたUNetの実装は,画像タスクの持続的有用性を示すため,各カテゴリで最高の性能を発揮する。
全体としては、VTはCNNとして山火事を検出できるが、十分に調整されたCNNは、UNetがベースラインのUNetよりも約4.58%良い93.58%のIoUを提供するため、山火事を検知する最良のテクニックである。
関連論文リスト
- OA-CNNs: Omni-Adaptive Sparse CNNs for 3D Semantic Segmentation [70.17681136234202]
設計上の違いを再検討し、スパースCNNが達成できることの限界をテストする。
本稿では,このギャップを埋めるために,適応受容場(親和性)と適応関係という2つの重要な要素を提案する。
この調査により、軽量モジュールを統合するネットワークのファミリーであるOmni-Adaptive 3D CNN(OA-CNN)が開発された。
論文 参考訳(メタデータ) (2024-03-21T14:06:38Z) - Obscured Wildfire Flame Detection By Temporal Analysis of Smoke Patterns
Captured by Unmanned Aerial Systems [0.799536002595393]
本研究は,RGBカメラのみを搭載したドローンを用いて,隠された山火事をリアルタイムに検出する課題について論じる。
本稿では,ビデオシーケンス中の煙のパターンの時間的解析に基づくセマンティックセグメンテーションを用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2023-06-30T19:45:43Z) - Hardwiring ViT Patch Selectivity into CNNs using Patch Mixing [64.7892681641764]
我々は視覚変換器(ViT)と畳み込みニューラルネットワーク(CNN)を訓練する
Patch Mixingを用いたトレーニングでは,ViTは改善も劣化もしないことがわかった。
我々は、このトレーニング手法が、VTがすでに持っている能力をCNNでシミュレートする方法であると結論付けている。
論文 参考訳(メタデータ) (2023-06-30T17:59:53Z) - Wildfire Detection Via Transfer Learning: A Survey [2.766371147936368]
本稿では,山頂や森林見張り塔に設置した通常の視界カメラを用いて,山火事の検知に使用されるさまざまなニューラルネットワークモデルについて検討する。
ニューラルネットワークモデルはImageNet-1Kで事前トレーニングされ、カスタムの山火事データセットで微調整される。
論文 参考訳(メタデータ) (2023-06-21T13:57:04Z) - FasterViT: Fast Vision Transformers with Hierarchical Attention [63.50580266223651]
我々は、コンピュータビジョン(CV)アプリケーションのための高速スループットに焦点を当てた、FasterViTという名前のハイブリッドCNN-ViTニューラルネットワークの新たなファミリーを設計する。
新たに導入した階層的注意(HAT)アプローチは,グローバルな自己意識を2次複雑性で分解し,計算コストを削減した多面的注意に分解する。
論文 参考訳(メタデータ) (2023-06-09T18:41:37Z) - InternImage: Exploring Large-Scale Vision Foundation Models with
Deformable Convolutions [95.94629864981091]
この研究は、パラメータの増加やViTsのようなトレーニングデータから得られるインターンイメージと呼ばれる、CNNベースの新しい大規模ファンデーションモデルを提案する。
提案されたInternImageは、従来のCNNの厳格な帰納バイアスを低減し、ViTのような大規模データから、より強く堅牢なパターンを学習できるようにする。
論文 参考訳(メタデータ) (2022-11-10T18:59:04Z) - Analyzing Multispectral Satellite Imagery of South American Wildfires
Using CNNs and Unsupervised Learning [0.0]
本研究では,エクアドルとガラパゴスのランドサット8号の画像をスキップして完全な畳み込みニューラルネットワークを訓練する。
画像セグメンテーションは、K-Means Clusteringを用いてCirrus Cloudバンド上で行われ、連続したピクセル値を3つの離散クラスに単純化する。
さらに2つの畳み込みニューラルネットワークが訓練され、陸地における山火事の存在を分類する。
論文 参考訳(メタデータ) (2022-01-19T02:45:01Z) - Preliminary Wildfire Detection Using State-of-the-art PTZ (Pan, Tilt,
Zoom) Camera Technology and Convolutional Neural Networks [0.0]
野生の火は、人間や自然によって引き起こされる可能性のある環境において、制御されていない火災である。
2020年だけで、カリフォルニア州の山火事は4200万エーカーの土地を燃やし、10,500の建物や建物を破壊し、31人以上が死んだ。
研究の目的は、森林火災が広がるのを防ぐため、初期の段階で森林火災を検出することである。
論文 参考訳(メタデータ) (2021-09-10T19:30:37Z) - VOLO: Vision Outlooker for Visual Recognition [148.12522298731807]
視覚変換器 (ViT) はイメージネット分類において自己注意に基づくモデルの可能性を示している。
我々は、新しい展望の展望を導入し、VoLO(Vision Outlooker)と呼ばれる、シンプルで一般的なアーキテクチャを提示する。
グローバルな依存性モデリングを粗いレベルで重視する自己注意とは異なり、展望はより詳細な機能やコンテキストをトークンに効率的にエンコードする。
実験の結果、私たちのVOLOはImageNet-1K分類で87.1%のトップ1の精度を達成しており、これはこの競合ベンチマークで87%以上の精度で最初のモデルである。
論文 参考訳(メタデータ) (2021-06-24T15:46:54Z) - BreakingBED -- Breaking Binary and Efficient Deep Neural Networks by
Adversarial Attacks [65.2021953284622]
CNNのホワイトボックス攻撃やブラックボックス攻撃に対する堅牢性について検討する。
結果は、蒸留されたCNN、エージェントベースの最新のprunedモデル、およびバイナライズニューラルネットワークのために示されています。
論文 参考訳(メタデータ) (2021-03-14T20:43:19Z) - Modeling Wildfire Perimeter Evolution using Deep Neural Networks [0.0]
本研究では,24時間間における山火事周囲の進化を予測できる山火事拡散モデルを提案する。
このモデルはカリフォルニアのシエラネバダ山脈西部の山火事から、実際の歴史的データセットから、山火事の拡散力学を学習することができる。
論文 参考訳(メタデータ) (2020-09-08T20:06:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。