論文の概要: MFGDiffusion: Mask-Guided Smoke Synthesis for Enhanced Forest Fire Detection
- arxiv url: http://arxiv.org/abs/2507.11252v1
- Date: Tue, 15 Jul 2025 12:25:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:03.10633
- Title: MFGDiffusion: Mask-Guided Smoke Synthesis for Enhanced Forest Fire Detection
- Title(参考訳): MFG拡散:森林火災検出のためのマスク誘導煙合成
- Authors: Guanghao Wu, Chen Xu, Hai Song, Chong Wang, Qixing Zhang,
- Abstract要約: スモークは山火事の目に見える最初の指標である。
現在の塗装モデルは、高品質な煙の表現を生成するのに限界がある。
森林火災煙画像を生成するための総合的な枠組みを提案する。
- 参考スコア(独自算出の注目度): 6.307649189539342
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Smoke is the first visible indicator of a wildfire.With the advancement of deep learning, image-based smoke detection has become a crucial method for detecting and preventing forest fires. However, the scarcity of smoke image data from forest fires is one of the significant factors hindering the detection of forest fire smoke. Image generation models offer a promising solution for synthesizing realistic smoke images. However, current inpainting models exhibit limitations in generating high-quality smoke representations, particularly manifesting as inconsistencies between synthesized smoke and background contexts. To solve these problems, we proposed a comprehensive framework for generating forest fire smoke images. Firstly, we employed the pre-trained segmentation model and the multimodal model to obtain smoke masks and image captions.Then, to address the insufficient utilization of masks and masked images by inpainting models, we introduced a network architecture guided by mask and masked image features. We also proposed a new loss function, the mask random difference loss, which enhances the consistency of the generated effects around the mask by randomly expanding and eroding the mask edges.Finally, to generate a smoke image dataset using random masks for subsequent detection tasks, we incorporated smoke characteristics and use a multimodal large language model as a filtering tool to select diverse and reasonable smoke images, thereby improving the quality of the synthetic dataset. Experiments showed that our generated smoke images are realistic and diverse, and effectively enhance the performance of forest fire smoke detection models. Code is available at https://github.com/wghr123/MFGDiffusion.
- Abstract(参考訳): 深層学習の進展に伴い、画像に基づく煙検出は森林火災の検出・防止にとって重要な方法となっている。
しかし,森林火災による煙像データの不足は,森林火災煙の検出を妨げる重要な要因の1つである。
画像生成モデルは、現実的な煙画像の合成に有望なソリューションを提供する。
しかし、現在の塗装モデルは、特に合成煙と背景環境の矛盾として、高品質な煙表現を生成する際の限界を示す。
これらの問題を解決するため,森林火災煙画像を生成するための総合的な枠組みを提案した。
まず,事前に学習したセグメンテーションモデルとマルチモーダルモデルを用いて,マスクと画像キャプションの取得を行った。
また,マスクエッジをランダムに拡大・侵食することでマスク周辺で発生する効果の整合性を高めるマスクランダム差分損失という新たな損失関数を提案し,次に,マスキング特性を取り入れ,多様かつ合理的なスモーク画像を選択するための多モード大言語モデルをフィルタリングツールとして使用し,合成データセットの品質を向上させる。
実験の結果, 生成した煙像は現実的かつ多様であり, 森林火災煙検出モデルの性能を効果的に向上することがわかった。
コードはhttps://github.com/wghr123/MFGDiffusionで入手できる。
関連論文リスト
- A transformer boosted UNet for smoke segmentation in complex backgrounds in multispectral LandSat imagery [17.098729939840716]
煙突は、密度、色、照明、雲、干し草、霧などの背景の変化による検出の課題を示す。
本稿では、スペクトルパターンをキャプチャする仮想バンド構成モジュールからなるVTrUNetと呼ばれる新しいセグメンテーションモデルを提案する。
論文 参考訳(メタデータ) (2024-06-18T23:38:24Z) - BrushNet: A Plug-and-Play Image Inpainting Model with Decomposed
Dual-Branch Diffusion [61.90969199199739]
BrushNetは、ピクセルレベルのマスク付きイメージ機能を事前訓練されたDMに埋め込むために設計された、新しいプラグアンドプレイデュアルブランチモデルである。
BrushNetは、画像品質、マスク領域保存、テキストコヒーレンスを含む7つの主要な指標で、既存のモデルよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-03-11T17:59:31Z) - FLAME Diffuser: Wildfire Image Synthesis using Mask Guided Diffusion [4.038140001938416]
本研究では,現実的な山火事画像を生成するためのトレーニングフリーで拡散型フレームワークを提案する。
われわれのフレームワークは、本物の山火事データからサンプル化した拡張マスクを用いており、現実的な炎の発生を誘導するためにパーリンノイズを適用している。
正規化Frechet Inception Distance, CLIP Score, カスタムCLIP Confidence測定値を用いて生成画像を評価する。
論文 参考訳(メタデータ) (2024-03-06T04:59:38Z) - DiffGANPaint: Fast Inpainting Using Denoising Diffusion GANs [19.690288425689328]
本稿では,不足画素を高速に充填できるDDPMモデルを提案する。
汎用画像インパインティングデータセットの実験は、我々のアプローチが現代のほとんどの作品に匹敵する、あるいは同等であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:50:41Z) - Parents and Children: Distinguishing Multimodal DeepFakes from Natural Images [60.34381768479834]
近年の拡散モデルの発展により、自然言語のテキストプロンプトから現実的なディープフェイクの生成が可能になった。
我々は、最先端拡散モデルにより生成されたディープフェイク検出に関する体系的研究を開拓した。
論文 参考訳(メタデータ) (2023-04-02T10:25:09Z) - Improving Masked Autoencoders by Learning Where to Mask [65.89510231743692]
マスケ画像モデリングは視覚データに対する有望な自己教師型学習手法である。
本稿では,Gumbel-Softmax を用いて,対向学習マスク生成装置とマスク誘導画像モデリングプロセスとを相互接続するフレームワーク AutoMAE を提案する。
実験の結果,AutoMAEは,標準の自己監督型ベンチマークや下流タスクに対して,効果的な事前学習モデルを提供することがわかった。
論文 参考訳(メタデータ) (2023-03-12T05:28:55Z) - Masked Images Are Counterfactual Samples for Robust Fine-tuning [77.82348472169335]
微調整の深層学習モデルは、分布内(ID)性能と分布外(OOD)堅牢性の間のトレードオフにつながる可能性がある。
そこで本研究では,マスク付き画像を対物サンプルとして用いて,ファインチューニングモデルのロバスト性を向上させる新しいファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T11:51:28Z) - MaskSketch: Unpaired Structure-guided Masked Image Generation [56.88038469743742]
MaskSketchは、サンプリング中の余分な条件信号としてガイドスケッチを使用して生成結果の空間的条件付けを可能にする画像生成方法である。
マスク付き生成変換器の中間自己アテンションマップが入力画像の重要な構造情報を符号化していることを示す。
以上の結果から,MaskSketchは誘導構造に対する高画像リアリズムと忠実性を実現する。
論文 参考訳(メタデータ) (2023-02-10T20:27:02Z) - Multimodal Wildland Fire Smoke Detection [5.15911752972989]
研究によると、気候変動によって温暖な温度と乾燥状態が生まれ、長い山火事の季節と米国の山火事のリスクが増大する。
スモーキーネット(SmokeyNet)は,森林火災の煙を検出するための時間的情報を用いた深層学習モデルである。
SmokeyNetは、ほんの数分の時間で自動早期通知システムとして機能し、破壊的な山火事との戦いに有用なツールを提供する。
論文 参考訳(メタデータ) (2022-12-29T01:16:06Z) - Image Inpainting by End-to-End Cascaded Refinement with Mask Awareness [66.55719330810547]
任意の欠落領域を塗りつぶすことは、様々なマスクされた領域で有効な特徴を学ぶことは非自明だから難しい。
符号化フェーズにおける欠落領域のマルチスケール特徴を学習する新しいマスク対応インペイントソリューションを提案する。
私たちのフレームワークは、3つの公開データセットに関する広範な実験を通じて定量的および定性的に検証されます。
論文 参考訳(メタデータ) (2021-04-28T13:17:47Z) - Iterative Facial Image Inpainting using Cyclic Reverse Generator [0.913755431537592]
Cyclic Reverse Generator (CRG)アーキテクチャはエンコーダジェネレータモデルを提供する。
提案モデルを用いて実写画像を生成するには,数回の反復しか十分でないことを実証的に観察した。
本手法では,様々なマスクタイプを用いてスケッチベースのインペインティングを適用でき,多種多様な結果が得られる。
論文 参考訳(メタデータ) (2021-01-18T12:19:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。