論文の概要: FLAME Diffuser: Grounded Wildfire Image Synthesis using Mask Guided
Diffusion
- arxiv url: http://arxiv.org/abs/2403.03463v1
- Date: Wed, 6 Mar 2024 04:59:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 16:02:28.777555
- Title: FLAME Diffuser: Grounded Wildfire Image Synthesis using Mask Guided
Diffusion
- Title(参考訳): フレイムディフューザ:マスク誘導拡散を用いた接地ワイルドファイア画像合成
- Authors: Hao Wang, Sayed Pedram Haeri Boroujeni, Xiwen Chen, Ashish Bastola,
Huayu Li, Abolfazl Razi
- Abstract要約: 本研究では,拡散モデルを用いて,真理対のデータセットを生成可能なデータセットオートマトンを提案する。
火炎の位置と大きさを正確に制御しながら、既存の画像に山火事を融合させることができるマスク誘導拡散フレームワークを導入する。
提案するフレームワークは,高品質で真理を呈する画像の膨大なデータセットを生成することができ,特定のタスクにおける注釈付きデータセットのニーズに十分対応できる。
- 参考スコア(独自算出の注目度): 4.143919750726851
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rise of machine learning in recent years has brought benefits to various
research fields such as wide fire detection. Nevertheless, small object
detection and rare object detection remain a challenge. To address this
problem, we present a dataset automata that can generate ground truth paired
datasets using diffusion models. Specifically, we introduce a mask-guided
diffusion framework that can fusion the wildfire into the existing images while
the flame position and size can be precisely controlled. In advance, to fill
the gap that the dataset of wildfire images in specific scenarios is missing,
we vary the background of synthesized images by controlling both the text
prompt and input image. Furthermore, to solve the color tint problem or the
well-known domain shift issue, we apply the CLIP model to filter the generated
massive dataset to preserve quality. Thus, our proposed framework can generate
a massive dataset of that images are high-quality and ground truth-paired,
which well addresses the needs of the annotated datasets in specific tasks.
- Abstract(参考訳): 近年の機械学習の台頭は、広範囲な火災検知などの様々な研究分野に恩恵をもたらした。
それでも、小さな物体検出と希少物体検出は依然として課題である。
この問題に対処するために,拡散モデルを用いて真理対のデータセットを生成できるデータセットオートマトンを提案する。
具体的には,火炎の位置や大きさを正確に制御しながら,既存画像にワイルドファイアを融合できるマスク誘導拡散フレームワークを提案する。
あらかじめ,特定のシナリオにおける山火事画像のデータセットが欠落しているギャップを埋めるために,テキストプロンプトと入力画像の両方を制御して合成画像の背景を変更する。
さらに,カラーティント問題やよく知られた領域シフト問題を解くために,クリップモデルを適用して生成した膨大なデータセットをフィルタリングし,品質を維持する。
したがって,提案するフレームワークは,高品質で真理を呈する画像の膨大なデータセットを生成することができ,特定のタスクにおける注釈付きデータセットのニーズに十分対応できる。
関連論文リスト
- Harmonizing Light and Darkness: A Symphony of Prior-guided Data Synthesis and Adaptive Focus for Nighttime Flare Removal [44.35766203309201]
インセンス光源は、夜間に撮影画像にフレアを発生させることが多く、視覚的品質を劣化させ、下流の用途に悪影響を及ぼす。
効果的なフレア除去ネットワークをトレーニングするためには、信頼できるデータセットが不可欠である。
フレアの明るさが照明法則に合致するマルチフレア画像を含むフレア7K*という先行誘導型データセットを合成する。
クリーンな背景領域を適応的にマスキングし,フレアに強く影響された領域にフォーカスするモデルを支援するためのプラグイン・アンド・プレイ適応型フォーカス・モジュール (AFM) を提案する。
論文 参考訳(メタデータ) (2024-03-30T10:37:56Z) - SynFog: A Photo-realistic Synthetic Fog Dataset based on End-to-end Imaging Simulation for Advancing Real-World Defogging in Autonomous Driving [48.27575423606407]
フォトリアリスティックな霧画像を生成するために,エンド・ツー・エンドのシミュレーションパイプラインを導入する。
我々は、スカイライトとアクティブな照明条件の両方を特徴とするSynFogという新しい合成霧データセットを提案する。
実験の結果,SynFogで訓練したモデルでは,視覚知覚と検出精度が優れていた。
論文 参考訳(メタデータ) (2024-03-25T18:32:41Z) - Thermal Image Calibration and Correction using Unpaired Cycle-Consistent
Adversarial Networks [5.343932820859596]
無人航空機(UAV)は、山火事の監視に柔軟で費用対効果の高いソリューションを提供する。
空中画像を用いた山火事の検出・評価のためのディープラーニングモデルの開発の進展は、既存のデータセットの可用性、サイズ、品質に制限されている。
本稿では,現在の山火事データセットの品質向上をめざして,カメラ技術の進歩に対応するソリューションを提案する。
論文 参考訳(メタデータ) (2024-01-21T20:10:02Z) - Improving Lens Flare Removal with General Purpose Pipeline and Multiple
Light Sources Recovery [69.71080926778413]
フレアアーティファクトは、画像の視覚的品質と下流のコンピュータビジョンタスクに影響を与える。
現在の方法では、画像信号処理パイプラインにおける自動露光やトーンマッピングは考慮されていない。
本稿では、ISPを再検討し、より信頼性の高い光源回収戦略を設計することで、レンズフレア除去性能を向上させるソリューションを提案する。
論文 参考訳(メタデータ) (2023-08-31T04:58:17Z) - CamDiff: Camouflage Image Augmentation via Diffusion Model [83.35960536063857]
CamDiffは、カモフラージュされたシーンで透明なオブジェクトを合成するための新しいアプローチだ。
我々は,潜伏拡散モデルを用いて,カモフラージュされたシーンで有能な物体を合成する。
当社のアプローチでは、フレキシブルな編集と大規模データセットの効率的な生成を低コストで実現している。
論文 参考訳(メタデータ) (2023-04-11T19:37:47Z) - Parents and Children: Distinguishing Multimodal DeepFakes from Natural Images [60.34381768479834]
近年の拡散モデルの発展により、自然言語のテキストプロンプトから現実的なディープフェイクの生成が可能になった。
我々は、最先端拡散モデルにより生成されたディープフェイク検出に関する体系的研究を開拓した。
論文 参考訳(メタデータ) (2023-04-02T10:25:09Z) - Multimodal Wildland Fire Smoke Detection [5.15911752972989]
研究によると、気候変動によって温暖な温度と乾燥状態が生まれ、長い山火事の季節と米国の山火事のリスクが増大する。
スモーキーネット(SmokeyNet)は,森林火災の煙を検出するための時間的情報を用いた深層学習モデルである。
SmokeyNetは、ほんの数分の時間で自動早期通知システムとして機能し、破壊的な山火事との戦いに有用なツールを提供する。
論文 参考訳(メタデータ) (2022-12-29T01:16:06Z) - Image-Based Fire Detection in Industrial Environments with YOLOv4 [53.180678723280145]
この研究は、AIが火災を検出し、認識し、画像ストリーム上のオブジェクト検出を使用して検出時間を短縮する可能性を検討する。
そこで我々は, YOLOv4オブジェクト検出器をベースとした複数のモデルのトレーニングと評価に使用されてきた複数の公開情報源から, 適切なデータを収集, ラベル付けした。
論文 参考訳(メタデータ) (2022-12-09T11:32:36Z) - Unsupervised Wildfire Change Detection based on Contrastive Learning [1.53934570513443]
山火事の深刻度を正確に評価することは, 火災発生地域における燃料条件のキャラクタリゼーションに寄与する。
本研究の目的は、高解像度マルチスペクトル衛星画像上に構築された自律システムを開発することである。
論文 参考訳(メタデータ) (2022-11-26T20:13:14Z) - Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。
2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文 参考訳(メタデータ) (2022-11-22T18:59:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。