論文の概要: Reliable Smoke Detection via Optical Flow-Guided Feature Fusion and Transformer-Based Uncertainty Modeling
- arxiv url: http://arxiv.org/abs/2508.14597v1
- Date: Wed, 20 Aug 2025 10:28:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.42506
- Title: Reliable Smoke Detection via Optical Flow-Guided Feature Fusion and Transformer-Based Uncertainty Modeling
- Title(参考訳): 光流動誘導型特徴核融合と変圧器による不確実性モデリングによる信頼性煙検出
- Authors: Nitish Kumar Mahala, Muzammil Khan, Pushpendra Kumar,
- Abstract要約: スモークプラムは、照明の変動、流れのキネマティクス、環境騒音に影響される複雑なダイナミクスを示す。
単眼画像から抽出した煙の特徴表現を統合することで,情報融合フレームワークを提案する。
2相不確かさを意識したWindows Transformerを提案する。
- 参考スコア(独自算出の注目度): 6.270500509647152
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fire outbreaks pose critical threats to human life and infrastructure, necessitating high-fidelity early-warning systems that detect combustion precursors such as smoke. However, smoke plumes exhibit complex spatiotemporal dynamics influenced by illumination variability, flow kinematics, and environmental noise, undermining the reliability of traditional detectors. To address these challenges without the logistical complexity of multi-sensor arrays, we propose an information-fusion framework by integrating smoke feature representations extracted from monocular imagery. Specifically, a Two-Phase Uncertainty-Aware Shifted Windows Transformer for robust and reliable smoke detection, leveraging a novel smoke segmentation dataset, constructed via optical flow-based motion encoding, is proposed. The optical flow estimation is performed with a four-color-theorem-inspired dual-phase level-set fractional-order variational model, which preserves motion discontinuities. The resulting color-encoded optical flow maps are fused with appearance cues via a Gaussian Mixture Model to generate binary segmentation masks of the smoke regions. These fused representations are fed into the novel Shifted-Windows Transformer, which is augmented with a multi-scale uncertainty estimation head and trained under a two-phase learning regimen. First learning phase optimizes smoke detection accuracy, while during the second phase, the model learns to estimate plausibility confidence in its predictions by jointly modeling aleatoric and epistemic uncertainties. Extensive experiments using multiple evaluation metrics and comparative analysis with state-of-the-art approaches demonstrate superior generalization and robustness, offering a reliable solution for early fire detection in surveillance, industrial safety, and autonomous monitoring applications.
- Abstract(参考訳): 火災の発生は人命とインフラに重大な脅威を与え、煙のような燃焼前駆体を検出する高忠実な早期警戒システムを必要とする。
しかし、煙管は、照明の変動、流れの運動学、環境騒音の影響を受け、従来の検出器の信頼性を損なう。
複数センサアレイの論理的複雑さを伴わずにこれらの課題に対処するために,単眼画像から抽出した煙の特徴表現を統合化して情報融合フレームワークを提案する。
具体的には,光フローベースモーションエンコーディングにより構築された新しい煙分画データセットを利用して,安定かつ信頼性の高い煙の検出を行う2相不確かさ対応Windows Transformerを提案する。
光流量推定は, 運動不連続性を保持する四色理論に基づく二相レベルセット分数次変動モデルを用いて行う。
得られた色エンコードされた光フローマップは、ガウス混合モデルを介して外観の手がかりと融合し、煙の領域の2値セグメンテーションマスクを生成する。
これらの融合表現は、マルチスケールの不確実性推定ヘッドで拡張され、2相学習条件下で訓練された、新しいShifted-Windows Transformerに入力される。
第1学習フェーズは煙の検出精度を最適化する一方、第2フェーズでは、アレタリックおよびてんかんの不確実性を共同でモデル化することにより、予測の妥当性の信頼性を推定する。
複数の評価指標と最先端のアプローチとの比較分析を用いた大規模な実験は、監視、産業安全、自律監視アプリケーションにおける早期火災検知のための信頼性の高いソリューションを提供する、優れた一般化と堅牢性を示している。
関連論文リスト
- Solving Inverse Problems with FLAIR [59.02385492199431]
フローベースの潜在生成モデルは、驚くべき品質の画像を生成でき、テキスト・ツー・イメージ生成も可能である。
本稿では,フローベース生成モデルを逆問題の前兆として活用する新しい学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-06-03T09:29:47Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文 参考訳(メタデータ) (2024-08-23T01:53:36Z) - StealthDiffusion: Towards Evading Diffusion Forensic Detection through Diffusion Model [62.25424831998405]
StealthDiffusionは、AI生成した画像を高品質で受け入れがたい敵の例に修正するフレームワークである。
ホワイトボックスとブラックボックスの設定の両方で有効であり、AI生成した画像を高品質な敵の偽造に変換する。
論文 参考訳(メタデータ) (2024-08-11T01:22:29Z) - Dynamical Mode Recognition of Coupled Flame Oscillators by Supervised and Unsupervised Learning Approaches [7.088178570214894]
燃焼不安定は燃焼研究において最も困難な問題の一つである。
多くの燃焼システムの安全かつ信頼性の高い運転を保証するためには,燃焼不安定性の同定と理解が不可欠である。
論文 参考訳(メタデータ) (2024-04-27T06:44:39Z) - A Dual Attentive Generative Adversarial Network for Remote Sensing Image
Change Detection [6.906936669510404]
本稿では,高分解能なリモートセンシング画像変化検出タスクを実現するために,二重注意生成対向ネットワークを提案する。
DAGANフレームワークは、85.01%がIoU、91.48%がF1スコアであり、LEVIRデータセットの先進的な手法よりもパフォーマンスが良い。
論文 参考訳(メタデータ) (2023-10-03T08:26:27Z) - The Surprising Effectiveness of Diffusion Models for Optical Flow and
Monocular Depth Estimation [42.48819460873482]
拡散確率モデルは、その印象的な忠実さと多様性で画像生成を変換した。
また,タスク固有のアーキテクチャや損失関数を使わずに,光学的フローと単眼深度の推定に優れることを示す。
論文 参考訳(メタデータ) (2023-06-02T21:26:20Z) - Transmission-Guided Bayesian Generative Model for Smoke Segmentation [29.74065829663554]
深層ニューラルネットワークは、その非厳密な形状と透明な外観のために、煙分断を過信する傾向にある。
これは、正確な煙分別のための限られた訓練データによる知識レベルの不確かさと、地味のラベル付けの難しさを表すラベル付けレベルの不確実性の両方によって引き起こされる。
本稿では,モデルパラメータの後方分布とその予測を同時に推定するベイズ生成モデルを提案する。
また,1,400個の実画像と4,000個の合成画像からなる高品質な煙分画データセットSMOKE5Kを画素単位のアノテーションで提供した。
論文 参考訳(メタデータ) (2023-03-02T01:48:05Z) - Target-aware Dual Adversarial Learning and a Multi-scenario
Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection [65.30079184700755]
本研究は、物体検出のために異なるように見える赤外線と可視画像の融合の問題に対処する。
従来のアプローチでは、2つのモダリティの根底にある共通点を発見し、反復最適化またはディープネットワークによって共通空間に融合する。
本稿では、融合と検出の連立問題に対する二段階最適化の定式化を提案し、その後、核融合と一般的に使用される検出ネットワークのためのターゲット認識デュアル逆学習(TarDAL)ネットワークに展開する。
論文 参考訳(メタデータ) (2022-03-30T11:44:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。