論文の概要: Transmission-Guided Bayesian Generative Model for Smoke Segmentation
- arxiv url: http://arxiv.org/abs/2303.00900v1
- Date: Thu, 2 Mar 2023 01:48:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-03 16:27:48.359248
- Title: Transmission-Guided Bayesian Generative Model for Smoke Segmentation
- Title(参考訳): 煙セグメンテーションのための透過誘導ベイズ生成モデル
- Authors: Siyuan Yan, Jing Zhang, Nick Barnes
- Abstract要約: 深層ニューラルネットワークは、その非厳密な形状と透明な外観のために、煙分断を過信する傾向にある。
これは、正確な煙分別のための限られた訓練データによる知識レベルの不確かさと、地味のラベル付けの難しさを表すラベル付けレベルの不確実性の両方によって引き起こされる。
本稿では,モデルパラメータの後方分布とその予測を同時に推定するベイズ生成モデルを提案する。
また,1,400個の実画像と4,000個の合成画像からなる高品質な煙分画データセットSMOKE5Kを画素単位のアノテーションで提供した。
- 参考スコア(独自算出の注目度): 29.74065829663554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Smoke segmentation is essential to precisely localize wildfire so that it can
be extinguished in an early phase. Although deep neural networks have achieved
promising results on image segmentation tasks, they are prone to be
overconfident for smoke segmentation due to its non-rigid shape and transparent
appearance. This is caused by both knowledge level uncertainty due to limited
training data for accurate smoke segmentation and labeling level uncertainty
representing the difficulty in labeling ground-truth. To effectively model the
two types of uncertainty, we introduce a Bayesian generative model to
simultaneously estimate the posterior distribution of model parameters and its
predictions. Further, smoke images suffer from low contrast and ambiguity,
inspired by physics-based image dehazing methods, we design a
transmission-guided local coherence loss to guide the network to learn
pair-wise relationships based on pixel distance and the transmission feature.
To promote the development of this field, we also contribute a high-quality
smoke segmentation dataset, SMOKE5K, consisting of 1,400 real and 4,000
synthetic images with pixel-wise annotation. Experimental results on benchmark
testing datasets illustrate that our model achieves both accurate predictions
and reliable uncertainty maps representing model ignorance about its
prediction. Our code and dataset are publicly available at:
https://github.com/redlessme/Transmission-BVM.
- Abstract(参考訳): 煙のセグメンテーションは野火を早期に消火できるように正確に局所化するのに不可欠である。
深層ニューラルネットワークは画像分割タスクで有望な結果を得たが、その非剛性形状と透明な外観のため、煙のセグメンテーションには過度に信頼しがちである。
これは、正確な煙分別のための限られた訓練データによる知識レベルの不確かさと、地味のラベル付けの難しさを表すラベル付けレベルの不確実性の両方に起因する。
2種類の不確かさを効果的にモデル化するために,モデルパラメータの後方分布とその予測を同時に推定するベイズ生成モデルを提案する。
さらに,物理ベースの画像デハジング法に触発されて,低コントラストと曖昧さに苦しむスモーク画像に対して,伝送誘導局所コヒーレンス損失の設計を行い,画素距離と伝送特性に基づく対関係の学習を誘導する。
また,この分野の発展を促進するために,1,400個の実画像と4,000個の合成画像からなる高品質な煙分画データセットSMOKE5Kを提案する。
ベンチマークテストデータセットにおける実験の結果から,モデルが正確な予測と,モデル非依存を表す信頼性の高い不確実性マップの両方を達成できることが分かる。
私たちのコードとデータセットは、https://github.com/redlessme/Transmission-BVMで公開されています。
関連論文リスト
- Sub-graph Based Diffusion Model for Link Prediction [43.15741675617231]
拡散確率モデル(Denoising Diffusion Probabilistic Models, DDPM)は、例外的な品質を持つ同時代の生成モデルである。
本研究では,ベイズ式による確率推定過程を分解するために,専用設計を用いたリンク予測のための新しい生成モデルを構築した。
提案手法は,(1)再トレーニングを伴わないデータセット間の転送可能性,(2)限られたトレーニングデータに対する有望な一般化,(3)グラフ敵攻撃に対する堅牢性など,多くの利点を示す。
論文 参考訳(メタデータ) (2024-09-13T02:23:55Z) - SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - Exploiting Diffusion Prior for Generalizable Dense Prediction [85.4563592053464]
近年のテキスト・トゥ・イメージ(T2I)拡散モデルでは、既成の高密度予測器では予測できないことがある。
我々は,事前学習したT2Iモデルを用いたパイプラインDMPを,高密度予測タスクの先駆けとして導入する。
限られたドメインのトレーニングデータにもかかわらず、この手法は任意の画像に対して忠実に推定し、既存の最先端のアルゴリズムを超越する。
論文 参考訳(メタデータ) (2023-11-30T18:59:44Z) - Hierarchical Uncertainty Estimation for Medical Image Segmentation
Networks [1.9564356751775307]
不確実性は、モデルトレーニングに使用される画像(ノイズ)と手動アノテーション(ヒューマンエラーとバイアス)の両方に存在する。
本稿では,複数のレベルで不確かさを推定する簡易かつ効果的な手法を提案する。
U-netのようなディープラーニングセグメンテーションネットワークは,高いセグメンテーション性能を実現することができることを示す。
論文 参考訳(メタデータ) (2023-08-16T16:09:23Z) - ExposureDiffusion: Learning to Expose for Low-light Image Enhancement [87.08496758469835]
この研究は、拡散モデルと物理ベースの露光モデルとをシームレスに統合することで、この問題に対処する。
提案手法は,バニラ拡散モデルと比較して性能が大幅に向上し,推論時間を短縮する。
提案するフレームワークは、実際のペア付きデータセット、SOTAノイズモデル、および異なるバックボーンネットワークの両方で動作する。
論文 参考訳(メタデータ) (2023-07-15T04:48:35Z) - Masked Images Are Counterfactual Samples for Robust Fine-tuning [77.82348472169335]
微調整の深層学習モデルは、分布内(ID)性能と分布外(OOD)堅牢性の間のトレードオフにつながる可能性がある。
そこで本研究では,マスク付き画像を対物サンプルとして用いて,ファインチューニングモデルのロバスト性を向上させる新しいファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T11:51:28Z) - Unsupervised Foggy Scene Understanding via Self Spatial-Temporal Label
Diffusion [51.11295961195151]
運転シーンの霧画像列の特徴を利用して、自信ある擬似ラベルを密度化する。
局所的な空間的類似性と逐次画像データの隣接時間対応の2つの発見に基づいて,新たなターゲット・ドメイン駆動擬似ラベル拡散方式を提案する。
本手法は,2つの天然霧のデータセット上で51.92%,53.84%の平均交叉結合(mIoU)を達成するのに有効である。
論文 参考訳(メタデータ) (2022-06-10T05:16:50Z) - Y-GAN: Learning Dual Data Representations for Efficient Anomaly
Detection [0.0]
本稿では,Y-GANと呼ばれる新しい再構成モデルを提案する。
モデルはY字型のオートエンコーダで構成され、2つの別々の潜在空間の画像を表現している。
論文 参考訳(メタデータ) (2021-09-28T20:17:04Z) - Learning Accurate Dense Correspondences and When to Trust Them [161.76275845530964]
2つの画像に関連する密度の高い流れ場と、堅牢な画素方向の信頼度マップの推定を目指しています。
フロー予測とその不確実性を共同で学習するフレキシブルな確率的アプローチを開発する。
本手法は,幾何学的マッチングと光フローデータセットに挑戦する最新の結果を得る。
論文 参考訳(メタデータ) (2021-01-05T18:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。