論文の概要: Uncertainty-Masked Bernoulli Diffusion for Camouflaged Object Detection Refinement
- arxiv url: http://arxiv.org/abs/2506.10712v1
- Date: Thu, 12 Jun 2025 14:02:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 15:37:22.764793
- Title: Uncertainty-Masked Bernoulli Diffusion for Camouflaged Object Detection Refinement
- Title(参考訳): カモフラージュ物体検出のための不確実性マズケベルヌーイ拡散
- Authors: Yuqi Shen, Fengyang Xiao, Sujie Hu, Youwei Pang, Yifan Pu, Chengyu Fang, Xiu Li, Chunming He,
- Abstract要約: カモフラーゲ型物体検出(COD)は、ターゲットとその背景の微妙な視覚的差異による固有の課題を提示する。
本研究では,COD に特化して設計された最初の生成的改良フレームワークである Uncertainty-Masked Bernoulli Diffusion (UMBD) モデルを提案する。
UMBDは、セグメンテーション品質の低い残留領域にベルヌーイ拡散を選択的に適用する不確実性誘導マスキング機構を導入する。
- 参考スコア(独自算出の注目度): 24.522233459116354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Camouflaged Object Detection (COD) presents inherent challenges due to the subtle visual differences between targets and their backgrounds. While existing methods have made notable progress, there remains significant potential for post-processing refinement that has yet to be fully explored. To address this limitation, we propose the Uncertainty-Masked Bernoulli Diffusion (UMBD) model, the first generative refinement framework specifically designed for COD. UMBD introduces an uncertainty-guided masking mechanism that selectively applies Bernoulli diffusion to residual regions with poor segmentation quality, enabling targeted refinement while preserving correctly segmented areas. To support this process, we design the Hybrid Uncertainty Quantification Network (HUQNet), which employs a multi-branch architecture and fuses uncertainty from multiple sources to improve estimation accuracy. This enables adaptive guidance during the generative sampling process. The proposed UMBD framework can be seamlessly integrated with a wide range of existing Encoder-Decoder-based COD models, combining their discriminative capabilities with the generative advantages of diffusion-based refinement. Extensive experiments across multiple COD benchmarks demonstrate consistent performance improvements, achieving average gains of 5.5% in MAE and 3.2% in weighted F-measure with only modest computational overhead. Code will be released.
- Abstract(参考訳): カモフラーゲ型物体検出(COD)は、ターゲットとその背景の微妙な視覚的差異による固有の課題を提示する。
既存の手法は目覚ましい進歩を遂げているが、まだ十分に研究されていない後処理の改良の可能性は大きい。
この制限に対処するために、COD用に特別に設計された最初の生成的改善フレームワークである不確実性マスケベルヌーイ拡散(UMBD)モデルを提案する。
UMBDは、ベルヌーイ拡散をセグメンテーション品質の低い残留領域に選択的に適用する不確実性誘導マスキング機構を導入し、正しくセグメンテーションされた領域を保存しながら、ターゲットの精製を可能にする。
このプロセスを支援するために,マルチブランチアーキテクチャを用いたHUQNet(Hybrid Uncertainity Quantification Network)を設計し,複数のソースからの不確実性を融合して推定精度を向上させる。
これにより、生成サンプリングプロセス中に適応的なガイダンスが可能になる。
提案したUMBDフレームワークは,既存のEncoder-DecoderベースのCODモデルとシームレスに統合することができ,その識別能力と拡散に基づく改良のジェネレーティブ・アドバンテージを組み合わせることができる。
複数のCODベンチマークによる大規模な実験では、一貫した性能向上が示され、MAEは5.5%、重み付きF測定は3.2%、計算オーバーヘッドはわずかである。
コードはリリースされる。
関連論文リスト
- Towards Better Code Generation: Adaptive Decoding with Uncertainty Guidance [28.99265405319943]
我々はShannon Entropyを介して定量化されたトークンレベルの不確実性によって導かれる適応デコードフレームワークであるAdaDecを紹介する。
AdaDecは従来のビームサーチよりも15.5%の精度向上を実現している。
論文 参考訳(メタデータ) (2025-06-10T16:49:46Z) - Channel Fingerprint Construction for Massive MIMO: A Deep Conditional Generative Approach [65.47969413708344]
CF双生児の概念を導入し、条件付き生成拡散モデル(CGDM)を設計する。
本研究では, 粗粒CFに条件付き観測された細粒CFの対数分布に対するエビデンスローバウンド(ELBO)を導出するために, 変分推論手法を用いる。
提案手法は, ベースラインと比較して, 復元性能が著しく向上していることを示す。
論文 参考訳(メタデータ) (2025-05-12T01:36:06Z) - Theoretical Insights in Model Inversion Robustness and Conditional Entropy Maximization for Collaborative Inference Systems [89.35169042718739]
協調推論により、クラウドサーバに機密データを公開することなく、エンドユーザは強力なディープラーニングモデルを活用することができる。
近年の研究では、これらの中間機能は、情報が漏洩し、生データをモデル反転攻撃(MIA)によって再構築できるため、プライバシーを十分に保持できないことが判明している。
この研究はまず、与えられた中間特徴の入力の条件エントロピーが、任意のMIAの下での再構成平均二乗誤差(MSE)の保証された下界を与えることを理論的に証明する。
そして、ガウス混合推定に基づいて、この条件付きエントロピーを有界化するための微分可能かつ可解な尺度を導出し、逆ロバスト性を高める条件付きエントロピーアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-03-01T07:15:21Z) - Improved Variational Inference in Discrete VAEs using Error Correcting Codes [3.053842954605396]
本研究は, 離散変分オートエンコーダにおける推論を, 生成的視点で解釈することで改善する手法を提案する。
我々は,このモデルを通信システムとして概念化し,誤り訂正符号(ECC)を利用して潜在表現に冗長性を導入することを提案する。
本稿では,2変数の潜伏変数と低複素度繰り返し符号を持つ離散変分オートコーダを用いて概念実証を行い,グローバルおよびローカルなデータ特徴を分離する階層構造に拡張する。
論文 参考訳(メタデータ) (2024-10-10T11:59:58Z) - Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - Predictive Uncertainty Quantification for Bird's Eye View Segmentation: A Benchmark and Novel Loss Function [10.193504550494486]
本稿では,Bird's Eye View (BEV)セグメンテーションにおける予測不確実性定量化のためのベンチマークを提案する。
本研究は,非分類および非分布画素の検出における定量化不確実性の有効性に焦点をあてる。
本研究では,不均衡なデータに特化して設計された新しい損失関数Uncertainty-Focal-Cross-Entropy (UFCE)を提案する。
論文 参考訳(メタデータ) (2024-05-31T16:32:46Z) - OccGen: Generative Multi-modal 3D Occupancy Prediction for Autonomous Driving [15.331332063879342]
OccGenは3Dセマンティック占有予測のタスクのためのシンプルだが強力な生成知覚モデルである。
OccGenは'noise-to-occupancy'生成パラダイムを採用し、占有マップを徐々に推論し精錬する。
この生成パイプラインの重要な洞察は、拡散分解過程が高密度の3D占有マップの粗い微細化をモデル化できるということである。
論文 参考訳(メタデータ) (2024-04-23T13:20:09Z) - CamoDiffusion: Camouflaged Object Detection via Conditional Diffusion
Models [72.93652777646233]
カモフラーゲ型物体検出(COD)は、カモフラーゲ型物体とその周囲の類似性が高いため、コンピュータビジョンにおいて難しい課題である。
本研究では,CODを拡散モデルを利用した条件付きマスク生成タスクとして扱う新しいパラダイムを提案する。
カモ拡散(CamoDiffusion)と呼ばれる本手法では,拡散モデルのデノナイズプロセスを用いてマスクの雑音を反復的に低減する。
論文 参考訳(メタデータ) (2023-05-29T07:49:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。