論文の概要: Salient Object Detection in Complex Weather Conditions via Noise Indicators
- arxiv url: http://arxiv.org/abs/2512.10592v1
- Date: Thu, 11 Dec 2025 12:33:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:42.358156
- Title: Salient Object Detection in Complex Weather Conditions via Noise Indicators
- Title(参考訳): 騒音指標を用いた複雑な気象条件下での塩物検出
- Authors: Quan Chen, Xiaokai Yang, Tingyu Wang, Rongfeng Lu, Xichun Sheng, Yaoqi Sun, Chenggang Yan,
- Abstract要約: 本稿では,特定のエンコーダと交換可能なデコーダを含む,多様な気象条件に適したフレームワークを提案する。
その結果,提案するSODフレームワークは,バニラエンコーダに比べて複雑な気象条件下でのセグメンテーション精度を向上させることがわかった。
- 参考スコア(独自算出の注目度): 22.611093993931533
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Salient object detection (SOD), a foundational task in computer vision, has advanced from single-modal to multi-modal paradigms to enhance generalization. However, most existing SOD methods assume low-noise visual conditions, overlooking the degradation of segmentation accuracy caused by weather-induced noise in real-world scenarios. In this paper, we propose a SOD framework tailored for diverse weather conditions, encompassing a specific encoder and a replaceable decoder. To enable handling of varying weather noises, we introduce a one-hot vector as a noise indicator to represent different weather types and design a Noise Indicator Fusion Module (NIFM). The NIFM takes both semantic features and the noise indicator as dual inputs and is inserted between consecutive stages of the encoder to embed weather-aware priors via adaptive feature modulation. Critically, the proposed specific encoder retains compatibility with mainstream SOD decoders. Extensive experiments are conducted on the WXSOD dataset under varying training data scales (100%, 50%, 30% of the full training set), three encoder and seven decoder configurations. Results show that the proposed SOD framework (particularly the NIFM-enhanced specific encoder) improves segmentation accuracy under complex weather conditions compared to a vanilla encoder.
- Abstract(参考訳): コンピュータビジョンの基本課題であるSOD(Salient Object Detection)は、一般化を促進するため、単一モードから多モードパラダイムへと進化した。
しかし、既存のSOD法の多くは、現実のシナリオにおける気象騒音によるセグメンテーション精度の低下を見越して、低雑音の視覚条件を前提としている。
本稿では,特定のエンコーダと交換可能なデコーダを含む各種気象条件に適したSODフレームワークを提案する。
各種気象騒音のハンドリングを可能にするため,ノイズインジケータとしてワンホットベクトルを導入し,ノイズインジケータ・フュージョン・モジュール (NIFM) を設計した。
NIFMは、セマンティック特徴とノイズインジケータの両方を二重入力として取り、エンコーダの連続ステージの間に挿入して、適応的な特徴変調によって天気予報を埋め込む。
批判的に、提案された特定のエンコーダは、メインストリームのSODデコーダとの互換性を維持している。
WXSODデータセットでは、トレーニングデータスケール(全トレーニングセットの100%、50%、30%)、エンコーダ3つ、デコーダ7つによる大規模な実験が行われている。
その結果,提案するSODフレームワーク(特にNIFM拡張型特定エンコーダ)は,バニラエンコーダに比べて複雑な気象条件下でのセグメンテーション精度を向上させることがわかった。
関連論文リスト
- Consistency Flow Model Achieves One-step Denoising Error Correction Codes [28.89866643527586]
高忠実度ワンステップ復号のための誤り補正整合流れモデル(ECCFM)を提案する。
ECCFMは自己回帰や拡散に基づくベースラインよりもビットエラー率(BER)が低い。
拡散デコーダよりも30倍から100倍高速な推論速度を提供する。
論文 参考訳(メタデータ) (2025-12-01T08:07:51Z) - UniRSCD: A Unified Novel Architectural Paradigm for Remote Sensing Change Detection [29.17269666665024]
変更検出タスクは、バイナリ変更、災害評価、SCD、BDAなど、出力の粒度が異なるものが存在する。
既存の方法は、異なるタスクをエンコードする際の情報損失を補う特別なデコーダを設計するために、かなりの知識を必要とする。
本論文では,UniCDと命名された汎用的な変更検出アーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-11-22T06:05:01Z) - Spatial-Temporal-Spectral Unified Modeling for Remote Sensing Dense Prediction [20.1863553357121]
リモートセンシングのための現在のディープラーニングアーキテクチャは、基本的に堅固である。
本稿では,統合モデリングのための空間時間スペクトル統一ネットワーク(STSUN)について紹介する。
STSUNは任意の空間サイズ、時間長、スペクトル帯域で入力および出力データに適応することができる。
様々な密集した予測タスクと多様な意味クラス予測を統一する。
論文 参考訳(メタデータ) (2025-05-18T07:39:17Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [92.4205087439928]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基盤モデルとの遅延空間アライメントによるクロスモーダルな知識伝達を確立し、データ不足を効果的に軽減する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
この組み合わせのアプローチにより、FUSEはターゲットデータセットに対する軽量デコーダ適応のみを必要とするユニバーサルなイメージイベントを構築することができる。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - Adaptive Semantic-Enhanced Denoising Diffusion Probabilistic Model for Remote Sensing Image Super-Resolution [7.252121550658619]
Denoising Diffusion Probabilistic Model (DDPM) は画像再構成において有望な性能を示した。
DDPMが生成する高周波の詳細は、モデルが長距離の意味的文脈を見落としているため、HR画像との不一致に悩まされることが多い。
DDPMの詳細な保存能力を高めるために,適応的意味強化DDPM(ASDDPM)を提案する。
論文 参考訳(メタデータ) (2024-03-17T04:08:58Z) - Faster Diffusion: Rethinking the Role of the Encoder for Diffusion Model Inference [95.42299246592756]
本稿では,UNetエンコーダについて検討し,エンコーダの特徴を実証的に分析する。
エンコーダの特徴は最小限に変化するが,デコーダの特徴は時間段階によって大きく異なる。
我々は、テキスト・ツー・ビデオ、パーソナライズド・ジェネレーション、参照誘導ジェネレーションといった他のタスクに対するアプローチを検証する。
論文 参考訳(メタデータ) (2023-12-15T08:46:43Z) - DEED: Dynamic Early Exit on Decoder for Accelerating Encoder-Decoder
Transformer Models [22.276574156358084]
我々は,各デコーダ層が妥当な予測を生成できるように,深層監視で訓練されたマルチエキシット・エンコーダ・デコーダ・トランスフォーマモデルを構築した。
提案手法は,ベースラインに比べて精度が向上し,全体の推論遅延を30%から60%削減できることを示す。
論文 参考訳(メタデータ) (2023-11-15T01:01:02Z) - Locality-Aware Generalizable Implicit Neural Representation [54.93702310461174]
一般化可能な暗黙的ニューラル表現(INR)は、単一の連続関数が複数のデータインスタンスを表現することを可能にする。
本稿では、変換器エンコーダと局所性を考慮したINRデコーダを組み合わせた一般化可能なINRのための新しいフレームワークを提案する。
我々のフレームワークは、従来の一般化可能なINRよりも大幅に優れており、下流タスクにおける局所性を考慮した潜在能力の有効性を検証している。
論文 参考訳(メタデータ) (2023-10-09T11:26:58Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。