論文の概要: UDHF2-Net: An Uncertainty-diffusion-model-based High-Frequency TransFormer Network for High-accuracy Interpretation of Remotely Sensed Imagery
- arxiv url: http://arxiv.org/abs/2406.16129v1
- Date: Sun, 23 Jun 2024 15:03:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-25 18:54:26.436282
- Title: UDHF2-Net: An Uncertainty-diffusion-model-based High-Frequency TransFormer Network for High-accuracy Interpretation of Remotely Sensed Imagery
- Title(参考訳): UDHF2-Net:リモートセンシング画像の高精度解釈のための不確かさ拡散モデルに基づく高周波トランスフォーマネットワーク
- Authors: Pengfei Zhang, Chang Li, Yongjun Zhang, Rongjun Qin,
- Abstract要約: リモートセンシング画像高精度解釈(RSIHI)において不確かさ拡散モデルに基づく高周波トランスフォーマーネットワーク(UDHF2-Net)を提案する。
- 参考スコア(独自算出の注目度): 12.24506241611653
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remotely sensed image high-accuracy interpretation (RSIHI), including tasks such as semantic segmentation and change detection, faces the three major problems: (1) complementarity problem of spatially stationary-and-non-stationary frequency; (2) edge uncertainty problem caused by down-sampling in the encoder step and intrinsic edge noises; and (3) false detection problem caused by imagery registration error in change detection. To solve the aforementioned problems, an uncertainty-diffusion-model-based high-Frequency TransFormer network (UDHF2-Net) is the proposed for RSIHI, the superiority of which is as following: (1) a spatially-stationary-and-non-stationary high-frequency connection paradigm (SHCP) is proposed to enhance the interaction of spatially stationary and non-stationary frequency features to yield high-fidelity edge extraction result. Inspired by HRFormer, SHCP remains the high-frequency stream through the whole encoder-decoder process with parallel high-to-low frequency streams and reduces the edge loss by a downsampling operation; (2) a mask-and-geo-knowledge-based uncertainty diffusion module (MUDM) is proposed to improve the robustness and edge noise resistance. MUDM could further optimize the uncertain region to improve edge extraction result by gradually removing the multiple geo-knowledge-based noises; (3) a semi-pseudo-Siamese UDHF2-Net for change detection task is proposed to reduce the pseudo change by registration error. It adopts semi-pseudo-Siamese architecture to extract above complemental frequency features for adaptively reducing registration differencing, and MUDM to recover the uncertain region by gradually reducing the registration error besides above edge noises. Comprehensive experiments were performed to demonstrate the superiority of UDHF2-Net. Especially ablation experiments indicate the effectiveness of UDHF2-Net.
- Abstract(参考訳): 意味的セグメンテーションや変化検出などのタスクを含むリモートセンシング画像の高精度解釈(RSIHI)は,(1)静止・非定常周波数の相補性問題,(2)エンコーダステップのダウンサンプリングと固有エッジノイズによるエッジ不確実性問題,(3)変化検出における画像登録誤差による誤検出問題,の3つの問題に直面している。
以上の問題を解決するために,不確実拡散モデルに基づく高周波数トランスフォーマーネットワーク (UDHF2-Net) が提案され,その優位性は次の通りである。(1) 空間定常非定常高周波数接続パラダイム (SHCP) は,空間定常および非定常周波数特性の相互作用を高めて高周波数エッジ抽出結果を得る。
HRFormerにインスパイアされたSHCPは、エンコーダ-デコーダプロセス全体を通して並列な高低周波ストリームを流れる高周波ストリームを保ち、ダウンサンプリング操作によりエッジ損失を低減する。
MUDMは、複数のジオ知識に基づくノイズを徐々に除去することで、不確定領域をさらに最適化し、エッジ抽出結果を改善することができる。
半擬似シマセアーキテクチャを用いて、上記相補的な周波数特徴を抽出し、登録差分を適応的に低減し、MUDMにより、前記エッジノイズ以外の登録誤差を徐々に低減し、不確定領域を復元する。
UDHF2-Netの優位性を示すための総合実験を行った。
特にアブレーション実験はUDHF2-Netの有効性を示す。
関連論文リスト
- ΩSFormer: Dual-Modal Ω-like Super-Resolution Transformer Network for Cross-scale and High-accuracy Terraced Field Vectorization Extraction [14.821191612452418]
棚田は土壌・水質保全(SWC)の重要な工学的実践である
本研究は,知的TFVEのための新しい2モードOmega型超解像トランスネットワークを提案する最初のものである。
論文 参考訳(メタデータ) (2024-11-26T04:00:28Z) - M3DM-NR: RGB-3D Noisy-Resistant Industrial Anomaly Detection via Multimodal Denoising [63.39134873744748]
既存の産業異常検出手法は主に、原始RGB画像を用いた教師なし学習に重点を置いている。
本稿では,CLIPの強力なマルチモーダル識別機能を利用する新しい耐雑音性M3DM-NRフレームワークを提案する。
M3DM-NRは3D-RGBマルチモーダルノイズ異常検出において最先端の手法より優れていた。
論文 参考訳(メタデータ) (2024-06-04T12:33:02Z) - Adaptive Semantic-Enhanced Denoising Diffusion Probabilistic Model for Remote Sensing Image Super-Resolution [7.252121550658619]
Denoising Diffusion Probabilistic Model (DDPM) は画像再構成において有望な性能を示した。
DDPMが生成する高周波の詳細は、モデルが長距離の意味的文脈を見落としているため、HR画像との不一致に悩まされることが多い。
DDPMの詳細な保存能力を高めるために,適応的意味強化DDPM(ASDDPM)を提案する。
論文 参考訳(メタデータ) (2024-03-17T04:08:58Z) - Hybrid Convolutional and Attention Network for Hyperspectral Image Denoising [54.110544509099526]
ハイパースペクトル画像(HSI)は、ハイパースペクトルデータの効果的な解析と解釈に重要である。
ハイブリット・コンボリューション・アテンション・ネットワーク(HCANet)を提案する。
主流HSIデータセットに対する実験結果は,提案したHCANetの合理性と有効性を示している。
論文 参考訳(メタデータ) (2024-03-15T07:18:43Z) - The Blind Normalized Stein Variational Gradient Descent-Based Detection for Intelligent Massive Random Access [0.7655800373514546]
本稿では,MLEモデルに基づく早期プリアンブル検出手法を提案する。
MLEモデルに対する近似解を得るために,新しい盲点正規化スタイン変分勾配勾配検出器(SVGD)を提案する。
提案したブロックMHT層は、コストと性能の劣化の観点から、他の変換方式よりも優れている。
論文 参考訳(メタデータ) (2024-03-08T04:08:40Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - Degradation-Noise-Aware Deep Unfolding Transformer for Hyperspectral
Image Denoising [9.119226249676501]
ハイパースペクトル画像(HSI)は、帯域幅が狭いため、ノイズが多いことが多い。
HSIデータキューブのノイズを低減するため、モデル駆動型と学習型の両方の復調アルゴリズムが提案されている。
本稿では,これらの問題に対処するDNA-Net(Degradation-Noise-Aware Unfolding Network)を提案する。
論文 参考訳(メタデータ) (2023-05-06T13:28:20Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - FreqNet: A Frequency-domain Image Super-Resolution Network with Dicrete
Cosine Transform [16.439669339293747]
単一画像超解像(SISR)は低分解能(LR)入力から高分解能(HR)出力を得ることを目的とした不適切な問題である。
高ピーク信号-雑音比(PSNR)の結果にもかかわらず、モデルが望まれる高周波の詳細を正しく付加するかどうかを判断することは困難である。
本稿では、周波数領域の観点から直感的なパイプラインであるFreqNetを提案し、この問題を解決する。
論文 参考訳(メタデータ) (2021-11-21T11:49:12Z) - Learning a Model-Driven Variational Network for Deformable Image
Registration [89.9830129923847]
VR-Netは、教師なしの変形可能な画像登録のための新しいカスケード可変ネットワークである。
登録精度において最先端のディープラーニング手法よりも優れています。
ディープラーニングの高速推論速度と変分モデルのデータ効率を維持している。
論文 参考訳(メタデータ) (2021-05-25T21:37:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。