論文の概要: DedustNet: A Frequency-dominated Swin Transformer-based Wavelet Network
for Agricultural Dust Removal
- arxiv url: http://arxiv.org/abs/2401.04750v1
- Date: Tue, 9 Jan 2024 13:40:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-11 16:20:31.729676
- Title: DedustNet: A Frequency-dominated Swin Transformer-based Wavelet Network
for Agricultural Dust Removal
- Title(参考訳): DedustNet: 農業ダスト除去のための周波数支配型スイニングトランスフォーマーベースのウェーブレットネットワーク
- Authors: Shengli Zhang, Zhiyong Tao, and Sen Lin
- Abstract要約: 本稿では,現実の農業ダスト除去課題を解決するために,エンド・ツー・エンドの学習ネットワーク(DedustNet)を提案する。
DedustNetは、スウィントランスフォーマーをベースとしたユニットが、農業用画像ダストのウェーブレットネットワークで使用されるのはこれが初めてである。
- 参考スコア(独自算出の注目度): 11.757602977709517
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While dust significantly affects the environmental perception of automated
agricultural machines, the existing deep learning-based methods for dust
removal require further research and improvement in this area to improve the
performance and reliability of automated agricultural machines in agriculture.
We propose an end-to-end trainable learning network (DedustNet) to solve the
real-world agricultural dust removal task. To our knowledge, DedustNet is the
first time Swin Transformer-based units have been used in wavelet networks for
agricultural image dusting. Specifically, we present the frequency-dominated
block (DWTFormer block and IDWTFormer block) by adding a spatial features
aggregation scheme (SFAS) to the Swin Transformer and combining it with the
wavelet transform, the DWTFormer block and IDWTFormer block, alleviating the
limitation of the global receptive field of Swin Transformer when dealing with
complex dusty backgrounds. Furthermore, We propose a cross-level information
fusion module to fuse different levels of features and effectively capture
global and long-range feature relationships. In addition, we present a dilated
convolution module to capture contextual information guided by wavelet
transform at multiple scales, which combines the advantages of wavelet
transform and dilated convolution. Our algorithm leverages deep learning
techniques to effectively remove dust from images while preserving the original
structural and textural features. Compared to existing state-of-the-art
methods, DedustNet achieves superior performance and more reliable results in
agricultural image dedusting, providing strong support for the application of
agricultural machinery in dusty environments. Additionally, the impressive
performance on real-world hazy datasets and application tests highlights
DedustNet superior generalization ability and computer vision-related
application performance.
- Abstract(参考訳): ダストは自動化農業機械の環境認識に大きく影響するが,既存の深層学習に基づく塵除去手法では,農業における自動化農業機械の性能と信頼性を向上させるために,さらなる研究と改良が必要である。
本稿では,現実の農業ダスト除去課題を解決するために,エンド・ツー・エンドの学習ネットワーク(DedustNet)を提案する。
私たちの知る限り、DedustNetは、Swin Transformerベースのユニットが農業用画像ダストのウェーブレットネットワークで使用されるのはこれが初めてです。
具体的には、Swin Transformerに空間特徴アグリゲーションスキーム(SFAS)を追加し、ウェーブレット変換、DWTFormerブロック、IDWTFormerブロックと組み合わせることで、複雑なダスト背景を扱う際に、Swin Transformerのグローバル受信フィールドの制限を緩和することで、周波数支配ブロック(DWTFormerブロックとIDWTFormerブロック)を提案する。
さらに,異なる機能レベルを融合し,グローバルかつ長距離の機能関係を効果的に捉えるクロスレベル情報融合モジュールを提案する。
さらに、ウェーブレット変換と拡張畳み込みの利点を組み合わせた、複数のスケールでウェーブレット変換によって導かれるコンテキスト情報をキャプチャする拡張畳み込みモジュールを提案する。
提案アルゴリズムは,画像からダストを効果的に除去し,元の構造的特徴とテクスチャ的特徴を保存する。
既存の最先端の手法と比較して、DedustNetは農業用画像の破壊において優れた性能と信頼性を達成し、ほこりの多い環境における農業機械の適用を強く支援している。
さらに、実世界のハジーデータセットとアプリケーションテストにおける印象的なパフォーマンスは、DedustNetの優れた一般化能力とコンピュータビジョン関連のアプリケーションパフォーマンスを強調している。
関連論文リスト
- A Hybrid Transformer-Mamba Network for Single Image Deraining [70.64069487982916]
既存のデラリング変換器では、固定レンジウィンドウやチャネル次元に沿って自己アテンション機構を採用している。
本稿では,多分岐型トランスフォーマー・マンバネットワーク(Transformer-Mamba Network,TransMamba Network,Transformer-Mamba Network)を提案する。
論文 参考訳(メタデータ) (2024-08-31T10:03:19Z) - StrideNET: Swin Transformer for Terrain Recognition with Dynamic Roughness Extraction [0.0]
本稿では、地形認識と暗黙的特性推定のために設計された新しいデュアルブランチアーキテクチャであるStrideNETを提案する。
この研究の意味は、環境モニタリング、土地利用、土地被覆分類(LULC)、災害対応、精密農業など、様々な応用にまで及んでいる。
論文 参考訳(メタデータ) (2024-04-20T04:51:59Z) - IPT-V2: Efficient Image Processing Transformer using Hierarchical Attentions [26.09373405194564]
我々は,IPTV2と呼ばれる階層的な注意を払って,効率的な画像処理トランスフォーマアーキテクチャを提案する。
我々は、局所的およびグローバルな受容領域における適切なトークン相互作用を得るために、焦点コンテキスト自己注意(FCSA)とグローバルグリッド自己注意(GGSA)を採用する。
提案した IPT-V2 は,様々な画像処理タスクにおいて,デノナイズ,デブロアリング,デコライニングを網羅し,従来の手法よりも性能と計算の複雑さのトレードオフを得る。
論文 参考訳(メタデータ) (2024-03-31T10:01:20Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - Exploiting Regional Information Transformer for Single Image Deraining [40.96287901893822]
Region Transformer Block (RTB) は Region Masked Attention (RMA) 機構と Mixed Gate Forward Block (MGFB) を統合している
我々のモデルは最先端の性能に到達し、画像劣化の品質を著しく向上させる。
論文 参考訳(メタデータ) (2024-02-25T09:09:30Z) - Long-term Wind Power Forecasting with Hierarchical Spatial-Temporal
Transformer [112.12271800369741]
風力発電は、再生可能、汚染のないその他の利点により、世界中の注目を集めている。
正確な風力発電予測(WPF)は、電力系統の運用における電力変動を効果的に低減することができる。
既存の手法は主に短期的な予測のために設計されており、効果的な時空間的特徴増強が欠如している。
論文 参考訳(メタデータ) (2023-05-30T04:03:15Z) - RFR-WWANet: Weighted Window Attention-Based Recovery Feature Resolution
Network for Unsupervised Image Registration [7.446209993071451]
Swin変換器は、その計算効率と長距離モデリング能力のために、医用画像解析に注目を集めている。
トランスフォーマーに基づく登録モデルは、複数のボクセルを単一のセマンティックトークンに結合する。
このマージプロセスは変換器をモデルに制限し、粗い粒度の空間情報を生成する。
本研究では, 高精度な空間情報提供を可能にするRFRNet(Recovery Feature Resolution Network)を提案する。
論文 参考訳(メタデータ) (2023-05-07T09:57:29Z) - SwinFSR: Stereo Image Super-Resolution using SwinIR and Frequency Domain
Knowledge [27.344004897917515]
本研究では,SwinIRを拡張した新しいSwinFSR法を提案する。
ステレオビューの効率的かつ正確な融合を実現するため,RCAMと呼ばれる新しいクロスアテンションモジュールを提案する。
論文 参考訳(メタデータ) (2023-04-25T03:54:58Z) - BSRT: Improving Burst Super-Resolution with Swin Transformer and
Flow-Guided Deformable Alignment [84.82352123245488]
この研究は新しいアーキテクチャを使ってBurst Super-Resolution (BurstSR)タスクに対処し、ノイズ、不一致、低解像度のRAWバーストから高品質な画像を復元する必要がある。
本稿では,フレーム間情報抽出と再構築の能力を大幅に向上するBurst Super-Resolution Transformer (BSRT)を提案する。
我々のBSRTはNTIRE2022 Burst Super-Resolution Challengeで優勝した。
論文 参考訳(メタデータ) (2022-04-18T14:23:10Z) - Safe Self-Refinement for Transformer-based Domain Adaptation [73.8480218879]
Unsupervised Domain Adaptation (UDA)は、ラベル豊富なソースドメインを活用して、関連するラベルのないターゲットドメイン上のタスクを解決することを目的としている。
特にソースとターゲットドメインの間に大きなドメインギャップがある場合、これは難しい問題です。
SSRT (Safe Self-Refinement for Transformer-based domain adaptation) という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-04-16T00:15:46Z) - TransKD: Transformer Knowledge Distillation for Efficient Semantic Segmentation [49.794142076551026]
Transformer-based Knowledge Distillation (TransKD) フレームワークは,大規模教師トランスフォーマーの機能マップとパッチ埋め込みの両方を蒸留することにより,コンパクトな学生トランスフォーマーを学習する。
Cityscapes、ACDC、NYUv2、Pascal VOC2012データセットの実験は、TransKDが最先端の蒸留フレームワークより優れていることを示している。
論文 参考訳(メタデータ) (2022-02-27T16:34:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。