論文の概要: FADConv: A Frequency-Aware Dynamic Convolution for Farmland Non-agriculturalization Identification and Segmentation
- arxiv url: http://arxiv.org/abs/2504.03510v1
- Date: Fri, 04 Apr 2025 15:13:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-07 14:48:04.562718
- Title: FADConv: A Frequency-Aware Dynamic Convolution for Farmland Non-agriculturalization Identification and Segmentation
- Title(参考訳): FADConv: 農地の非農業化識別と分別のための周波数対応動的畳み込み
- Authors: Tan Shu, Li Shen,
- Abstract要約: 本稿では、これらの制限に対処する周波数対応動的畳み込み(FADConv)と周波数アテンション(FAT)モジュールを提案する。
FADConvは、最小の計算オーバーヘッドでセグメンテーション精度を大幅に改善する。
他の動的畳み込み手法と比較して、FADConvは農地分割タスクにおいて優れた性能を示す。
- 参考スコア(独自算出の注目度): 6.701983401898849
- License:
- Abstract: Cropland non-agriculturalization refers to the conversion of arable land into non-agricultural uses such as forests, residential areas, and construction sites. This phenomenon not only directly leads to the loss of cropland resources but also poses systemic threats to food security and agricultural sustainability. Accurate identification of cropland and non-cropland areas is crucial for detecting and addressing this issue. Traditional CNNs employ static convolution layers, while dynamic convolution studies demonstrate that adaptively weighting multiple convolutional kernels through attention mechanisms can enhance accuracy. However, existing dynamic convolution methods relying on Global Average Pooling (GAP) for attention weight allocation suffer from information loss, limiting segmentation precision. This paper proposes Frequency-Aware Dynamic Convolution (FADConv) and a Frequency Attention (FAT) module to address these limitations. Building upon the foundational structure of dynamic convolution, we designed FADConv by integrating 2D Discrete Cosine Transform (2D DCT) to capture frequency domain features and fuse them. FAT module generates high-quality attention weights that replace the traditional GAP method,making the combination between dynamic convolution kernels more reasonable.Experiments on the GID and Hi-CNA datasets demonstrate that FADConv significantly improves segmentation accuracy with minimal computational overhead. For instance, ResNet18 with FADConv achieves 1.9% and 2.7% increases in F1-score and IoU for cropland segmentation on GID, with only 58.87M additional MAdds. Compared to other dynamic convolution approaches, FADConv exhibits superior performance in cropland segmentation tasks.
- Abstract(参考訳): 農耕地非農耕地は、森林、住宅地、建設地などの非農耕地を非農耕地に転換することを指す。
この現象は、農地資源の喪失に直接繋がるだけでなく、食料安全保障と農業の持続可能性に対する体系的な脅威も引き起こす。
この問題の検出と対処には、作物と非作物の正確な識別が不可欠である。
従来のCNNは静的な畳み込み層を用いており、動的畳み込みの研究は、注意機構を通じて複数の畳み込みカーネルを適応的に重み付けすることで精度を高めることを実証している。
しかし,GAP(Global Average Pooling)を利用した従来の動的畳み込み手法は,情報損失に悩まされ,セグメンテーション精度が制限される。
本稿では、これらの制限に対処する周波数対応動的畳み込み(FADConv)と周波数アテンション(FAT)モジュールを提案する。
動的畳み込みの基本構造に基づいて、2次元離散コサイン変換(2D DCT)を統合してFADConvを設計し、周波数領域の特徴を捉え、それらを融合させた。
FATモジュールは、従来のGAP法に取って代わる高品質なアテンションウェイトを生成し、動的畳み込みカーネルの組合せをより合理的にし、GIDとHi-CNAデータセットの実験により、FADConvは計算オーバーヘッドを最小限に抑えてセグメンテーション精度を大幅に改善することを示した。
例えば、FADConvのResNet18は、GID上の作物の区画化においてF1スコアとIoUの1.9%と2.7%の増加を達成する。
他の動的畳み込み手法と比較して、FADConvは農地分割タスクにおいて優れた性能を示す。
関連論文リスト
- Parallel Sequence Modeling via Generalized Spatial Propagation Network [80.66202109995726]
Generalized Spatial Propagation Network (GSPN)は、2次元空間構造を本質的にキャプチャする最適化された視覚タスクのための新しいアテンションメカニズムである。
GSPNは、空間的コヒーレントな画像データを直接操作し、ラインスキャンアプローチを通じて高密度なペアワイズ接続を形成することにより、制限を克服する。
GSPNは、ImageNet分類、クラス誘導画像生成、テキスト・ツー・イメージ生成などの視覚タスクにおいて、より優れた空間忠実性と最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-01-21T18:56:19Z) - DRIVE: Dual-Robustness via Information Variability and Entropic Consistency in Source-Free Unsupervised Domain Adaptation [10.127634263641877]
ラベル付きデータなしで機械学習モデルを新しいドメインに適応させることは、医療画像、自律運転、リモートセンシングといったアプリケーションにおいて重要な課題である。
Source-Free Unsupervised Domain Adaptation (SFUDA)と呼ばれるこのタスクでは、未ラベルのターゲットデータのみを使用して、トレーニング済みのモデルをターゲットドメインに適応させる。
既存のSFUDAメソッドは、しばしば単一モデルアーキテクチャに依存し、ターゲットドメインにおける不確実性と可変性に悩まされる。
本稿では、2重モデルアーキテクチャを利用した新しいSFUDAフレームワークDRIVEを提案する。
論文 参考訳(メタデータ) (2024-11-24T20:35:04Z) - Decomposition-based Unsupervised Domain Adaptation for Remote Sensing Image Semantic Segmentation [30.606689882397223]
非教師なし領域適応(UDA)技術は、地球科学のセマンティックセグメンテーションに不可欠である。
高レベルの特徴空間におけるドメインアライメントに焦点を当てた既存のUDA手法の多くは、局所的な空間的詳細とグローバルな文脈的意味論を同時に維持するのに苦労している。
ドメイン不変表現学習を導くための新しい分解手法を提案する。
論文 参考訳(メタデータ) (2024-04-06T07:13:49Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - Cross Domain Early Crop Mapping using CropSTGAN [12.271756709807898]
本稿では,Crop Mapping Spectral-temporal Generative Adrial Neural Network (CropSTGAN)を紹介する。
CropSTGANは、ターゲットドメインのスペクトル特徴をソースドメインのスペクトル特徴に変換することを学習し、実質的に大きな相似性をブリッジする。
実験では、CropSTGANは様々な最先端(SOTA)メソッドに対してベンチマークされる。
論文 参考訳(メタデータ) (2024-01-15T00:27:41Z) - Fourier Test-time Adaptation with Multi-level Consistency for Robust
Classification [10.291631977766672]
本稿では,Fourier Test-Time Adaptation (FTTA) と呼ばれる新しい手法を提案する。
FTTAは、予測の自己監督を行うために、ペア入力の信頼性の高い多レベル整合性測定を構築する。
異なる形態と器官を持つ3つの大きな分類データセットで広範囲に検証された。
論文 参考訳(メタデータ) (2023-06-05T02:29:38Z) - USAGE: A Unified Seed Area Generation Paradigm for Weakly Supervised
Semantic Segmentation [90.08744714206233]
両タイプのネットワークに対して,シードエリアジェネレーション(USAGE)のための統一最適化パラダイムを提案する。
実験の結果,UAGEはCNNとトランスフォーマーの両方のシード領域生成を一貫して改善することがわかった。
論文 参考訳(メタデータ) (2023-03-14T11:25:02Z) - QuadFormer: Quadruple Transformer for Unsupervised Domain Adaptation in
Power Line Segmentation of Aerial Images [12.840195641761323]
ドメイン適応型セマンティックセグメンテーションのための新しいフレームワークを提案する。
階層的な四重変圧器は、伝達可能なコンテキストに適応するために、クロスアテンションと自己アテンションのメカニズムを組み合わせる。
ARPLSynとARPLRealの2つのデータセットを提示し、教師なし領域適応電力線分割の研究をさらに進める。
論文 参考訳(メタデータ) (2022-11-29T03:15:27Z) - Exploring Consistency in Cross-Domain Transformer for Domain Adaptive
Semantic Segmentation [51.10389829070684]
ドメインギャップは、自己注意の相違を引き起こす可能性がある。
このギャップのため、変圧器は、ターゲット領域の精度を低下させる刺激領域または画素に付随する。
ドメイン横断の注意層を持つアテンションマップに適応する。
論文 参考訳(メタデータ) (2022-11-27T02:40:33Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z) - Transformer-Based Source-Free Domain Adaptation [134.67078085569017]
本研究では,ソースフリードメイン適応(SFDA)の課題について検討する。
我々は、FDAの一般化モデルを学ぶためのTransformer(TransDA)という、汎用的で効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-28T23:06:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。