論文の概要: Fusion and Grouping Strategies in Deep Learning for Local Climate Zone Classification of Multimodal Remote Sensing Data
- arxiv url: http://arxiv.org/abs/2603.04562v1
- Date: Wed, 04 Mar 2026 19:47:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:10.955781
- Title: Fusion and Grouping Strategies in Deep Learning for Local Climate Zone Classification of Multimodal Remote Sensing Data
- Title(参考訳): マルチモーダルリモートセンシングデータの局所気候ゾーン分類のための深層学習における融合とグループ化戦略
- Authors: Ancymol Thomas, Jaya Sreevalsan-Nair,
- Abstract要約: 地域気候帯 (LCZ) は、都市構造と土地利用を研究するための地域地図を提供する。
データ融合は、データの複雑さのために精度を向上させるために重要である。
本研究は,多クラスLCZ分類モデルにおける異なる融合戦略を解析する。
- 参考スコア(独自算出の注目度): 1.3607388598209322
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Local Climate Zones (LCZs) give a zoning map to study urban structures and land use and analyze the impact of urbanization on local climate. Multimodal remote sensing enables LCZ classification, for which data fusion is significant for improving accuracy owing to the data complexity. However, there is a gap in a comprehensive analysis of the fusion mechanisms used in their deep learning (DL) classifier architectures. This study analyzes different fusion strategies in the multi-class LCZ classification models for multimodal data and grouping strategies based on inherent data characteristics. The different models involving Convolutional Neural Networks (CNNs) include: (i) baseline hybrid fusion (FM1), (ii) with self- and cross-attention mechanisms (FM2), (iii) with the multi-scale Gaussian filtered images (FM3), and (iv) weighted decision-level fusion (FM4). Ablation experiments are conducted to study the pixel-, feature-, and decision-level fusion effects in the model performance. Grouping strategies include band grouping (BG) within the data modalities and label merging (LM) in the ground truth. Our analysis is exclusively done on the So2Sat LCZ42 dataset, which consists of Synthetic Aperture Radar (SAR) and Multispectral Imaging (MSI) image pairs. Our results show that FM1 consistently outperforms simple fusion methods. FM1 with BG and LM is found to be the most effective approach among all fusion strategies, giving an overall accuracy of 76.6\%. Importantly, our study highlights the effect of these strategies in improving prediction accuracy for the underrepresented classes. Our code and processed datasets are available at https://github.com/GVCL/LCZC-MultiModalHybridFusion
- Abstract(参考訳): 地域気候帯(LCZ)は、都市構造と土地利用を研究し、都市化が地域気候に与える影響を分析するための地域地図を提供する。
マルチモーダルリモートセンシングはLCZ分類を可能にし、データの複雑さによる精度向上のためにデータ融合が重要である。
しかし、ディープラーニング(DL)分類器アーキテクチャで使用される融合機構の包括的分析にはギャップがある。
本研究では,マルチモーダルデータに対する多クラスLCZ分類モデルと,固有データ特性に基づくグループ化戦略の異なる融合戦略を解析する。
畳み込みニューラルネットワーク(CNN)を含むさまざまなモデルには、以下のものがある。
(i)ベースラインハイブリッド核融合(FM1)
(II)自己・相互注意機構(FM2)
(iii)マルチスケールガウスフィルタ画像(FM3)と
(4)重み付き決定レベル核融合(FM4)
モデル性能における画素,特徴,決定レベルの融合効果を研究するためのアブレーション実験を行った。
グループ化戦略には、データモダリティ内のバンドグルーピング(BG)と、基礎的な真実におけるラベルマージ(LM)が含まれる。
我々の分析は、SAR(Synthetic Aperture Radar)とMSI(Multi Multispectral Imaging)の画像対からなるSo2Sat LCZ42データセットでのみ行われる。
その結果,FM1は単純な核融合法よりも優れていた。
BGとLMのFM1は全ての核融合戦略の中で最も効果的なアプローチであり、全体的な精度は76.6\%である。
本研究は,これらの手法が,未表現クラスにおける予測精度の向上に有効であることを示すものである。
私たちのコードと処理されたデータセットはhttps://github.com/GVCL/LCZC-MultiModalHybridFusionで公開されています。
関連論文リスト
- Multiview Manifold Evidential Fusion for PolSAR Image Classification [51.41332458376411]
我々は,PolSAR多様体学習とエビデンス融合を統合アーキテクチャに統合する新しいフレームワークを提案する。
実世界の3つのPolSARデータセットの実験により、提案手法は、精度、堅牢性、解釈可能性において、既存のアプローチよりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-10-13T09:05:51Z) - TerraFM: A Scalable Foundation Model for Unified Multisensor Earth Observation [65.74990259650984]
本研究では,グローバルに分散したSentinel-1とSentinel-2画像を利用する,スケーラブルな自己教師型学習モデルTerraFMを紹介する。
我々のトレーニング戦略は、局所的・言語的コントラスト学習を統合し、二重中心化機構を導入する。
TerraFMは分類タスクとセグメンテーションタスクの両方において強力な一般化を実現し、GEO-BenchとCopernicus-Benchの先行モデルよりも優れている。
論文 参考訳(メタデータ) (2025-06-06T17:59:50Z) - FTA-FTL: A Fine-Tuned Aggregation Federated Transfer Learning Scheme for Lithology Microscopic Image Classification [4.245694283697248]
この研究には2つのフェーズがあり、第1に、転送学習を用いて小さなデータセット上でLithology microscopic image classificationを行う。
第2フェーズでは、フェデレート・トランスファーラーニング・スキームに分類タスクを定式化し、フェデレート・ラーニングのためのファインチューニング・アグリゲーション・ストラテジー(FTA-FTL)を提案した。
その結果,提案手法の効率性は良好であり,FTA-FTLアルゴリズムがLithology microscopic image classification taskの集中的実装により得られたほぼ同じ結果が得られることを示す。
論文 参考訳(メタデータ) (2025-01-06T19:32:14Z) - Band Prompting Aided SAR and Multi-Spectral Data Fusion Framework for Local Climate Zone Classification [20.71392764471532]
地域気候帯(LCZ)分類は、都市開発と地域気候の間の複雑な相互作用を理解する上で非常に重要である。
近年,LCZ分類性能を向上させるため,合成開口レーダ(SAR)とマルチスペクトルデータの統合に注目が集まっている。
本稿では、LCZ分類、すなわちBP-LCZに対して、補足データ融合フレームワークを促進させる新しいバンドを提案する。
実験結果は,提案したデータ融合フレームワークの有効性と優位性を示す。
論文 参考訳(メタデータ) (2024-12-24T07:40:07Z) - PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model [83.35198885088093]
PolSARデータは、そのリッチで複雑な特徴のために、ユニークな課題を提示する。
複素数値データ、偏光特性、振幅画像などの既存のデータ表現が広く使われている。
PolSARのほとんどの機能抽出ネットワークは小さく、機能を効果的にキャプチャする能力を制限している。
本稿では,ドメイン固有の散乱特性と新規なプロンプト生成戦略を統合したSegment Anything Model (SAM) であるPolarimetric Scattering Mechanism-Informed SAM (PolSAM)を提案する。
論文 参考訳(メタデータ) (2024-12-17T09:59:53Z) - Bridging Data Islands: Geographic Heterogeneity-Aware Federated Learning for Collaborative Remote Sensing Semantic Segmentation [7.265569559979736]
高品質な注釈付きリモートセンシング画像は、しばしば分離され、機関に分散される。
リモートセンシングデータアイランドの問題は、グローバルモデルのトレーニングに独立したデータセットを完全に活用する上での課題を提起している。
我々は、RSSでデータアイランドをブリッジする新しい地理異質性を考慮したフェデレーションラーニング(GeoFed)フレームワークを提案する。
我々のフレームワークは,Global Insight Enhancement(GIE)モジュール,Essential Feature Mining(EFM)モジュール,LoGo(LoGo)モジュールという3つのモジュールで構成されています。
論文 参考訳(メタデータ) (2024-04-14T15:58:35Z) - In the Search for Optimal Multi-view Learning Models for Crop Classification with Global Remote Sensing Data [5.143097874851516]
我々は、光学、レーダー、気象時系列、地形情報を入力データとして提供するCropHarvestデータセットを検証に使用する。
我々は,特定の融合戦略に適した最適エンコーダアーキテクチャを同定し,その分類作業に最適な融合戦略を決定することを提案する。
論文 参考訳(メタデータ) (2024-03-25T09:49:42Z) - A Theoretical Analysis of Self-Supervised Learning for Vision Transformers [66.08606211686339]
マスク付きオートエンコーダ(MAE)とコントラスト学習(CL)は異なる種類の表現をキャプチャする。
我々は,MAEとCLの両目的に対して,一層ソフトマックス型視覚変換器(ViT)のトレーニングダイナミクスについて検討した。
論文 参考訳(メタデータ) (2024-03-04T17:24:03Z) - Fake It Till Make It: Federated Learning with Consensus-Oriented
Generation [52.82176415223988]
コンセンサス指向生成による連合学習(FedCOG)を提案する。
FedCOGは、補完的なデータ生成と知識蒸留に基づくモデルトレーニングという、クライアント側の2つの重要なコンポーネントで構成されています。
古典的および実世界のFLデータセットの実験は、FedCOGが一貫して最先端の手法より優れていることを示している。
論文 参考訳(メタデータ) (2023-12-10T18:49:59Z) - Quasi-Global Momentum: Accelerating Decentralized Deep Learning on
Heterogeneous Data [77.88594632644347]
ディープラーニングモデルの分散トレーニングは、ネットワーク上でデータプライバシとデバイス上での学習を可能にする重要な要素である。
現実的な学習シナリオでは、異なるクライアントのローカルデータセットに異質性が存在することが最適化の課題となる。
本稿では,この分散学習の難しさを軽減するために,運動量に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2021-02-09T11:27:14Z) - Classification of Hyperspectral and LiDAR Data Using Coupled CNNs [39.55503477017984]
本稿では,2つの結合畳み込みニューラルネットワーク(CNN)を用いた高スペクトル・光検出・追跡(LiDAR)データを融合する効率的なフレームワークを提案する。
1つのCNNは、ハイパースペクトルデータからスペクトル空間の特徴を学習するために設計され、もう1つは、LiDARデータから標高情報を取得するために使用される。
融合相では、これらの不均一な特徴を統合するために、特徴レベルと決定レベルの融合法が同時に使用される。
論文 参考訳(メタデータ) (2020-02-04T06:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。