論文の概要: Dual-Stream Global-Local Feature Collaborative Representation Network for Scene Classification of Mining Area
- arxiv url: http://arxiv.org/abs/2507.20216v2
- Date: Thu, 31 Jul 2025 09:00:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 13:02:07.683748
- Title: Dual-Stream Global-Local Feature Collaborative Representation Network for Scene Classification of Mining Area
- Title(参考訳): マイニングエリアのシーン分類のためのデュアルストリームグローバルローカル特徴表現ネットワーク
- Authors: Shuqi Fan, Haoyi Wang, Xianju Li,
- Abstract要約: 本研究では、マルチソースデータを融合して、マルチモーダルな土地被覆シーン分類データセットを構築する。
本稿では,グローバルな特徴をキーセマンティックベクトルに分解するために協調表現を利用した二分岐融合モデルを提案する。
このモデルの全体的な精度は83.63%であり、他の比較モデルよりも優れている。
- 参考スコア(独自算出の注目度): 2.4578723416255754
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scene classification of mining areas provides accurate foundational data for geological environment monitoring and resource development planning. This study fuses multi-source data to construct a multi-modal mine land cover scene classification dataset. A significant challenge in mining area classification lies in the complex spatial layout and multi-scale characteristics. By extracting global and local features, it becomes possible to comprehensively reflect the spatial distribution, thereby enabling a more accurate capture of the holistic characteristics of mining scenes. We propose a dual-branch fusion model utilizing collaborative representation to decompose global features into a set of key semantic vectors. This model comprises three key components:(1) Multi-scale Global Transformer Branch: It leverages adjacent large-scale features to generate global channel attention features for small-scale features, effectively capturing the multi-scale feature relationships. (2) Local Enhancement Collaborative Representation Branch: It refines the attention weights by leveraging local features and reconstructed key semantic sets, ensuring that the local context and detailed characteristics of the mining area are effectively integrated. This enhances the model's sensitivity to fine-grained spatial variations. (3) Dual-Branch Deep Feature Fusion Module: It fuses the complementary features of the two branches to incorporate more scene information. This fusion strengthens the model's ability to distinguish and classify complex mining landscapes. Finally, this study employs multi-loss computation to ensure a balanced integration of the modules. The overall accuracy of this model is 83.63%, which outperforms other comparative models. Additionally, it achieves the best performance across all other evaluation metrics.
- Abstract(参考訳): 鉱山地域の景観分類は、地質環境モニタリングと資源開発計画のための正確な基礎データを提供する。
本研究では、マルチソースデータを融合して、マルチモーダルな土地被覆シーン分類データセットを構築する。
鉱業地域分類における重要な課題は、複雑な空間配置とマルチスケール特性にある。
グローバルかつ局所的な特徴を抽出することにより、空間分布を包括的に反映し、採掘シーンの全体的特性をより正確に把握することができる。
本稿では,グローバルな特徴をキーセマンティックベクトルの集合に分解するために協調表現を利用した二分岐融合モデルを提案する。
マルチスケールグローバルトランスフォーマーブランチ(Multi-scale Global Transformer Branch): 隣接する大規模機能を活用して,小規模機能のためのグローバルチャネルアテンション機能を生成し,マルチスケール機能の関係を効果的に把握する。
2) 局所的強化協調表現ブランチ: 局所的特徴を活用し, キーセマンティックセットを再構築することにより, 注目度を向上し, 鉱区の局地的文脈と詳細な特徴を効果的に統合することを保証する。
これにより、モデルの微粒な空間変化に対する感度が向上する。
(3)Dual-Branch Deep Feature Fusion Module:2つのブランチの補完機能を融合して、より多くのシーン情報を組み込む。
この融合は、複雑な鉱業の景観を識別し分類するモデルの能力を強化する。
最後に、モジュールのバランスの取れた統合を保証するために、マルチロス計算を用いる。
このモデルの全体的な精度は83.63%であり、他の比較モデルよりも優れている。
さらに、他のすべての評価指標で最高のパフォーマンスを達成する。
関連論文リスト
- TerraFM: A Scalable Foundation Model for Unified Multisensor Earth Observation [65.74990259650984]
本研究では,グローバルに分散したSentinel-1とSentinel-2画像を利用する,スケーラブルな自己教師型学習モデルTerraFMを紹介する。
我々のトレーニング戦略は、局所的・言語的コントラスト学習を統合し、二重中心化機構を導入する。
TerraFMは分類タスクとセグメンテーションタスクの両方において強力な一般化を実現し、GEO-BenchとCopernicus-Benchの先行モデルよりも優れている。
論文 参考訳(メタデータ) (2025-06-06T17:59:50Z) - Prototype-Based Information Compensation Network for Multi-Source Remote Sensing Data Classification [56.065032039986725]
マルチソースリモートセンシングデータ共同分類は、土地被覆分類の精度と信頼性を提供することを目的としている。
既存の手法では、周波数間マルチソース特徴結合と相補的な情報探索の不整合という2つの課題に直面している。
HSIとSAR/LiDARデータに基づく土地被覆分類のためのプロトタイプベース情報補償ネットワーク(PICNet)を提案する。
論文 参考訳(メタデータ) (2025-05-06T22:30:23Z) - Multilateral Cascading Network for Semantic Segmentation of Large-Scale Outdoor Point Clouds [6.253217784798542]
Multilateral Cascading Network (MCNet)はこの課題に対処するために設計された。
MCNetは、Multilateral Cascading Attention Enhancement (MCAE)モジュールとPoint Cross Stage partial (P-CSP)モジュールの2つの主要なコンポーネントから構成されている。
その結果,mIoU全体では2.1%,小さめの対象カテゴリーでは平均15.9%の改善が得られた。
論文 参考訳(メタデータ) (2024-09-21T02:23:01Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Hierarchical Attention and Parallel Filter Fusion Network for Multi-Source Data Classification [33.26466989592473]
マルチソースデータ分類のための階層的注意と並列フィルタ融合ネットワークを提案する。
提案手法は,各データセットの総合精度(OA)の91.44%と80.51%を達成する。
論文 参考訳(メタデータ) (2024-08-22T23:14:22Z) - Monocular Per-Object Distance Estimation with Masked Object Modeling [33.59920084936913]
本稿では、Masked Image Modeling (MiM) からインスピレーションを得て、マルチオブジェクトタスクに拡張する。
Masked Object Modeling (MoM) と呼ばれる我々の戦略は、マスキング技術の新しい応用を可能にする。
我々は、標準KITTI、NuScenes、MOT Synthデータセット上の新しい参照アーキテクチャ(DistFormer)におけるMoMの有効性を評価する。
論文 参考訳(メタデータ) (2024-01-06T10:56:36Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - Global Aggregation then Local Distribution for Scene Parsing [99.1095068574454]
提案手法は,エンドツーエンドのトレーニング可能なブロックとしてモジュール化され,既存のセマンティックセグメンテーションネットワークに容易に接続可能であることを示す。
私たちのアプローチでは、Cityscapes、ADE20K、Pascal Context、Camvid、COCO-stuffといった主要なセマンティックセグメンテーションベンチマークに基づいて、新しい最先端の技術を構築できます。
論文 参考訳(メタデータ) (2021-07-28T03:46:57Z) - Detail Preserved Point Cloud Completion via Separated Feature
Aggregation [26.566021924980706]
ポイントクラウド形状の完成は、3Dビジョンとロボティクスにおいて難しい問題である。
グローバル・ローカル・フィーチャー・アグリゲーション(GLFA)と残像アグリゲーション(RFA)という2つの異なる特徴アグリゲーション戦略を提案する。
提案するネットワークは,特に細部保存における最先端技術よりも優れている。
論文 参考訳(メタデータ) (2020-07-05T16:11:55Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。