論文の概要: HQF-Net: A Hybrid Quantum-Classical Multi-Scale Fusion Network for Remote Sensing Image Segmentation
- arxiv url: http://arxiv.org/abs/2604.06715v1
- Date: Wed, 08 Apr 2026 06:21:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.364028
- Title: HQF-Net: A Hybrid Quantum-Classical Multi-Scale Fusion Network for Remote Sensing Image Segmentation
- Title(参考訳): HQF-Net:リモートセンシング画像分割のためのハイブリッド量子古典型マルチスケール核融合ネットワーク
- Authors: Md Aminur Hossain, Ayush V. Patel, Siddhant Gole, Sanjay K. Singh, Biplab Banerjee,
- Abstract要約: HQF-Netは、リモートセンシング画像セグメンテーションのためのハイブリッド量子古典的マルチスケール核融合ネットワークである。
フリーズされたDINOv3 ViT-L/16バックボーンからのマルチスケールセマンティックガイダンスと、カスタマイズされたU-Netアーキテクチャを統合する。
3つのリモートセンシングベンチマークの実験では、提案した設計と一貫した改善が示されている。
- 参考スコア(独自算出の注目度): 17.10651341030732
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Remote sensing semantic segmentation requires models that can jointly capture fine spatial details and high-level semantic context across complex scenes. While classical encoder-decoder architectures such as U-Net remain strong baselines, they often struggle to fully exploit global semantics and structured feature interactions. In this work, we propose HQF-Net, a hybrid quantum-classical multi-scale fusion network for remote sensing image segmentation. HQF-Net integrates multi-scale semantic guidance from a frozen DINOv3 ViT-L/16 backbone with a customized U-Net architecture through a Deformable Multiscale Cross-Attention Fusion (DMCAF) module. To enhance feature refinement, the framework further introduces quantum-enhanced skip connections (QSkip) and a Quantum bottleneck with Mixture-of-Experts (QMoE), which combines complementary local, global, and directional quantum circuits within an adaptive routing mechanism. Experiments on three remote sensing benchmarks show consistent improvements with the proposed design. HQF-Net achieves 0.8568 mIoU and 96.87% overall accuracy on LandCover.ai, 71.82% mIoU on OpenEarthMap, and 55.28% mIoU with 99.37% overall accuracy on SeasoNet. An architectural ablation study further confirms the contribution of each major component. These results show that structured hybrid quantum-classical feature processing is a promising direction for improving remote sensing semantic segmentation under near-term quantum constraints.
- Abstract(参考訳): リモートセンシングセマンティックセグメンテーションでは、複雑なシーンにまたがる詳細な空間的詳細と高レベルのセマンティックコンテキストを共同でキャプチャできるモデルが必要である。
U-Netのような古典的なエンコーダ/デコーダアーキテクチャは強力なベースラインを維持しているが、グローバルなセマンティクスと構造化された機能相互作用を完全に活用するのに苦労することが多い。
本研究では,リモートセンシング画像セグメンテーションのためのハイブリッド量子古典型マルチスケール核融合ネットワークHQF-Netを提案する。
HQF-Netは、凍ったDINOv3 ViT-L/16バックボーンからDeformable Multiscale Cross-Attention Fusion (DMCAF)モジュールを通じてカスタマイズされたU-Netアーキテクチャへのマルチスケールセマンティックガイダンスを統合する。
機能強化のために、このフレームワークはさらに、適応的なルーティング機構内で、補完的なローカル、グローバル、および指向性量子回路を組み合わせた、QSkip(quantum-enhanced skip connection)とMixture-of-Experts(QMoE)による量子ボトルネックを導入する。
3つのリモートセンシングベンチマークの実験では、提案した設計と一貫した改善が示されている。
HQF-Net は LandCover.ai で 0.8568 mIoU と 96.87% 、OpenEarthMap で 71.82% mIoU 、SeasoNet で 99.37% の 55.28% mIoU を達成している。
アーキテクチャアブレーション研究は、各主要コンポーネントの貢献をさらに確認する。
これらの結果は、構造化された量子古典的特徴処理が、短期量子制約下でのリモートセマンティックセマンティックセグメンテーションを改善するための有望な方向であることを示している。
関連論文リスト
- G2HFNet: GeoGran-Aware Hierarchical Feature Fusion Network for Salient Object Detection in Optical Remote Sensing Images [76.1829298714382]
既存の手法では、一様注意機構を用いて複数の特徴を単一スケールで抽出するのが一般的である。
光リモートセンシング画像における幾何的および粒度をフル活用するGeoGran-Aware grained Feature Fusion Network (G2HFNet)を提案する。
論文 参考訳(メタデータ) (2026-03-13T05:52:00Z) - UAGLNet: Uncertainty-Aggregated Global-Local Fusion Network with Cooperative CNN-Transformer for Building Extraction [83.48950950780554]
リモートセンシング画像からの抽出は、複雑な構造変化のために難しい課題である。
既存の方法は、セグメンテーションモデルにおけるマルチスケール特徴をキャプチャするために、畳み込みブロックまたは自己アテンションブロックを使用する。
高品質なグローバルローカルなビジュアルセマンティクスを活用するために,不確実性集約型グローバルローカルフュージョンネットワーク(UAGLNet)を提案する。
論文 参考訳(メタデータ) (2025-12-15T02:59:16Z) - TNet: Terrace Convolutional Decoder Network for Remote Sensing Image Semantic Segmentation [0.0]
リモートセンシングでは、ほとんどのセグメンテーションネットワークはUNetアーキテクチャを採用し、トランスフォーマーのようなモジュールを組み込んでいる。
Terrace Convolutional Decoder Network (TNet)は,畳み込みと加算操作のみを活用する,シンプルで効果的なアーキテクチャである。
我々は、ResNet-18エンコーダ(TNet-R)を用いてTNetを実装し、3つのベンチマークデータセットで評価する。
論文 参考訳(メタデータ) (2025-08-06T03:44:30Z) - Optimized Unet with Attention Mechanism for Multi-Scale Semantic Segmentation [8.443350618722564]
本稿では,注目機構と組み合わさった改良されたUnetモデルを提案する。
チャネルアテンションと空間アテンションモジュールを導入し、重要な特徴にフォーカスするモデルの能力を強化する。
改良されたモデルは、mIoUとピクセル精度(PA)でよく機能し、それぞれ76.5%と95.3%に達した。
論文 参考訳(メタデータ) (2025-02-06T06:51:23Z) - Salient Object Detection in Optical Remote Sensing Images Driven by
Transformer [69.22039680783124]
光リモートセンシング画像(ORSI-SOD)のためのGlobal extract Local Exploration Network(GeleNet)を提案する。
具体的には、GeleNetはまずトランスフォーマーバックボーンを採用し、グローバルな長距離依存関係を持つ4レベルの機能埋め込みを生成する。
3つの公開データセットに関する大規模な実験は、提案されたGeleNetが関連する最先端メソッドより優れていることを示している。
論文 参考訳(メタデータ) (2023-09-15T07:14:43Z) - Conformer: Local Features Coupling Global Representations for Visual
Recognition [72.9550481476101]
本稿では,畳み込み操作と自己アテンション機構を利用した表現学習のためのハイブリッドネットワーク構造,conformerを提案する。
実験では、コンフォーマーが同等のパラメータ複雑性の下で視覚変換器(DeiT-B)を2.3%上回ることが示されている。
論文 参考訳(メタデータ) (2021-05-09T10:00:03Z) - Dilated SpineNet for Semantic Segmentation [5.6590540986523035]
スケール順列ネットワークは、オブジェクト境界ボックス検出とインスタンスセグメンテーションに有望な結果を示した。
本研究では,このセマンティックセグメンテーションのメタアーキテクチャ設計を評価する。
我々は,DeepLabv3システムからNASによって発見されたネットワークであるSpineNet-Segを提案する。
論文 参考訳(メタデータ) (2021-03-23T02:39:04Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。