論文の概要: MCD-Net: A Lightweight Deep Learning Baseline for Optical-Only Moraine Segmentation
- arxiv url: http://arxiv.org/abs/2601.02091v1
- Date: Mon, 05 Jan 2026 13:18:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:23.143918
- Title: MCD-Net: A Lightweight Deep Learning Baseline for Optical-Only Moraine Segmentation
- Title(参考訳): MCD-Net:光のみのモレーンセグメンテーションのための軽量ディープラーニングベースライン
- Authors: Zhehuan Cao, Fiseha Berhanu Tesema, Ping Fu, Jianfeng Ren, Ahmed Nasr,
- Abstract要約: 本研究は,Google Earthの3,340個の手動高解像度画像からなる,大規模な光のみのモレーンセグメンテーションデータセットを初めて紹介した。
我々は、MobileNetV2エンコーダ、CBAM(Convolutional Block Attention Module)、DeepLabV3+デコーダを統合する軽量ベースラインであるMCD-Netを開発した。
尾根の起伏はサブピクセル幅とスペクトルのあいまいさによって制限されているが、光学画像だけではモレーンボディのセグメンテーションが信頼できることを示す。
- 参考スコア(独自算出の注目度): 7.217732407493145
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Glacial segmentation is essential for reconstructing past glacier dynamics and evaluating climate-driven landscape change. However, weak optical contrast and the limited availability of high-resolution DEMs hinder automated mapping. This study introduces the first large-scale optical-only moraine segmentation dataset, comprising 3,340 manually annotated high-resolution images from Google Earth covering glaciated regions of Sichuan and Yunnan, China. We develop MCD-Net, a lightweight baseline that integrates a MobileNetV2 encoder, a Convolutional Block Attention Module (CBAM), and a DeepLabV3+ decoder. Benchmarking against deeper backbones (ResNet152, Xception) shows that MCD-Net achieves 62.3\% mean Intersection over Union (mIoU) and 72.8\% Dice coefficient while reducing computational cost by more than 60\%. Although ridge delineation remains constrained by sub-pixel width and spectral ambiguity, the results demonstrate that optical imagery alone can provide reliable moraine-body segmentation. The dataset and code are publicly available at https://github.com/Lyra-alpha/MCD-Net, establishing a reproducible benchmark for moraine-specific segmentation and offering a deployable baseline for high-altitude glacial monitoring.
- Abstract(参考訳): 氷河のセグメンテーションは過去の氷河のダイナミクスを再構築し、気候変動による景観変化を評価するのに不可欠である。
しかし、光学コントラストの弱さと高分解能DEMの可用性の限界は、自動マッピングを妨げている。
本研究は,中国四川省と雲南省の氷河地帯を対象とする,Google Earthの3,340個の高解像度画像を手動でアノテートした,大規模な光のみのモレーンセグメンテーションデータセットを初めて紹介する。
我々は,MobileNetV2エンコーダ,CBAM(Convolutional Block Attention Module),DeepLabV3+デコーダを統合した軽量ベースラインであるMCD-Netを開発した。
より深いバックボーン (ResNet152, Xception) に対するベンチマークでは、MCD-Net の平均インターセクション (mIoU) は62.3 %、ディス係数は72.8 %、計算コストは60 %以上である。
尾根の起伏はサブピクセル幅とスペクトルのあいまいさによって制約されているが、光学画像だけではモレーンボディのセグメンテーションが信頼できることを示す。
データセットとコードはhttps://github.com/Lyra-alpha/MCD-Netで公開されている。
関連論文リスト
- Localizing Audio-Visual Deepfakes via Hierarchical Boundary Modeling [50.8215545241128]
私たちはaを提案します。
境界モデリングネットワーク(HBMNet)には、オーディオ・ビジュアル・フィーチャー(Audio-Visual Feature)という3つのモジュールが含まれている。
粗提案発電機と微細階層確率発生装置
モダリティの観点からは、フレームレベルの監督によって強化されたオーディオ・ビジュアル・エンコーディングと融合を強化する。
実験により、符号化と融合が主に精度を向上し、フレームレベルの監視リコールが可能であることが示された。
論文 参考訳(メタデータ) (2025-08-04T02:41:09Z) - LIDAR: Lightweight Adaptive Cue-Aware Fusion Vision Mamba for Multimodal Segmentation of Structural Cracks [27.57718303520023]
軽量適応Cue-Aware Vision Mambaネットワークを提案する。
マルチモーダルひび割れのシナリオ下で、異なるモーダルから形態的およびテクスチャ的手がかりを効率よく知覚し、統合する。
本手法はF1では0.8204、mIoUでは0.8465、パラメータは5.35Mである。
論文 参考訳(メタデータ) (2025-07-30T08:28:20Z) - DISTA-Net: Dynamic Closely-Spaced Infrared Small Target Unmixing [55.366556355538954]
本稿では,動的フレームワーク内で従来のスパース再構築を再現する動的反復収縮閾値ネットワーク(DISTA-Net)を提案する。
DISTA-Netは、密接な空間を持つ赤外線小ターゲットのアンミックスのために特別に設計された最初のディープラーニングモデルである。
私たちはこの分野におけるさらなる研究を促進するために、最初のオープンソースエコシステムを確立しました。
論文 参考訳(メタデータ) (2025-05-25T13:52:00Z) - CalibNet: Dual-branch Cross-modal Calibration for RGB-D Salient Instance Segmentation [88.50067783122559]
CalibNetは3つの単純なモジュール、動的インタラクティブカーネル(DIK)と重量共有融合(WSF)で構成されている。
実験の結果、CalibNetは、COME15K-Nテストセット上で320*480の入力サイズを持つ58.0% APという有望な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2023-07-16T16:49:59Z) - Lightweight Salient Object Detection in Optical Remote-Sensing Images
via Semantic Matching and Edge Alignment [61.45639694373033]
セマンティックマッチングとエッジアライメントに基づく光リモートセンシング画像(ORSI-SOD)のための新しい軽量ネットワークSeaNetを提案する。
具体的には、機能抽出のための軽量MobileNet-V2、高レベルの機能のための動的セマンティックマッチングモジュール(DSMM)、推論のためのポータブルデコーダが含まれる。
論文 参考訳(メタデータ) (2023-01-07T04:33:51Z) - VMNet: Voxel-Mesh Network for Geodesic-Aware 3D Semantic Segmentation [33.45650048515893]
Voxel-Mesh Network(VMNet)は、Voxelとメッシュ表現をベースとした、新しい3Dディープアーキテクチャである。
室内シーンの大規模セグメンテーションにおいて,VMNetは最先端のSparseConvNetとMinkowskiNetより優れていることを示す。
論文 参考訳(メタデータ) (2021-07-29T08:41:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。