論文の概要: Differential Morphological Profile Neural Networks for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2509.04268v1
- Date: Thu, 04 Sep 2025 14:44:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-05 20:21:10.190481
- Title: Differential Morphological Profile Neural Networks for Semantic Segmentation
- Title(参考訳): セマンティックセグメンテーションのための微分形態プロファイルニューラルネットワーク
- Authors: David Huangal, J. Alex Hurt,
- Abstract要約: 最先端のセグメンテーションネットワークは、通常、地上の観察写真に基づいて開発・調整される。
微分形態素プロファイル(DMP)の現代セグメンテーションネットワークへの組み入れについて検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation of overhead remote sensing imagery enables applications in mapping, urban planning, and disaster response. State-of-the-art segmentation networks are typically developed and tuned on ground-perspective photographs and do not directly address remote sensing challenges such as extreme scale variation, foreground-background imbalance, and large image sizes. We explore the incorporation of the differential morphological profile (DMP), a multi-scale shape extraction method based on grayscale morphology, into modern segmentation networks. Prior studies have shown that the DMP can provide critical shape information to Deep Neural Networks to enable superior detection and classification performance in overhead imagery. In this work, we extend prior DMPNet work beyond classification and object detection by integrating DMP features into three state-of-the-art convolutional and transformer semantic segmentation architectures. We utilize both direct input, which adapts the input stem of feature extraction architectures to accept DMP channels, and hybrid architectures, a dual-stream design that fuses RGB and DMP encoders. Using the iSAID benchmark dataset, we evaluate a variety of DMP differentials and structuring element shapes to more effectively provide shape information to the model. Our results show that while non-DMP models generally outperform the direct-input variants, hybrid DMP consistently outperforms direct-input and is capable of surpassing a non-DMP model on mIoU, F1, and Recall.
- Abstract(参考訳): オーバーヘッドリモートセンシング画像のセマンティックセグメンテーションは、マッピング、都市計画、災害対応に応用することができる。
最先端のセグメンテーションネットワークは、通常、地平線写真に基づいて開発・調整され、極端なスケールの変動、前景のアンバランス、大きな画像サイズといったリモートセンシングの課題に直接対処しない。
微分形態素プロファイル (DMP) は, グレースケール形態素に基づく多スケール形状抽出法であり, 現代のセグメンテーションネットワークに組み入れられている。
以前の研究では、DMPがDeep Neural Networksに重要な形状情報を提供し、オーバーヘッド画像における優れた検出と分類性能を実現することが示されている。
本研究では,従来のDMPNet処理を分類やオブジェクト検出を超えて,DMP機能を3つの最先端の畳み込みおよびトランスフォーマーセマンティックセマンティクスアーキテクチャに統合することによって拡張する。
我々は,特徴抽出アーキテクチャの入力幹をDMPチャネルに適応させるダイレクト入力と,RGBとDMPエンコーダを融合したデュアルストリーム設計であるハイブリッドアーキテクチャの両方を利用する。
iSAIDベンチマークデータセットを用いて、様々なDMP差分と要素形状を評価し、モデルにより効果的に形状情報を提供する。
以上の結果から,非DMPモデルは直接入力モデルよりも優れているが,Hybrid DMPは直接入力モデルよりも優れ,mIoU,F1,Recallでは非DMPモデルを上回ることが示唆された。
関連論文リスト
- GCRPNet: Graph-Enhanced Contextual and Regional Perception Network For Salient Object Detection in Optical Remote Sensing Images [60.296124001189646]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - MTP: Advancing Remote Sensing Foundation Model via Multi-Task Pretraining [73.81862342673894]
ファンデーションモデルは、様々な画像解釈タスクを強化することで、リモートセンシング(RS)のランドスケープを再構築した。
事前訓練されたモデルを下流のタスクに転送することは、イメージ分類やオブジェクト識別タスクとして事前訓練の定式化によるタスクの相違に遭遇する可能性がある。
SAMRSデータセット上で、セマンティックセグメンテーション、インスタンスセグメンテーション、回転オブジェクト検出を含むマルチタスクによる事前トレーニングを行う。
我々のモデルは、シーン分類、水平・回転物体検出、セマンティックセグメンテーション、変化検出など、様々なRS下流タスクに基づいて微調整される。
論文 参考訳(メタデータ) (2024-03-20T09:17:22Z) - MDFL: Multi-domain Diffusion-driven Feature Learning [19.298491870280213]
マルチドメイン拡散駆動型特徴学習ネットワーク(MDFL)を提案する。
MDFLはモデルが本当に重視する効果的な情報領域を再定義します。
MDFLは高次元データの特徴抽出性能を著しく向上することを示した。
論文 参考訳(メタデータ) (2023-11-16T02:55:21Z) - DMTNet: Dynamic Multi-scale Network for Dual-pixel Images Defocus
Deblurring with Transformer [1.408706290287121]
最近の研究は、畳み込みニューラルネットワーク(CNN)を用いた二重画素データに基づくデフォーカスデブロリングタスクにおいて優れた結果をもたらす。
デュアルピクセル画像デフォーカスデブロリングのための動的マルチスケールネットワークDMTNetを提案する。
論文 参考訳(メタデータ) (2022-09-13T14:47:09Z) - Pyramid Grafting Network for One-Stage High Resolution Saliency
Detection [29.013012579688347]
我々は、異なる解像度画像から特徴を独立して抽出する、Praamid Grafting Network (PGNet) と呼ばれるワンステージフレームワークを提案する。
CNNブランチが壊れた詳細情報をよりホモロジーに組み合わせられるように、アテンションベースのクロスモデルグラフティングモジュール (CMGM) が提案されている。
我々は,4K-8K解像度で5,920個の画像を含む超高分解能塩度検出データセットUHRSDを新たに提供した。
論文 参考訳(メタデータ) (2022-04-11T12:22:21Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - Dynamic Proximal Unrolling Network for Compressive Sensing Imaging [29.00266254916676]
本稿では,DPUNetと呼ばれる動的近位アンローリングネットワークについて述べる。
具体的には、DPUNetは、勾配降下による埋め込み物理モデルと、学習された動的近位写像による画像のインポーティングの両方を活用できる。
実験結果から,提案したDPUNetは,サンプル比や雑音レベルの異なる複数のCSIモダリティを1つのモデルで効果的に処理できることがわかった。
論文 参考訳(メタデータ) (2021-07-23T03:04:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。