論文の概要: MapSR: Prompt-Driven Land Cover Map Super-Resolution via Vision Foundation Models
- arxiv url: http://arxiv.org/abs/2604.14582v1
- Date: Thu, 16 Apr 2026 03:20:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.706181
- Title: MapSR: Prompt-Driven Land Cover Map Super-Resolution via Vision Foundation Models
- Title(参考訳): MapSR: ビジョンファウンデーションモデルによるプロンプト駆動の土地被覆マップの超解法
- Authors: Ruiqi Wang, Qi Yu, Jie Ma, Hanlin Wu,
- Abstract要約: 高分解能(HR)ランドカバーマッピングは高コストのHRアノテーションによって制約されることが多い。
モデルトレーニングから監督を分離する,プロンプト駆動型フレームワークであるMapSRを提案する。
- 参考スコア(独自算出の注目度): 33.92493213658201
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-resolution (HR) land-cover mapping is often constrained by the high cost of dense HR annotations. We revisit this problem from the perspective of map super-resolution, which enhances coarse low-resolution (LR) land-cover products into HR maps at the resolution of the input imagery. Existing weakly supervised methods can leverage LR labels, but they typically use them to retrain dense predictors with substantial computational cost. We propose MapSR, a prompt-driven framework that decouples supervision from model training. MapSR uses LR labels once to extract class prompts from frozen vision foundation model features through a lightweight linear probe, after which HR mapping proceeds via training-free metric inference and graph-based prediction refinement. Specifically, class prompts are estimated by aggregating high-confidence HR features identified by the linear probe, and HR predictions are obtained by cosine-similarity matching followed by graph-based propagation for spatial refinement. Experiments on the Chesapeake Bay dataset show that MapSR achieves 59.64% mIoU without any HR labels, remaining competitive with the strongest weakly supervised baseline and surpassing a fully supervised baseline. Notably, MapSR reduces trainable parameters by four orders of magnitude and shortens training time from hours to minutes, enabling scalable HR mapping under limited annotation and compute budgets. The code is available at https://github.com/rikirikirikiriki/MapSR.
- Abstract(参考訳): 高分解能(HR)ランドカバーマッピングは高コストのHRアノテーションによって制約されることが多い。
我々は、この問題を、入力画像の解像度で粗い低解像度(LR)ランドカバー積をHRマップに拡張するマップ超解法の観点から再考する。
既存の弱教師付き手法はLRラベルを利用することができるが、それらは典型的には高密度予測器を相当な計算コストで再訓練するために使われる。
モデルトレーニングから監督を分離する,プロンプト駆動型フレームワークであるMapSRを提案する。
MapSRはLRラベルを使用して凍結視覚基礎モデルの特徴からクラスプロンプトを軽量な線形プローブで抽出し、その後HRマッピングはトレーニング不要なメートル法推論とグラフベースの予測改善によって進行する。
具体的には、線形プローブによって同定された高信頼HR特徴を集約してクラスプロンプトを推定し、コサイン相似性マッチングとグラフベースの空間改善のための伝搬によりHR予測を求める。
チェサピーク湾のデータセットでの実験では、MapSRはHRラベルなしで59.64% mIoUを達成し、強力な教師付きベースラインと競争し、完全に監督されたベースラインを超えた。
特に、MapSRはトレーニング可能なパラメータを4桁に減らし、トレーニング時間を数時間から数分に短縮し、限られたアノテーションと計算予算の下でスケーラブルなHRマッピングを可能にする。
コードはhttps://github.com/rikirikirikiriki/MapSR.comで公開されている。
関連論文リスト
- MapGCLR: Geospatial Contrastive Learning of Representations for Online Vectorized HD Map Construction [44.37176678126708]
自動運転車は周囲の世界を理解するために地図情報に依存している。
よりスケーラブルな代替手段は、オンラインのHDマップ構築にある。
本研究は、ベクトル化されたオンラインHDマップ構築モデルにおいて、潜伏鳥眼ビュー(BEV)特徴グリッド表現を改善することに焦点を当てる。
我々は、単一トラバーサルラベル付きデータの縮小セットを用いて教師付き同じモデルを訓練し、マルチトラバーサル要求に従ってより広範なラベル付きデータセットに基づいて自己教師する。
論文 参考訳(メタデータ) (2026-03-11T11:58:23Z) - Learning without Exact Guidance: Updating Large-scale High-resolution Land Cover Maps from Low-resolution Historical Labels [4.833320222969612]
大規模な高解像度(HR)の土地被覆マッピングは、地球の表面を調査し、人類が直面する多くの課題を解決するための重要な課題である。
本研究では,大規模人事地被覆地図作成のための効率的かつ弱教師付きフレームワーク(Paraformer)を提案する。
論文 参考訳(メタデータ) (2024-03-05T08:02:00Z) - Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - Hi-Map: Hierarchical Factorized Radiance Field for High-Fidelity
Monocular Dense Mapping [51.739466714312805]
ニューラルラジアンス場(NeRF)に基づく新しいモノクリン高密度マッピング手法であるHi-Mapを導入する。
ハイマップは、RGB入力のみを用いた効率的かつ高忠実なマッピングを実現する能力において例外的である。
論文 参考訳(メタデータ) (2024-01-06T12:32:25Z) - Lightweight Super-Resolution Head for Human Pose Estimation [42.51588635059534]
ヒートマップに基づく手法がポーズ推定の主流となっている。
しかし、ヒートマップに基づくアプローチは、ダウンスケールのヒートマップを持つ重要な量子化誤差に悩まされる。
本稿では,SRPoseによる量子化誤差の低減と処理後処理への依存性について述べる。
論文 参考訳(メタデータ) (2023-07-31T15:35:34Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Cross-Scale Internal Graph Neural Network for Image Super-Resolution [147.77050877373674]
自然画像における非局所的な自己相似性は、画像修復に有効な先行研究として、よく研究されている。
単一の画像超解像(SISR)の場合、既存のディープ非局所法のほとんどは、低解像度(LR)入力画像と同じ規模のパッチしか利用していない。
これは、新しいクロススケールな内部グラフニューラルネットワーク(IGNN)を用いて実現される。
論文 参考訳(メタデータ) (2020-06-30T10:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。