論文の概要: SLUM-i: Semi-supervised Learning for Urban Mapping of Informal Settlements and Data Quality Benchmarking
- arxiv url: http://arxiv.org/abs/2602.04525v1
- Date: Wed, 04 Feb 2026 13:16:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.535872
- Title: SLUM-i: Semi-supervised Learning for Urban Mapping of Informal Settlements and Data Quality Benchmarking
- Title(参考訳): SLUM-i:インフォーマルな集落の都市マッピングとデータ品質ベンチマークのための半教師付き学習
- Authors: Muhammad Taha Mukhtar, Syed Musa Ali Kazmi, Khola Naseem, Muhammad Ali Chattha, Andreas Dengel, Sheraz Ahmed, Muhammad Naseer Bajwa, Muhammad Imran Malik,
- Abstract要約: 急速な都市拡大は、低所得国と中所得国の主要都市における非公式の集落の成長を加速させた。
我々は,カラチとムンバイのベンチマークデータセットとともに,スクラッチから構築したLahoreのベンチマークデータセットを紹介した。
そこで本研究では,従来の半教師付き学習パイプラインに内在するクラス不均衡と特徴劣化を軽減するための,新しい半教師付きセグメンテーションフレームワークを提案する。
- 参考スコア(独自算出の注目度): 5.931174898048042
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rapid urban expansion has fueled the growth of informal settlements in major cities of low- and middle-income countries, with Lahore and Karachi in Pakistan and Mumbai in India serving as prominent examples. However, large-scale mapping of these settlements is severely constrained not only by the scarcity of annotations but by inherent data quality challenges, specifically high spectral ambiguity between formal and informal structures and significant annotation noise. We address this by introducing a benchmark dataset for Lahore, constructed from scratch, along with companion datasets for Karachi and Mumbai, which were derived from verified administrative boundaries, totaling 1,869 $\text{km}^2$ of area. To evaluate the global robustness of our framework, we extend our experiments to five additional established benchmarks, encompassing eight cities across three continents, and provide comprehensive data quality assessments of all datasets. We also propose a new semi-supervised segmentation framework designed to mitigate the class imbalance and feature degradation inherent in standard semi-supervised learning pipelines. Our method integrates a Class-Aware Adaptive Thresholding mechanism that dynamically adjusts confidence thresholds to prevent minority class suppression and a Prototype Bank System that enforces semantic consistency by anchoring predictions to historically learned high-fidelity feature representations. Extensive experiments across a total of eight cities spanning three continents demonstrate that our approach outperforms state-of-the-art semi-supervised baselines. Most notably, our method demonstrates superior domain transfer capability whereby a model trained on only 10% of source labels reaches a 0.461 mIoU on unseen geographies and outperforms the zero-shot generalization of fully supervised models.
- Abstract(参考訳): 急速な都市拡大は、パキスタンのラホールとカラチ、インドのムンバイなど、低所得国と中所得国の主要都市における非公式の集落の成長を加速させている。
しかし、これらの開拓地の大規模なマッピングは、アノテーションの不足だけでなく、データ品質の問題、特にフォーマルな構造と非公式な構造と重要なアノテーションノイズのスペクトルの曖昧さによって厳しく制約されている。
我々は,カラチとムンバイの共用データセットとともに,スクラッチから構築したラホールのベンチマークデータセットを導入することでこの問題に対処する。
フレームワークのグローバルなロバスト性を評価するため、我々は実験を5つの確立されたベンチマークに拡張し、3つの大陸に8つの都市を包含し、すべてのデータセットの包括的なデータ品質評価を提供する。
また、クラス不均衡を緩和し、標準半教師付き学習パイプラインに固有の特徴劣化を緩和する、新しい半教師付きセグメンテーションフレームワークを提案する。
本手法は,信頼度閾値を動的に調整してマイノリティクラス抑制を防ぐクラスアウェア適応閾値保持機構と,歴史的に学習された高忠実度特徴表現に予測を固定することで意味的一貫性を強制するプロトタイプバンクシステムを統合する。
3つの大陸にまたがる8つの都市での大規模な実験により、我々のアプローチが最先端の半教師付きベースラインより優れていることが実証された。
提案手法は, ソースラベルの10%でトレーニングされたモデルが, 未確認の地形上で0.461 mIoUに達し, 完全教師付きモデルのゼロショット一般化よりも優れる, 優れたドメイン転送能力を示す。
関連論文リスト
- Metadata Conditioned Large Language Models for Localization [25.913929585741034]
メタデータ条件付けは、領域間一般化を犠牲にすることなく、領域内性能を継続的に改善することを示す。
我々のアブレーション研究は、URLレベルのメタデータだけで地理的信号の多くをキャプチャすることを示した。
命令チューニングの後、メタデータ条件付きグローバルモデルはLLaMA-3.2-1B-インストラクトに匹敵する精度を達成する。
論文 参考訳(メタデータ) (2026-01-21T18:20:59Z) - Generalizable Slum Detection from Satellite Imagery with Mixture-of-Experts [20.100765943688454]
GRAMは、2段階のテスト時間適応フレームワークであり、ターゲット領域からのラベル付きデータを必要とせずに堅牢なスラムセグメンテーションを可能にする。
ソーストレーニングには,4大陸12都市を対象とした,100万規模の衛星データデータセットを使用します。
適応の間、専門家間の予測整合性は信頼できない擬似ラベルをフィルタリングし、モデルがこれまで見られなかった領域に効果的に一般化することを可能にする。
論文 参考訳(メタデータ) (2025-11-13T13:35:50Z) - DeepC4: Deep Conditional Census-Constrained Clustering for Large-scale Multitask Spatial Disaggregation of Urban Morphology [0.7237068561453082]
本稿では,局所的な国勢調査統計をクラスタレベルの制約として組み込んだ,深層学習に基づく空間分散手法を提案する。
我々の研究は、我々の既存の粗い派生情報を大規模に空間的監査するための、新しいディープラーニングベースのマッピング技術を提供してきた。
論文 参考訳(メタデータ) (2025-07-30T10:25:39Z) - Enhanced Urban Region Profiling with Adversarial Self-Supervised Learning for Robust Forecasting and Security [12.8405655328298]
既存のメソッドは、ノイズ、データ不完全性、セキュリティ脆弱性といった問題に悩まされることが多い。
本稿では,EUPAS(Adversarial Self-Supervised Learning)を用いた都市域プロファイリング手法を提案する。
EUPASは、犯罪予測、チェックイン予測、土地利用分類などの様々な予測タスクにおいて、堅牢なパフォーマンスを保証する。
論文 参考訳(メタデータ) (2024-02-02T06:06:45Z) - Recognize Any Regions [55.76437190434433]
RegionSpotは、ローカライゼーション基盤モデルから位置認識ローカライゼーション知識と、ViLモデルからのセマンティック情報を統合する。
オープンワールドオブジェクト認識の実験では、私たちのRereaSpotは、以前の代替よりも大きなパフォーマンス向上を実現しています。
論文 参考訳(メタデータ) (2023-11-02T16:31:49Z) - Cross-City Matters: A Multimodal Remote Sensing Benchmark Dataset for
Cross-City Semantic Segmentation using High-Resolution Domain Adaptation
Networks [82.82866901799565]
我々は,都市間セマンティックセマンティックセグメンテーションタスクの研究を目的とした,新しいマルチモーダルリモートセンシングベンチマークデータセット(ハイパースペクトル,マルチスペクトル,SARを含む)を構築した。
単一都市に留まらず,多都市環境からAIモデルの一般化能力を促進するため,高解像度なドメイン適応ネットワークであるHighDANを提案する。
高DANは, 並列高分解能融合方式で, 都市景観の空間的トポロジカルな構造を良好に維持することができる。
論文 参考訳(メタデータ) (2023-09-26T23:55:39Z) - Jalisco's multiclass land cover analysis and classification using a
novel lightweight convnet with real-world multispectral and relief data [51.715517570634994]
本稿では、LC分類と解析を行うために、新しい軽量(89kパラメータのみ)畳み込みニューラルネットワーク(ConvNet)を提案する。
本研究では,実世界のオープンデータソースを3つ組み合わせて13のチャネルを得る。
組込み分析は、いくつかのクラスにおいて限られたパフォーマンスを期待し、最も類似したクラスをグループ化する機会を与えてくれます。
論文 参考訳(メタデータ) (2022-01-26T14:58:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。