論文の概要: Urban1960SatSeg: Unsupervised Semantic Segmentation of Mid-20$^{th}$ century Urban Landscapes with Satellite Imageries
- arxiv url: http://arxiv.org/abs/2506.09476v1
- Date: Wed, 11 Jun 2025 07:41:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 06:35:02.712687
- Title: Urban1960SatSeg: Unsupervised Semantic Segmentation of Mid-20$^{th}$ century Urban Landscapes with Satellite Imageries
- Title(参考訳): 1960SatSeg: 衛星画像による20世紀中頃の都市景観の非監督的セマンティックセマンティックセマンティックセグメンテーション
- Authors: Tianxiang Hao, Lixian Zhang, Yingjia Zhang, Mengxuan Chen, Jinxiao Zhang, Haohuan Fu,
- Abstract要約: $textbfUrban 1960SatBench$は、歴史的衛星画像に基づく注釈付きセグメンテーションデータセットである。
$textbfUrban 1960SatUSM$は教師なしセグメンテーションタスクのためのベンチマークフレームワークである。
- 参考スコア(独自算出の注目度): 4.8096831292938385
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Historical satellite imagery, such as mid-20$^{th}$ century Keyhole data, offers rare insights into understanding early urban development and long-term transformation. However, severe quality degradation (e.g., distortion, misalignment, and spectral scarcity) and annotation absence have long hindered semantic segmentation on such historical RS imagery. To bridge this gap and enhance understanding of urban development, we introduce $\textbf{Urban1960SatBench}$, an annotated segmentation dataset based on historical satellite imagery with the earliest observation time among all existing segmentation datasets, along with a benchmark framework for unsupervised segmentation tasks, $\textbf{Urban1960SatUSM}$. First, $\textbf{Urban1960SatBench}$ serves as a novel, expertly annotated semantic segmentation dataset built on mid-20$^{th}$ century Keyhole imagery, covering 1,240 km$^2$ and key urban classes (buildings, roads, farmland, water). As the earliest segmentation dataset of its kind, it provides a pioneering benchmark for historical urban understanding. Second, $\textbf{Urban1960SatUSM}$(Unsupervised Segmentation Model) is a novel unsupervised semantic segmentation framework for historical RS imagery. It employs a confidence-aware alignment mechanism and focal-confidence loss based on a self-supervised learning architecture, which generates robust pseudo-labels and adaptively prioritizes prediction difficulty and label reliability to improve unsupervised segmentation on noisy historical data without manual supervision. Experiments show Urban1960SatUSM significantly outperforms existing unsupervised segmentation methods on Urban1960SatSeg for segmenting historical urban scenes, promising in paving the way for quantitative studies of long-term urban change using modern computer vision. Our benchmark and supplementary material are available at https://github.com/Tianxiang-Hao/Urban1960SatSeg.
- Abstract(参考訳): 20世紀半ばのキーホール・データのような歴史的衛星画像は、初期の都市開発と長期の変容を理解するための希少な洞察を与えてくれる。
しかし, 深刻な品質劣化(歪み, 修正不良, スペクトル不足など)とアノテーションの欠如は, 歴史的RS画像のセマンティックセマンティックセグメンテーションを長く妨げている。
このギャップを埋め、都市開発を理解するために、過去の衛星画像に基づく注釈付きセグメンテーションデータセットである$\textbf{Urban 1960SatBench}$と、教師なしセグメンテーションタスクのベンチマークフレームワークである$\textbf{Urban 1960SatUSM}$を紹介する。
まず、$\textbf{Urban 1960SatBench}$は、20世紀中頃のキーホールイメージ上に構築された、専門的な注釈付きセマンティックセマンティックセマンティクスデータセットとして機能し、1,240 km$^2$および重要な都市クラス(建物、道路、農地、水)をカバーする。
この種の最初期のセグメンテーションデータセットとして、歴史的都市理解のための先駆的なベンチマークを提供する。
第二に、$\textbf{Urban 1960SatUSM}$(Unsupervised Segmentation Model)は歴史的RS画像のための新しい教師なしセマンティックセマンティックセマンティクスフレームワークである。
自己教師付き学習アーキテクチャに基づく信頼度アライメント機構と焦点信頼損失を採用し、ロバストな擬似ラベルを生成し、予測難易度とラベル信頼性を適応的に優先順位付けし、手動による教師なし履歴データに対する教師なしセグメンテーションを改善する。
実験によると、1960SatUSMは1960SatSegの既存の教師なしセグメンテーション手法よりも、歴史的都市シーンのセグメンテーションに優れており、現代のコンピュータビジョンを用いた長期的な都市変化の定量的研究の道を開くことを約束している。
ベンチマークと補足資料はhttps://github.com/Tianxiang-Hao/Urban 1960SatSegで公開されています。
関連論文リスト
- HouseTS: A Large-Scale, Multimodal Spatiotemporal U.S. Housing Dataset [22.062024691803927]
HouseTSは、2012年3月から2023年12月まで、アメリカの30の主要都市圏の6000のコードにわたって、月々の住宅価格をカバーする大規模なマルチモーダルデータセットである。
データセットには890K以上のレコードが含まれており、興味点(POI)、社会経済指標、詳細な不動産指標が豊富である。
論文 参考訳(メタデータ) (2025-06-01T00:52:41Z) - Adaptive Location Hierarchy Learning for Long-Tailed Mobility Prediction [37.930452438916795]
本研究では,長期移動予測のためのプラグイン・アンド・プレイ・フレームワークを提案する。
まず, 大規模言語モデル(LLM)に基づく都市に適した位置階層を構築し, マスローの人間モチベーション理論を活用する。
6つのデータセットにわたる最先端モデルの実験は、フレームワークの一貫性のある有効性と一般化可能性を示している。
論文 参考訳(メタデータ) (2025-05-26T13:26:35Z) - FUSU: A Multi-temporal-source Land Use Change Segmentation Dataset for Fine-grained Urban Semantic Understanding [6.833536116934201]
都市セマンティック理解のための土地利用変化セグメンテーションデータセットであるFUSUを紹介した。
FUSUは、これまでで最も詳細な土地利用分類システムであり、17のクラスと300億ピクセルのアノテーションがある。
中国南部と北部の5つの都市部で847km2をカバーし、0.2-0.5mの地中サンプルと月毎の光学・レーダー衛星時系列の両時間高解像度衛星画像を含んでいる。
論文 参考訳(メタデータ) (2024-05-29T12:56:11Z) - DatUS^2: Data-driven Unsupervised Semantic Segmentation with Pre-trained
Self-supervised Vision Transformer [6.898332152137321]
教師なしの密接なセマンティックセグメンテーションは下流のタスクとして研究されていない。
本稿では、下流タスクとして教師なしセマンティックセグメンテーションのための新しいデータ駆動手法を提案する。
DatUS2のベストバージョンは、教師なしの密接なセマンティックセグメンテーションタスクにおいて、既存の最先端メソッドよりも優れている。
論文 参考訳(メタデータ) (2024-01-23T14:53:32Z) - Navya3DSeg -- Navya 3D Semantic Segmentation Dataset & split generation
for autonomous vehicles [63.20765930558542]
3Dセマンティックデータは、障害物検出やエゴ-車両の局所化といった中核的な認識タスクに有用である。
そこで我々は,大規模生産段階の運用領域に対応する多様なラベル空間を持つ新しいデータセットであるNavala 3D(Navya3DSeg)を提案する。
ラベルのない23のラベル付きシーケンスと25の補足シーケンスが含まれており、ポイントクラウド上の自己教師付きおよび半教師付きセマンティックセマンティックセグメンテーションベンチマークを探索するために設計された。
論文 参考訳(メタデータ) (2023-02-16T13:41:19Z) - Urban Scene Semantic Segmentation with Low-Cost Coarse Annotation [107.72926721837726]
粗いアノテーションは、セマンティックセグメンテーションモデルをトレーニングするための、低コストで非常に効果的な代替手段である。
粗い注釈付きデータの未ラベル領域の擬似ラベルを生成する粗大な自己学習フレームワークを提案する。
提案手法は,アノテーションの予算のごく一部で完全に注釈付けされたデータに匹敵する性能が得られるため,大幅な性能向上とアノテーションのコストトレードオフを実現する。
論文 参考訳(メタデータ) (2022-12-15T15:43:42Z) - Unsupervised Semantic Segmentation by Distilling Feature Correspondences [94.73675308961944]
教師なしセマンティックセグメンテーション(unsupervised semantic segmentation)は、アノテーションなしで画像コーパス内の意味論的意味のあるカテゴリを発見し、ローカライズすることを目的としている。
STEGOは、教師なし特徴を高品質な個別のセマンティックラベルに蒸留する新しいフレームワークである。
STEGOは、CocoStuffとCityscapesの両課題において、先行技術よりも大幅に改善されている。
論文 参考訳(メタデータ) (2022-03-16T06:08:47Z) - Large-scale Unsupervised Semantic Segmentation [163.3568726730319]
本稿では, 大規模無教師付きセマンティックセマンティックセグメンテーション (LUSS) の新たな課題を提案する。
ImageNetデータセットに基づいて、120万のトレーニング画像と40万の高品質なセマンティックセグメンテーションアノテーションを用いた画像Net-Sデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-06T15:02:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。