論文の概要: Atlas Urban Index: A VLM-Based Approach for Spatially and Temporally Calibrated Urban Development Monitoring
- arxiv url: http://arxiv.org/abs/2510.22702v1
- Date: Sun, 26 Oct 2025 14:53:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.33304
- Title: Atlas Urban Index: A VLM-Based Approach for Spatially and Temporally Calibrated Urban Development Monitoring
- Title(参考訳): Atlas Urban Index: 空間的・時間的都市開発モニタリングのためのVLMに基づくアプローチ
- Authors: Mithul Chander, Sai Pragnya Ranga, Prathamesh Mayekar,
- Abstract要約: 我々は,Sentinel-2衛星画像を用いた都市開発評価指標であるEm Atlas Urban Index(AUI)を紹介する。
既存のアプローチ、例えばEm Normalized Different Build-up Index (NDBI)は、大気ノイズ、季節変動、雲の覆いなどの要因により、都市開発を正確に捉えるのに苦労することが多い。
- 参考スコア(独自算出の注目度): 3.3132106391262934
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce the {\em Atlas Urban Index} (AUI), a metric for measuring urban development computed using Sentinel-2 \citep{spoto2012sentinel2} satellite imagery. Existing approaches, such as the {\em Normalized Difference Built-up Index} (NDBI), often struggle to accurately capture urban development due to factors like atmospheric noise, seasonal variation, and cloud cover. These limitations hinder large-scale monitoring of human development and urbanization. To address these challenges, we propose an approach that leverages {\em Vision-Language Models }(VLMs) to provide a development score for regions. Specifically, we collect a time series of Sentinel-2 images for each region. Then, we further process the images within fixed time windows to get an image with minimal cloud cover, which serves as the representative image for that time window. To ensure consistent scoring, we adopt two strategies: (i) providing the VLM with a curated set of reference images representing different levels of urbanization, and (ii) supplying the most recent past image to both anchor temporal consistency and mitigate cloud-related noise in the current image. Together, these components enable AUI to overcome the challenges of traditional urbanization indices and produce more reliable and stable development scores. Our qualitative experiments on Bangalore suggest that AUI outperforms standard indices such as NDBI.
- Abstract(参考訳): 我々はSentinel-2 \citep{spoto2012sentinel2}衛星画像を用いて都市開発を測定するための指標である {\em Atlas Urban Index} (AUI)を紹介した。
既存のアプローチ、例えば {\em Normalized Different Build-up Index (NDBI) は、大気ノイズ、季節変動、雲の覆いなどの要因により、都市開発を正確に捉えるのに苦労することが多い。
これらの制限は、人間の発達と都市化の大規模監視を妨げる。
これらの課題に対処するために、我々は、領域の開発スコアを提供するために、VLM(Vision-Language Models)を活用するアプローチを提案する。
具体的には、各領域のSentinel-2画像の時系列を収集する。
さらに、固定時間ウィンドウ内の画像を処理して、その時間ウィンドウの代表的な画像として機能する、最小限の雲カバーを持つ画像を得る。
一貫性のあるスコアを確保するために、私たちは2つの戦略を採用しています。
一 異なるレベルの都市化を表わす基準画像のキュレートされたセットをVLMに提供すること。
(II) 直近の過去の画像をアンカー時間的一貫性と、現在の画像における雲関連ノイズの緩和の両方に供給する。
これらのコンポーネントを組み合わせることで、AUIは従来の都市化指標の課題を克服し、より信頼性が高く安定した開発スコアを得ることができる。
バンガロールにおける定性的実験は,AUIがNDBIなどの標準指標より優れていることを示唆している。
関連論文リスト
- UrbanFeel: A Comprehensive Benchmark for Temporal and Perceptual Understanding of City Scenes through Human Perspective [26.682345246235766]
UrbanFeelは、3つの認知的に進歩的な次元にまたがる、慎重に構築された視覚的質問からなる。
Gemini-2.5 Proは、人間のエキスパートレベルに近づいているため、全体的なパフォーマンスが最高である。
論文 参考訳(メタデータ) (2025-09-26T11:38:57Z) - NFIG: Multi-Scale Autoregressive Image Generation via Frequency Ordering [47.442844594442455]
NextFrequency Image Generation (NFIG)は、画像生成プロセスを複数の周波数誘導段階に分解する新しいフレームワークである。
NFIGは生成過程を自然な画像構造と整合させる。
これは最初に低周波成分を生成し、トークンを著しく少なくして効率的にグローバル構造を捉え、その後、徐々に高周波の細部を付加することで実現している。
論文 参考訳(メタデータ) (2025-03-10T08:59:10Z) - Continuous Urban Change Detection from Satellite Image Time Series with Temporal Feature Refinement and Multi-Task Integration [5.095834019284525]
2つの重要なモジュールを組み込んだ連続的な都市変化検出フレームワークを提案する。
時間的特徴改善(TFR)モジュールは、ConvNetベースのマルチ時間的ビルディング表現を改善するために自己アテンションを使用する。
マルチタスク統合(MTI)モジュールはマルコフネットワークを利用して最適なビルディングマップ時系列を見つける。
論文 参考訳(メタデータ) (2024-06-25T10:53:57Z) - Exposure Bracketing Is All You Need For A High-Quality Image [50.822601495422916]
マルチ露光画像は、デノイング、デブロアリング、高ダイナミックレンジイメージング、超解像において相補的である。
本研究では,これらの課題を組み合わせ,高品質な画像を得るために露光ブラケット写真を活用することを提案する。
特に時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文 参考訳(メタデータ) (2024-01-01T14:14:35Z) - Cross-City Matters: A Multimodal Remote Sensing Benchmark Dataset for
Cross-City Semantic Segmentation using High-Resolution Domain Adaptation
Networks [82.82866901799565]
我々は,都市間セマンティックセマンティックセグメンテーションタスクの研究を目的とした,新しいマルチモーダルリモートセンシングベンチマークデータセット(ハイパースペクトル,マルチスペクトル,SARを含む)を構築した。
単一都市に留まらず,多都市環境からAIモデルの一般化能力を促進するため,高解像度なドメイン適応ネットワークであるHighDANを提案する。
高DANは, 並列高分解能融合方式で, 都市景観の空間的トポロジカルな構造を良好に維持することができる。
論文 参考訳(メタデータ) (2023-09-26T23:55:39Z) - Urban-StyleGAN: Learning to Generate and Manipulate Images of Urban
Scenes [38.41863868729436]
本稿では,都市景観の生成と操作のための新しい枠組みであるUrban-StyleGANを提案する。
都市景観は人間の顔よりも複雑であるため,SSGの直接的な適用は,結果の低下につながることが判明した。
本手法では,ジェネレータの$mathcalS$-spaceに非教師付き潜伏探索アルゴリズムを適用し,画像内容の制御において従来の$mathcalW+$-spaceよりも効率的であることを示す。
論文 参考訳(メタデータ) (2023-05-16T16:54:48Z) - A Novel CNN-LSTM-based Approach to Predict Urban Expansion [1.2233362977312943]
時系列リモートセンシングデータは、幅広いアプリケーションで使用できる豊富な情報ソースを提供します。
本稿では,時系列衛星画像を用いた都市拡大予測の課題について論じる。
都市の拡大を予測するためのセマンティックイメージ分割に基づく新しい2ステップアプローチを提案する。
論文 参考訳(メタデータ) (2021-03-02T12:58:05Z) - Predicting Livelihood Indicators from Community-Generated Street-Level
Imagery [70.5081240396352]
本稿では,クラウドソースによるストリートレベルの画像から重要な生活指標を予測するための,安価でスケーラブルで解釈可能なアプローチを提案する。
全国的に代表される世帯調査で収集した地上データと比較することにより,貧困,人口,健康の指標を正確に予測する上でのアプローチの有効性を実証した。
論文 参考訳(メタデータ) (2020-06-15T18:12:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。