論文の概要: HeatPrompt: Zero-Shot Vision-Language Modeling of Urban Heat Demand from Satellite Images
- arxiv url: http://arxiv.org/abs/2602.20066v1
- Date: Mon, 23 Feb 2026 17:22:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.925239
- Title: HeatPrompt: Zero-Shot Vision-Language Modeling of Urban Heat Demand from Satellite Images
- Title(参考訳): 熱プロンプト:衛星画像による都市熱需要のゼロショットビジョンランゲージモデリング
- Authors: Kundan Thota, Xuanhao Mu, Thorsten Schlachter, Veit Hagenmeyer,
- Abstract要約: HeatPromptはゼロショットビジョン言語エネルギーモデリングフレームワークである。
衛星画像から抽出した意味的特徴,基本地理情報システム(GIS),建築レベルの特徴を用いて,年次熱需要を推定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate heat-demand maps play a crucial role in decarbonizing space heating, yet most municipalities lack detailed building-level data needed to calculate them. We introduce HeatPrompt, a zero-shot vision-language energy modeling framework that estimates annual heat demand using semantic features extracted from satellite images, basic Geographic Information System (GIS), and building-level features. We feed pretrained Large Vision Language Models (VLMs) with a domain-specific prompt to act as an energy planner and extract the visual attributes such as roof age, building density, etc, from the RGB satellite image that correspond to the thermal load. A Multi-Layer Perceptron (MLP) regressor trained on these captions shows an $R^2$ uplift of 93.7% and shrinks the mean absolute error (MAE) by 30% compared to the baseline model. Qualitative analysis shows that high-impact tokens align with high-demand zones, offering lightweight support for heat planning in data-scarce regions.
- Abstract(参考訳): 正確な熱需要マップは、宇宙暖房を脱炭酸する上で重要な役割を果たすが、ほとんどの自治体はそれらを計算するのに必要な詳細なビルレベルのデータを持っていない。
本研究では,衛星画像から抽出した意味的特徴,基本地理情報システム(GIS),建築レベルの特徴を用いて,年次熱需要を推定するゼロショットビジョン言語エネルギーモデリングフレームワークであるHeatPromptを紹介する。
本稿では,エネルギープランナとして機能するドメイン固有のプロンプトを付加した事前学習されたLarge Vision Language Model (VLM) を用いて,RGB衛星画像から屋上年齢,建築密度などの視覚特性を抽出する。
これらのキャプションでトレーニングされたMulti-Layer Perceptron(MLP)レジストレータは、93.7%のR^2$アップリフトを示し、ベースラインモデルと比較して平均絶対誤差(MAE)を30%縮小する。
定性的分析は、高インパクトトークンが高需要ゾーンと整合し、データスカース領域における熱計画の軽量サポートを提供することを示している。
関連論文リスト
- ThermEval: A Structured Benchmark for Evaluation of Vision-Language Models on Thermal Imagery [11.547362584832769]
ヴィジュアル言語モデル(VLM)はRGB画像において高い性能を達成するが、熱画像には一般化しない。
サーマルセンシングは、夜間監視、捜索救助、自律運転、医療スクリーニングなど、可視光が失敗する状況において重要な役割を果たす。
本稿ではサーマルビジョン言語理解に必要な基礎的プリミティブを評価するベンチマークであるThermEval-Bを紹介する。
論文 参考訳(メタデータ) (2026-02-16T18:16:19Z) - DescribeEarth: Describe Anything for Remote Sensing Images [56.04533626223295]
リモートセンシングのためのオブジェクトレベルのきめ細かい画像キャプションのための新しいタスクであるGeo-DLCを提案する。
このタスクを支援するために,オブジェクト属性,関係,コンテキストを詳細に記述した大規模データセットであるDE-Datasetを構築した。
また,Geo-DLC用に設計されたマルチモーダル大規模言語モデルアーキテクチャであるDescribeEarthを提案する。
論文 参考訳(メタデータ) (2025-09-30T01:53:34Z) - RS-vHeat: Heat Conduction Guided Efficient Remote Sensing Foundation Model [59.37279559684668]
本稿では,効率的なマルチモーダルリモートセンシング基盤モデルであるRS-vHeatを紹介する。
具体的には、RS-vHeatは、O(N1.5)$の複雑さを持つ熱伝導演算子(HCO)と、大域的受容場を適用している。
注意に基づくリモートセンシング基礎モデルと比較して、メモリ使用量を84%削減し、FLOPを24%削減し、スループットを2.7倍改善する。
論文 参考訳(メタデータ) (2024-11-27T01:43:38Z) - ClimateIQA: A New Dataset and Benchmark to Advance Vision-Language Models in Meteorology Anomalies Analysis [32.940471253248965]
Sparse Position and Outline Tracking (SPOT) は、視覚データにおける不規則な形状の領域を処理するために設計された新しいアルゴリズムである。
SPOTは、空間座標を抽出して不規則な形状の領域を特定し、局所化し、不規則な形状の構造化表現を可能にする。
SPOT上に構築したClimateIQAは,新しい気象学的視覚的質問応答データセットである。
ClimateIQAは、空間的手がかり、地理的メタデータ、分析データを組み込むことでVLMトレーニングを強化し、極端な気象特性の解釈と記述におけるモデルの精度を向上させる。
論文 参考訳(メタデータ) (2024-06-14T08:46:44Z) - Building Vision Models upon Heat Conduction [66.1594989193046]
本研究は, 物理的熱伝導原理に基づく熱伝導演算子 (HCO) について紹介する。
HCOは熱源としてイメージパッチを概念化し、適応的な熱エネルギー拡散を通じて相関をモデル化する。
vHeatは、Swin-Transformerと比較して最大で3倍のスループット、GPUメモリ割り当ての80%削減、計算FLOPの35%削減を実現している。
論文 参考訳(メタデータ) (2024-05-26T12:58:04Z) - Semantics from Space: Satellite-Guided Thermal Semantic Segmentation Annotation for Aerial Field Robots [8.265009823753982]
本研究では,航空機から撮影した熱画像のセマンティックセグメンテーションアノテーションを自動生成する手法を提案する。
この新しい機能は、フィールドロボットの熱的意味認識アルゴリズムを開発する際の課題を克服する。
提案手法では,低解像度衛星土地被覆データを用いた高精度なセマンティックセマンティックセマンティクスラベルを低コストで作成することができる。
論文 参考訳(メタデータ) (2024-03-21T00:59:35Z) - Semantic segmentation of longitudinal thermal images for identification
of hot and cool spots in urban areas [1.124958340749622]
本研究は,都市部におけるホットスポットとクールスポットを識別するために,近隣スケールで収集したセマンティック・セグメンテーション・縦・空間的にリッチな熱画像の解析を行う。
サーマルイメージデータセットのサブセットを使用して、最先端のディープラーニングモデルをトレーニングし、さまざまな都市の特徴を抽出した。
論文 参考訳(メタデータ) (2023-10-06T13:41:39Z) - A Large-Scale, Time-Synchronized Visible and Thermal Face Dataset [62.193924313292875]
DEVCOM Army Research Laboratory Visible-Thermal Faceデータセット(ARL-VTF)を発表します。
395人の被験者から50万枚以上の画像が得られたARL-VTFデータセットは、これまでで最大の可視画像とサーマルフェイス画像の収集データだ。
本論文では,ALL-VTFデータセットを用いたサーマルフェースランドマーク検出とサーマル・トゥ・ヴィジブルフェース検証のベンチマーク結果と分析について述べる。
論文 参考訳(メタデータ) (2021-01-07T17:17:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。