論文の概要: HouseTS: A Large-Scale, Multimodal Spatiotemporal U.S. Housing Dataset
- arxiv url: http://arxiv.org/abs/2506.00765v1
- Date: Sun, 01 Jun 2025 00:52:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:33.574449
- Title: HouseTS: A Large-Scale, Multimodal Spatiotemporal U.S. Housing Dataset
- Title(参考訳): HouseTS: 大規模マルチモーダル時空間の米国住宅データセット
- Authors: Shengkun Wang, Yanshen Sun, Fanglan Chen, Linhan Wang, Naren Ramakrishnan, Chang-Tien Lu, Yinlin Chen,
- Abstract要約: HouseTSは、2012年3月から2023年12月まで、アメリカの30の主要都市圏の6000のコードにわたって、月々の住宅価格をカバーする大規模なマルチモーダルデータセットである。
データセットには890K以上のレコードが含まれており、興味点(POI)、社会経済指標、詳細な不動産指標が豊富である。
- 参考スコア(独自算出の注目度): 22.062024691803927
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate house-price forecasting is essential for investors, planners, and researchers. However, reproducible benchmarks with sufficient spatiotemporal depth and contextual richness for long horizon prediction remain scarce. To address this, we introduce HouseTS a large scale, multimodal dataset covering monthly house prices from March 2012 to December 2023 across 6,000 ZIP codes in 30 major U.S. metropolitan areas. The dataset includes over 890K records, enriched with points of Interest (POI), socioeconomic indicators, and detailed real estate metrics. To establish standardized performance baselines, we evaluate 14 models, spanning classical statistical approaches, deep neural networks (DNNs), and pretrained time-series foundation models. We further demonstrate the value of HouseTS in a multimodal case study, where a vision language model extracts structured textual descriptions of geographic change from time stamped satellite imagery. This enables interpretable, grounded insights into urban evolution. HouseTS is hosted on Kaggle, while all preprocessing pipelines, benchmark code, and documentation are openly maintained on GitHub to ensure full reproducibility and easy adoption.
- Abstract(参考訳): 正確な住宅価格予測は投資家、プランナー、研究者にとって不可欠である。
しかし、十分な時空間深さと長期水平予測のための文脈的豊かさを持つ再現可能なベンチマークは依然として乏しい。
そこで本研究では,2012年3月から2023年12月にかけて,米国の30大都市圏の6000のZIPコードにまたがって,大規模なマルチモーダル・データセットをHouseTSに導入した。
データセットには890K以上のレコードが含まれており、興味点(POI)、社会経済指標、詳細な不動産指標が豊富である。
標準化されたパフォーマンスベースラインを確立するため、古典的な統計的アプローチ、ディープニューラルネットワーク(DNN)、事前訓練された時系列基礎モデルを含む14のモデルを評価する。
マルチモーダルケーススタディにおいてHouseTSの価値をさらに示しており、視覚言語モデルでは、タイムスタンプされた衛星画像から、地理的変化の構造化されたテキスト記述を抽出する。
これにより、都市進化に関する解釈可能な、基礎的な洞察が得られます。
HouseTSはKaggle上にホストされており、すべての前処理パイプライン、ベンチマークコード、ドキュメントはGitHubで公開メンテナンスされており、完全な再現性と簡単な採用が保証されている。
関連論文リスト
- CityLens: Benchmarking Large Language-Vision Models for Urban Socioeconomic Sensing [18.67492140450614]
CityLensは、衛星やストリートビューの画像から社会経済指標を予測するために、大きな言語ビジョンモデル(LLVM)の能力を評価するために設計されたベンチマークである。
経済、教育、犯罪、輸送、健康、環境の6つの主要な領域にまたがる、合計17のグローバルな分散都市をカバーするマルチモーダルデータセットを構築した。
その結果,LLVMは有望な知覚・推論能力を示すが,都市社会経済指標の予測には限界があることが明らかとなった。
論文 参考訳(メタデータ) (2025-05-31T12:25:33Z) - Leveraging Multivariate Long-Term History Representation for Time Series Forecasting [6.661358934189792]
MTS予測のためのLMHR(Long-term Multivariate Representation)というフレームワークを提案する。
LMHRは、長期の歴史をセグメントレベルの文脈表現にエンコードし、ポイントレベルのノイズを低減する。
急速に変化するパターンのトップ10%で予測精度を9.8%向上させる。
論文 参考訳(メタデータ) (2025-05-20T03:46:36Z) - TUM2TWIN: Introducing the Large-Scale Multimodal Urban Digital Twin Benchmark Dataset [90.97440987655084]
都市デジタルツインズ(UDT)は、都市管理と多様なソースからの複雑な異種データの統合に欠かせないものとなっている。
これらの課題に対処するために、最初の総合的マルチモーダルなUrban Digital TwinベンチマークデータセットTUM2TWINを紹介する。
このデータセットには、地理的にセマンティックに整合した3Dモデルとネットワーク、およびさまざまな地球、モバイル、航空、衛星観測結果、約10,000ドル以上のデータサブセット、そして現在767GBのデータが含まれている。
論文 参考訳(メタデータ) (2025-05-12T09:48:32Z) - GEOBench-VLM: Benchmarking Vision-Language Models for Geospatial Tasks [84.86699025256705]
本稿では,地理空間的タスクの視覚言語モデル(VLM)を評価するためのベンチマークであるGEOBench-VLMを提案する。
私たちのベンチマークでは、手動で検証された命令が1万以上あり、さまざまな視覚条件、オブジェクトタイプ、スケールにまたがっています。
地理空間固有の課題における性能を評価するために,いくつかの最先端のVLMを評価した。
論文 参考訳(メタデータ) (2024-11-28T18:59:56Z) - GIFT-Eval: A Benchmark For General Time Series Forecasting Model Evaluation [90.53485251837235]
時系列基礎モデルはゼロショット予測に優れ、明示的なトレーニングなしで多様なタスクを処理する。
GIFT-Evalは、多様なデータセットに対する評価を促進するための先駆的なベンチマークである。
GIFT-Evalには、144,000の時系列と17700万のデータポイントの23のデータセットが含まれている。
論文 参考訳(メタデータ) (2024-10-14T11:29:38Z) - Identifying every building's function in large-scale urban areas with multi-modality remote-sensing data [5.18540804614798]
本研究は,大規模都市部における建物機能同定のための半教師付き枠組みを提案する。
光画像、建築高さ、夜間光データを収集し、建物の形態特性を記述する。
結果は、政府による2万の検証ポイントと統計調査によって評価される。
論文 参考訳(メタデータ) (2024-05-08T15:32:20Z) - Lifelong Property Price Prediction: A Case Study for the Toronto Real
Estate Market [75.28009817291752]
自動資産評価のための最初の寿命予測モデルであるLuceを提示する。
ルースは不動産価格の2つの重要な問題に対処している。
トロント不動産市場から得られた大規模な実生活データセットにLuceを適用することで,Luceのメリットを実証する。
論文 参考訳(メタデータ) (2020-08-12T07:32:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。