論文の概要: Urban-R1: Reinforced MLLMs Mitigate Geospatial Biases for Urban General Intelligence
- arxiv url: http://arxiv.org/abs/2510.16555v1
- Date: Sat, 18 Oct 2025 15:59:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.036041
- Title: Urban-R1: Reinforced MLLMs Mitigate Geospatial Biases for Urban General Intelligence
- Title(参考訳): Urban-R1:強化MLLMは都市総合知能のための地理空間的バイアスを緩和する
- Authors: Qiongyan Wang, Xingchen Zou, Yutian Jiang, Haomin Wen, Jiaheng Wei, Qingsong Wen, Yuxuan Liang,
- Abstract要約: アーバン・ジェネラル・インテリジェンス(UGI)とは、複雑な都市環境を理解し、推論できるAIシステムである。
近年, LLM と MLLM の教師付き微調整 (SFT) を用いた都市基盤モデルの構築が進められている。
MLLMをUGIの目的と整合させる強化学習に基づくポストトレーニングフレームワークであるUrban-R1を提案する。
- 参考スコア(独自算出の注目度): 64.36291202666212
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Rapid urbanization intensifies the demand for Urban General Intelligence (UGI), referring to AI systems that can understand and reason about complex urban environments. Recent studies have built urban foundation models using supervised fine-tuning (SFT) of LLMs and MLLMs, yet these models exhibit persistent geospatial bias, producing regionally skewed predictions and limited generalization. To this end, we propose Urban-R1, a reinforcement learning-based post-training framework that aligns MLLMs with the objectives of UGI. Urban-R1 adopts Group Relative Policy Optimization (GRPO) to optimize reasoning across geographic groups and employs urban region profiling as a proxy task to provide measurable rewards from multimodal urban data. Extensive experiments across diverse regions and tasks show that Urban-R1 effectively mitigates geo-bias and improves cross-region generalization, outperforming both SFT-trained and closed-source models. Our results highlight reinforcement learning alignment as a promising pathway toward equitable and trustworthy urban intelligence.
- Abstract(参考訳): 都市化の迅速化は、複雑な都市環境を理解し、推論できるAIシステムを指すUGI(Urban General Intelligence)の需要を増大させる。
近年, LLM と MLLM の教師付き微調整 (SFT) を用いた都市基盤モデルの構築が進んでいるが, これらのモデルでは地空間バイアスが持続的であり, 局所的に歪んだ予測と限定的な一般化が実現している。
そこで我々は,MLLMとUGIの目的を一致させる強化学習に基づくポストトレーニングフレームワークであるUrban-R1を提案する。
Urban-R1は、グループ相対政策最適化(GRPO)を採用し、地理的グループ間の推論を最適化し、マルチモーダルな都市データから測定可能な報酬を提供するためのプロキシタスクとして都市地域プロファイリングを採用している。
多様な地域やタスクにわたる大規模な実験により、Urban-R1は地理的バイアスを効果的に軽減し、地域間一般化を改善し、SFT訓練とクローズドソースモデルの両方を上回る結果となった。
本研究は, 公平で信頼性の高い都市インテリジェンスへの道筋として, 強化学習のアライメントを強調した。
関連論文リスト
- MM-HELIX: Boosting Multimodal Long-Chain Reflective Reasoning with Holistic Platform and Adaptive Hybrid Policy Optimization [103.74675519953898]
ロングチェーンのリフレクティブ推論は、複雑な現実世界の問題を解決するための前提条件である。
我々は42の難解な合成タスクの1,260のサンプルからなるベンチマークを構築した。
トレーニング後のデータを生成し、そのようなデータを活用するための学習パラダイムを探索する。
論文 参考訳(メタデータ) (2025-10-09T17:53:58Z) - UrbanMind: Urban Dynamics Prediction with Multifaceted Spatial-Temporal Large Language Models [18.051209616917042]
UrbanMind は多面的都市動態予測のための空間時空間 LLM フレームワークである。
UrbanMindのコアとなるMuffin-MAEは、特殊なマスキング戦略を備えた多面式フュージョンマスク自動エンコーダである。
複数の都市にまたがる実世界の都市データセットの実験は、UrbanMindが一貫して最先端のベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2025-05-16T19:38:06Z) - Collaborative Imputation of Urban Time Series through Cross-city Meta-learning [54.438991949772145]
メタ学習型暗黙的ニューラル表現(INR)を利用した新しい協調的計算パラダイムを提案する。
次に,モデルに依存しないメタ学習による都市間協調学習手法を提案する。
20のグローバル都市から得られた多様な都市データセットの実験は、我々のモデルの優れた計算性能と一般化可能性を示している。
論文 参考訳(メタデータ) (2025-01-20T07:12:40Z) - CityGPT: Empowering Urban Spatial Cognition of Large Language Models [7.40606412920065]
大規模言語モデルは、都市環境内の実際の地理空間的タスクに取り組むと、しばしば不足する。
都市空間に対するLLMの理解を高め、関連する都市課題を解決する能力を向上させるためのフレームワークである textitCityGPT を提案する。
提案手法の有効性を検証するため,LLMの性能評価のためのテキストベースの空間ベンチマークtextitCityEvalを開発した。
論文 参考訳(メタデータ) (2024-06-20T02:32:16Z) - Cross-City Matters: A Multimodal Remote Sensing Benchmark Dataset for
Cross-City Semantic Segmentation using High-Resolution Domain Adaptation
Networks [82.82866901799565]
我々は,都市間セマンティックセマンティックセグメンテーションタスクの研究を目的とした,新しいマルチモーダルリモートセンシングベンチマークデータセット(ハイパースペクトル,マルチスペクトル,SARを含む)を構築した。
単一都市に留まらず,多都市環境からAIモデルの一般化能力を促進するため,高解像度なドメイン適応ネットワークであるHighDANを提案する。
高DANは, 並列高分解能融合方式で, 都市景観の空間的トポロジカルな構造を良好に維持することができる。
論文 参考訳(メタデータ) (2023-09-26T23:55:39Z) - A Contextual Master-Slave Framework on Urban Region Graph for Urban
Village Detection [68.84486900183853]
都市域を階層的にモデル化する都市域グラフ(URG)を構築した。
そこで我々は,都市部をURGから効果的に検出する新しいコンテキスト・マスタ・スレーブ・フレームワークを設計した。
提案手法は,都市部における紫外線検出の一般性と特異性のバランスをとることができる。
論文 参考訳(メタデータ) (2022-11-26T18:17:39Z) - MetroGAN: Simulating Urban Morphology with Generative Adversarial
Network [10.504296192020497]
本稿では,都市形態学シミュレーションのための地理知識,すなわちメトロポリタンGAN(MetroGAN)の枠組みを提案する。
その結果,MetroGANはすべての指標において,最先端の都市シミュレーション手法よりも20%以上優れていた。
論文 参考訳(メタデータ) (2022-07-06T11:02:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。