論文の概要: UrbanMind: Towards Urban General Intelligence via Tool-Enhanced Retrieval-Augmented Generation and Multilevel Optimization
- arxiv url: http://arxiv.org/abs/2507.04706v1
- Date: Mon, 07 Jul 2025 06:57:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.303352
- Title: UrbanMind: Towards Urban General Intelligence via Tool-Enhanced Retrieval-Augmented Generation and Multilevel Optimization
- Title(参考訳): UrbanMind: ツール強化検索による都市総合インテリジェンスとマルチレベル最適化
- Authors: Kai Yang, Zelin Zhu, Chengtao Jian, Hui Ma, Shengjie Zhao, Xiaozhou Ye, Ye Ouyang,
- Abstract要約: アーバン・ジェネラル・インテリジェンス(UGI)とは、ダイナミックで複雑な都市環境の中で自律的に知覚、理性、行動を行うAIシステムの能力を指す。
本稿では,UrbanMindについて紹介する。UrbanMindは,UGIを促進するためのツール強化検索拡張生成(RAG)フレームワークである。
- 参考スコア(独自算出の注目度): 7.478830207921698
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Urban general intelligence (UGI) refers to the capacity of AI systems to autonomously perceive, reason, and act within dynamic and complex urban environments. In this paper, we introduce UrbanMind, a tool-enhanced retrieval-augmented generation (RAG) framework designed to facilitate UGI. Central to UrbanMind is a novel architecture based on Continual Retrieval-Augmented MoE-based LLM (C-RAG-LLM), which dynamically incorporates domain-specific knowledge and evolving urban data to support long-term adaptability. The architecture of C-RAG-LLM aligns naturally with a multilevel optimization framework, where different layers are treated as interdependent sub-problems. Each layer has distinct objectives and can be optimized either independently or jointly through a hierarchical learning process. The framework is highly flexible, supporting both end-to-end training and partial layer-wise optimization based on resource or deployment constraints. To remain adaptive under data drift, it is further integrated with an incremental corpus updating mechanism. Evaluations on real-world urban tasks of a variety of complexity verify the effectiveness of the proposed framework. This work presents a promising step toward the realization of general-purpose LLM agents in future urban environments.
- Abstract(参考訳): アーバン・ジェネラル・インテリジェンス(UGI)とは、ダイナミックで複雑な都市環境の中で自律的に知覚、理性、行動を行うAIシステムの能力を指す。
本稿では,UrbanMindについて紹介する。UrbanMindは,UGIを促進するためのツール強化検索拡張生成(RAG)フレームワークである。
Central to UrbanMindは、長期適応性をサポートするために、ドメイン固有の知識と都市データの進化を動的に取り入れた連続検索型MoEベースのLLM(C-RAG-LLM)に基づく、新しいアーキテクチャである。
C-RAG-LLMのアーキテクチャは、異なるレイヤを相互依存サブプロブレムとして扱うマルチレベル最適化フレームワークと自然に一致している。
各層は異なる目的を持ち、独立的にも共同的にも階層的な学習プロセスを通じて最適化することができる。
フレームワークは非常に柔軟で、リソースやデプロイメントの制約に基づいたエンドツーエンドのトレーニングと部分的なレイヤワイズ最適化の両方をサポートする。
データドリフト下での適応性を維持するため、インクリメンタルコーパス更新機構とさらに統合される。
複雑度の異なる実世界の都市課題の評価は,提案手法の有効性を検証した。
本研究は,将来の都市環境における汎用LLMエージェントの実現に向けた有望な一歩である。
関連論文リスト
- UrbanMind: Urban Dynamics Prediction with Multifaceted Spatial-Temporal Large Language Models [18.051209616917042]
UrbanMind は多面的都市動態予測のための空間時空間 LLM フレームワークである。
UrbanMindのコアとなるMuffin-MAEは、特殊なマスキング戦略を備えた多面式フュージョンマスク自動エンコーダである。
複数の都市にまたがる実世界の都市データセットの実験は、UrbanMindが一貫して最先端のベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2025-05-16T19:38:06Z) - MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering [57.156093929365255]
自律型大規模言語モデル(LLM)エージェントを体系的に強化し、評価し、改善するためのガイムスタイルのフレームワーク。
MLE-Dojoは、現実的なエンジニアリングシナリオを反映した、多様でオープンなMLEタスクを慎重にキュレートする。
完全に実行可能な環境は、教師付き微調整と強化学習の両方を通して包括的なエージェントトレーニングをサポートする。
論文 参考訳(メタデータ) (2025-05-12T17:35:43Z) - Real-time Spatial Retrieval Augmented Generation for Urban Environments [2.8367942280334493]
本研究は,都市への生成AIの効果的な統合に必要なコンポーネントを定義するリアルタイム空間RAGアーキテクチャを提案する。
提案アーキテクチャは、スマートシティソリューションとデジタルツインを開発するソフトウェアコンポーネントのエコシステムであるFIWAREを用いて実装されている。
論文 参考訳(メタデータ) (2025-05-04T21:57:58Z) - Collaborative Imputation of Urban Time Series through Cross-city Meta-learning [54.438991949772145]
メタ学習型暗黙的ニューラル表現(INR)を利用した新しい協調的計算パラダイムを提案する。
次に,モデルに依存しないメタ学習による都市間協調学習手法を提案する。
20のグローバル都市から得られた多様な都市データセットの実験は、我々のモデルの優れた計算性能と一般化可能性を示している。
論文 参考訳(メタデータ) (2025-01-20T07:12:40Z) - CityGPT: Empowering Urban Spatial Cognition of Large Language Models [7.40606412920065]
大規模言語モデルは、都市環境内の実際の地理空間的タスクに取り組むと、しばしば不足する。
都市空間に対するLLMの理解を高め、関連する都市課題を解決する能力を向上させるためのフレームワークである textitCityGPT を提案する。
提案手法の有効性を検証するため,LLMの性能評価のためのテキストベースの空間ベンチマークtextitCityEvalを開発した。
論文 参考訳(メタデータ) (2024-06-20T02:32:16Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - Cross-City Matters: A Multimodal Remote Sensing Benchmark Dataset for
Cross-City Semantic Segmentation using High-Resolution Domain Adaptation
Networks [82.82866901799565]
我々は,都市間セマンティックセマンティックセグメンテーションタスクの研究を目的とした,新しいマルチモーダルリモートセンシングベンチマークデータセット(ハイパースペクトル,マルチスペクトル,SARを含む)を構築した。
単一都市に留まらず,多都市環境からAIモデルの一般化能力を促進するため,高解像度なドメイン適応ネットワークであるHighDANを提案する。
高DANは, 並列高分解能融合方式で, 都市景観の空間的トポロジカルな構造を良好に維持することができる。
論文 参考訳(メタデータ) (2023-09-26T23:55:39Z) - Dynamically Grown Generative Adversarial Networks [111.43128389995341]
本稿では、ネットワークアーキテクチャとそのパラメータを自動化とともに最適化し、トレーニング中にGANを動的に成長させる手法を提案する。
本手法はアーキテクチャ探索手法を勾配に基づく訓練とインターリーブステップとして組み込んで,ジェネレータと識別器の最適アーキテクチャ成長戦略を定期的に探究する。
論文 参考訳(メタデータ) (2021-06-16T01:25:51Z) - Optimization-Inspired Learning with Architecture Augmentations and
Control Mechanisms for Low-Level Vision [74.9260745577362]
本稿では,GDC(Generative, Discriminative, and Corrective)の原則を集約する,最適化に着想を得た統合学習フレームワークを提案する。
フレキシブルな組み合わせで最適化モデルを効果的に解くために,3つのプロパゲーティブモジュールを構築した。
低レベル視覚タスクにおける実験は、GDCの有効性と適応性を検証する。
論文 参考訳(メタデータ) (2020-12-10T03:24:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。