論文の概要: A Survey of Large Language Model-Powered Spatial Intelligence Across Scales: Advances in Embodied Agents, Smart Cities, and Earth Science
- arxiv url: http://arxiv.org/abs/2504.09848v1
- Date: Mon, 14 Apr 2025 03:38:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:55:15.665476
- Title: A Survey of Large Language Model-Powered Spatial Intelligence Across Scales: Advances in Embodied Agents, Smart Cities, and Earth Science
- Title(参考訳): 大規模言語モデルを用いた空間知能尺度に関する調査:身体エージェント,スマートシティ,地球科学の進歩
- Authors: Jie Feng, Jinwei Zeng, Qingyue Long, Hongyi Chen, Jie Zhao, Yanxin Xi, Zhilun Zhou, Yuan Yuan, Shengyuan Wang, Qingbin Zeng, Songwei Li, Yunke Zhang, Yuming Lin, Tong Li, Jingtao Ding, Chen Gao, Fengli Xu, Yong Li,
- Abstract要約: 大規模言語モデル(LLM)における人間の空間認識とその空間知能への影響について検討する。
次に, LLMにおける空間記憶, 知識表現, 抽象的推論について検討し, その役割と関係を明らかにする。
我々は空間記憶と理解から空間的推論と知性へと進化する枠組みに従って、空間的インテリジェンス(空間的インテリジェンス、空間的インテリジェンス、空間的インテリジェンス)を分析した。
- 参考スコア(独自算出の注目度): 27.66472429481388
- License:
- Abstract: Over the past year, the development of large language models (LLMs) has brought spatial intelligence into focus, with much attention on vision-based embodied intelligence. However, spatial intelligence spans a broader range of disciplines and scales, from navigation and urban planning to remote sensing and earth science. What are the differences and connections between spatial intelligence across these fields? In this paper, we first review human spatial cognition and its implications for spatial intelligence in LLMs. We then examine spatial memory, knowledge representations, and abstract reasoning in LLMs, highlighting their roles and connections. Finally, we analyze spatial intelligence across scales -- from embodied to urban and global levels -- following a framework that progresses from spatial memory and understanding to spatial reasoning and intelligence. Through this survey, we aim to provide insights into interdisciplinary spatial intelligence research and inspire future studies.
- Abstract(参考訳): 過去1年間、大きな言語モデル(LLM)の開発は、視覚ベースの具体的知性に多くの注意を払って、空間的知性に焦点を合わせてきた。
しかし、空間知能はナビゲーションや都市計画からリモートセンシング、地球科学まで幅広い分野や規模にまたがっている。
これらの分野における空間的インテリジェンスの違いと関連性はどのようなものか?
本稿では,LLMにおける人間の空間認識とその空間知能への影響について概説する。
次に, LLMにおける空間記憶, 知識表現, 抽象的推論について検討し, その役割と関係を明らかにする。
最後に、空間記憶と理解から空間的推論と知性へと進化する枠組みに従って、スケールから都市レベル、グローバルレベルに至るまでの空間的インテリジェンスを分析する。
本調査は,学際的空間知能研究の洞察を提供し,今後の研究を促すことを目的としている。
関連論文リスト
- Creation of AI-driven Smart Spaces for Enhanced Indoor Environments -- A Survey [2.4289467021689317]
スマートスペースはユビキタスコンピューティング環境であり、多様なセンシングと通信技術を統合し、空間機能を強化し、エネルギー利用を最適化し、ユーザーの快適さと幸福を向上させる。
これらの環境への新興AI方法論の統合は、AI駆動のスマートスペースの形成を促進する。
本稿では,センサ技術,データ通信プロトコル,センサネットワーク管理とメンテナンス戦略,データ収集,処理,分析などを含む,AI駆動型スマートスペースの基礎的コンポーネントに関する既存研究を体系的に調査する。
論文 参考訳(メタデータ) (2024-12-19T10:20:34Z) - Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces [34.809309396448654]
5000組以上の質問応答対からなるビデオベース視覚空間インテリジェンスベンチマーク(VSI-Bench)を提案する。
MLLM(Multimodal Large Language Models)は,非人間的な視覚空間知能を持つ。
論文 参考訳(メタデータ) (2024-12-18T18:59:54Z) - SpaRC and SpaRP: Spatial Reasoning Characterization and Path Generation for Understanding Spatial Reasoning Capability of Large Language Models [70.01883340129204]
空間推論は 生物学的と人工知能の両方において 重要な要素です
本稿では,現在最先端の大規模言語モデル (LLM) の空間的推論能力について包括的に検討する。
論文 参考訳(メタデータ) (2024-06-07T01:06:34Z) - Research on the Spatial Data Intelligent Foundation Model [70.47828328840912]
本報告では、これらのモデルの原理、手法、最先端の応用を探求する、空間データインテリジェントな大規模モデルに焦点を当てる。
これは、空間データインテリジェントな大規模モデルの定義、開発履歴、現状、およびトレンドに関する詳細な議論を提供する。
本報告では, 都市環境, 航空宇宙リモートセンシング, 地理, 交通, その他のシナリオにおける空間データ知能大規模モデルの重要技術とその応用を体系的に解明する。
論文 参考訳(メタデータ) (2024-05-30T06:21:34Z) - SpatialVLM: Endowing Vision-Language Models with Spatial Reasoning
Capabilities [59.39858959066982]
空間的関係についての理解と推論は、視覚質問応答(VQA)とロボット工学の基本的な能力である。
我々は,1000万枚の実画像に対して,最大20億個のVQAサンプルをスケール可能な3次元空間VQAデータ自動生成フレームワークを開発した。
このようなデータに基づいてVLMを訓練することにより、定性的空間的VQAと定量的空間的VQAの両方において、その能力を大幅に向上する。
論文 参考訳(メタデータ) (2024-01-22T18:01:01Z) - A systematic review of geospatial location embedding approaches in large
language models: A path to spatial AI systems [0.0]
地理空間的位置埋め込み(GLE)は、大規模言語モデル(LLM)が空間データを同化して解析するのに役立つ。
GLEは、空間的知識をモデルアーキテクチャに組み込む空間的基礎/言語モデル(SLM)の必要性を示唆している。
論文 参考訳(メタデータ) (2024-01-12T12:43:33Z) - Unveiling A Core Linguistic Region in Large Language Models [49.860260050718516]
本稿では,脳局在化をプロトタイプとして用いた類似研究を行う。
我々は、言語能力に対応する大規模言語モデルにおいて、中核領域を発見した。
我々は,言語能力の向上が必ずしもモデルの知識レベルの向上に伴わないことを観察する。
論文 参考訳(メタデータ) (2023-10-23T13:31:32Z) - Selected Trends in Artificial Intelligence for Space Applications [69.3474006357492]
この章は、差別化可能なインテリジェンスとオンボード機械学習に焦点を当てている。
欧州宇宙機関(ESA)Advanced Concepts Team(ACT)から選ばれたいくつかのプロジェクトについて論じる。
論文 参考訳(メタデータ) (2022-12-10T07:49:50Z) - Artificial Intelligence and Natural Language Processing and
Understanding in Space: Four ESA Case Studies [48.53582660901672]
本稿では,空間文書から情報を自動的に抽出するための,人工知能と自然言語処理と理解に基づく方法論的枠組みを提案する。
ケーススタディはミッションデザイン、品質保証、長期データ保存、オープンスペースイノベーションプラットフォームなど、ESAのさまざまな機能領域で実装されている。
論文 参考訳(メタデータ) (2022-10-07T15:50:17Z) - A World-Self Model Towards Understanding Intelligence [0.0]
我々は、人間と人工知能を比較し、人間の知性の特定の側面が認識と認知を結びつける鍵である、と提案する。
我々は、より広範な概念、新しいモデルのWSM(World-Self Model)の原理と数学的枠組み、そして最後にWSMに基づいた統合されたインテリジェンス・フレームワークを提示する。
論文 参考訳(メタデータ) (2022-03-25T16:42:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。