論文の概要: From Human Cognition to Neural Activations: Probing the Computational Primitives of Spatial Reasoning in LLMs
- arxiv url: http://arxiv.org/abs/2603.26323v1
- Date: Fri, 27 Mar 2026 11:42:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.474014
- Title: From Human Cognition to Neural Activations: Probing the Computational Primitives of Spatial Reasoning in LLMs
- Title(参考訳): 人間の認知から神経活動へ:LLMにおける空間推論の計算的プリミティブの探索
- Authors: Jiyuan An, Liner Yang, Mengyan Wang, Luming Lu, Weihua An, Erhong Yang,
- Abstract要約: 空間知能は 基礎モデルにとって ますます重要な能力となります
空間推論ベンチマークにおける基礎モデルの性能が内部空間表現の構造化や言語モデルへの依存を反映しているかは、まだ不明である。
- 参考スコア(独自算出の注目度): 2.3268065525165316
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As spatial intelligence becomes an increasingly important capability for foundation models, it remains unclear whether large language models' (LLMs) performance on spatial reasoning benchmarks reflects structured internal spatial representations or reliance on linguistic heuristics. We address this question from a mechanistic perspective by examining how spatial information is internally represented and used. Drawing on computational theories of human spatial cognition, we decompose spatial reasoning into three primitives, relational composition, representational transformation, and stateful spatial updating, and design controlled task families for each. We evaluate multilingual LLMs in English, Chinese, and Arabic under single pass inference, and analyze internal representations using linear probing, sparse autoencoder based feature analysis, and causal interventions. We find that task relevant spatial information is encoded in intermediate layers and can causally influence behavior, but these representations are transient, fragmented across task families, and weakly integrated into final predictions. Cross linguistic analysis further reveals mechanistic degeneracy, where similar behavioral performance arises from distinct internal pathways. Overall, our results suggest that current LLMs exhibit limited and context dependent spatial representations rather than robust, general purpose spatial reasoning, highlighting the need for mechanistic evaluation beyond benchmark accuracy.
- Abstract(参考訳): 空間知能は基礎モデルにとってますます重要な機能になりつつあるため、空間推論ベンチマークにおける大きな言語モデル(LLM)のパフォーマンスが内部空間表現の構造化や言語ヒューリスティックスへの依存を反映しているかどうかは不明である。
本研究では,空間情報が内部でどのように表現され,使用されるかを調べることで,力学的な観点からこの問題に対処する。
空間的認識の計算理論に基づいて,空間的推論を3つのプリミティブ,関係合成,表現的変換,ステートフルな空間的更新,それぞれに制御されたタスクファミリーを設計する。
我々は、英語、中国語、アラビア語の多言語LLMを単一パス推論で評価し、線形探索、スパースオートエンコーダに基づく特徴分析、因果介入を用いて内部表現を解析した。
タスク関連空間情報は中間層に符号化され,行動に因果的に影響を及ぼすが,これらの表現は一時的であり,タスクファミリ間で断片化され,最終的な予測に弱く統合されている。
クロス言語分析により、同様の行動性能が異なる内部経路から生じるメカニスティック・デジェネシーが明らかにされる。
以上の結果から,現在のLLMは,強靭で汎用的な空間推論よりも,限定的かつ文脈依存的な空間表現を示し,ベンチマーク精度を超える機械的評価の必要性が示唆された。
関連論文リスト
- SpatialText: A Pure-Text Cognitive Benchmark for Spatial Understanding in Large Language Models [12.26174714418171]
遺伝的空間推論は、コヒーレントな内部空間表現の構築と操作能力に依存している。
既存のベンチマークでは、この固有の空間認識を統計言語から分離することができない。
本研究では理論駆動型診断フレームワークであるSpatialTextを紹介する。
論文 参考訳(メタデータ) (2026-03-03T13:52:40Z) - Emergent Structured Representations Support Flexible In-Context Inference in Large Language Models [77.98801218316505]
大型言語モデル(LLM)は、人間のような推論を示唆する創発的な行動を示す。
テキスト内概念推論におけるLLMの内部処理について検討する。
論文 参考訳(メタデータ) (2026-02-08T03:14:39Z) - From Indoor to Open World: Revealing the Spatial Reasoning Gap in MLLMs [65.04549036809557]
我々は、ステレオカメラ、LiDAR、IMU/GPSセンサーで撮影された歩行者の視線映像から構築したベンチマークを紹介する。
このデータセットは、計量的に正確な3D情報を提供し、空間的推論質問の自動生成を可能にする。
評価の結果、構造化屋内ベンチマークで観測された性能向上は、オープンワールド環境では消滅することが明らかとなった。
論文 参考訳(メタデータ) (2025-12-22T18:58:12Z) - Mind the Gap: Benchmarking Spatial Reasoning in Vision-Language Models [14.442394137843923]
本稿では,まず空間的推論のコア要素を記述した詳細な分析を行う。
次に、これらのモデルの性能を、合成画像と実画像の両方で評価する。
論文 参考訳(メタデータ) (2025-03-25T14:34:06Z) - Beyond Semantics: Rediscovering Spatial Awareness in Vision-Language Models [13.768090541138571]
視覚言語モデル(VLM)はオブジェクトの識別と記述に優れるが、しばしば空間的推論では失敗する。
視覚トークンの埋め込みは、テキストトークンよりもはるかに大きな規範を持っている。
視覚トークンとシステムが注目を惹きつけることを明らかにするツール。
論文 参考訳(メタデータ) (2025-03-21T17:51:14Z) - SpaRC and SpaRP: Spatial Reasoning Characterization and Path Generation for Understanding Spatial Reasoning Capability of Large Language Models [70.01883340129204]
空間推論は 生物学的と人工知能の両方において 重要な要素です
本稿では,現在最先端の大規模言語モデル (LLM) の空間的推論能力について包括的に検討する。
論文 参考訳(メタデータ) (2024-06-07T01:06:34Z) - Reframing Spatial Reasoning Evaluation in Language Models: A Real-World Simulation Benchmark for Qualitative Reasoning [4.422649561583363]
言語モデル(LM)における空間推論評価のための新しいベンチマークを提案する。
現実的な3Dシミュレーションデータに基づいており、様々なオブジェクトとそれらの空間的関係を持つ一連の多様な部屋レイアウトを提供する。
重要なコントリビューションは、論理ベースの一貫性チェックツールです。
論文 参考訳(メタデータ) (2024-05-23T21:22:00Z) - More than Correlation: Do Large Language Models Learn Causal
Representations of Space? [6.293100288400849]
本研究では,大規模言語モデルにおける空間表現の因果関係を明らかにすることに焦点を当てた。
実験の結果,空間表現が次の単語予測におけるモデルの性能に影響を与え,地理空間情報に依存する下流課題が示された。
論文 参考訳(メタデータ) (2023-12-26T01:27:29Z) - Unveiling A Core Linguistic Region in Large Language Models [49.860260050718516]
本稿では,脳局在化をプロトタイプとして用いた類似研究を行う。
我々は、言語能力に対応する大規模言語モデルにおいて、中核領域を発見した。
我々は,言語能力の向上が必ずしもモデルの知識レベルの向上に伴わないことを観察する。
論文 参考訳(メタデータ) (2023-10-23T13:31:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。