論文の概要: Exploring Geographic Relative Space in Large Language Models through Activation Patching
- arxiv url: http://arxiv.org/abs/2605.14535v1
- Date: Thu, 14 May 2026 08:18:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.708193
- Title: Exploring Geographic Relative Space in Large Language Models through Activation Patching
- Title(参考訳): アクティベーション・パッチングによる大規模言語モデルにおける地理的相対空間の探索
- Authors: Stef De Sabbata, Rahul Baiju, Stefano Mizzaro, Kevin Roitero,
- Abstract要約: 地理におけるLarge Language Models(LLM)の利用の増加は、これらのツールを幅広いプロセスや分析で統合することの安全性について、かなりの疑問を提起する。
本稿では, アクティベーション・パッチング(アクティベーション・パッチング)を用いて, LLMが相対的な地理的空間をどのように処理するかを考察する。
- 参考スコア(独自算出の注目度): 5.127310126394387
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increased use of Large Language Models (LLMs) in geography raises substantial questions about the safety of integrating these tools across a wide range of processes and analyses, given our very limited understanding of their inner workings. In this extended abstract, we examine how LLMs process relative geographic space using activation patching, an emerging tool for mechanistic interpretability.
- Abstract(参考訳): 地理におけるLarge Language Models(LLM)の利用の増加は、これらのツールを広範囲のプロセスや分析にまたがって統合することの安全性に関する重大な疑問を引き起こします。
本稿では, アクティベーション・パッチング(アクティベーション・パッチング)を用いて, LLMが相対的な地理的空間をどのように処理するかを考察する。
関連論文リスト
- FineRS: Fine-grained Reasoning and Segmentation of Small Objects with Reinforcement Learning [62.11389260206383]
textscFineRSは、非常に小さなオブジェクトをセグメント化するための2段階のMLLMベースの強化学習フレームワークである。
textscFineRS-4kは,属性レベルの推論に基づくMLLMの評価と,微妙で小規模なターゲットに対する画素レベルのセグメンテーションのための新しいデータセットである。
論文 参考訳(メタデータ) (2025-10-24T10:14:17Z) - Geospatial Mechanistic Interpretability of Large Language Models [6.0272491755196045]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにまたがる前例のない機能を示している。
我々の目的は、これらの複雑なモデルが地理的情報を処理しながら生成する内部表現の理解を深めることである。
論文 参考訳(メタデータ) (2025-05-06T09:40:06Z) - From Text to Space: Mapping Abstract Spatial Models in LLMs during a Grid-World Navigation Task [0.0]
グリッドワールドナビゲーションタスクにおける大規模言語モデル(LLM)の性能と内部アクティベーションに及ぼすテキストベース空間表現の影響について検討する。
実験の結果, 空間のカルデシアン表現は, モデルサイズに比例して高い成功率と経路効率が得られることがわかった。
この研究は、LLMが空間情報をどのように処理するかの理解を深め、より解釈可能で堅牢なエージェントAIシステムの開発に有用な洞察を提供する。
論文 参考訳(メタデータ) (2025-02-23T19:09:01Z) - Improving In-Context Learning with Small Language Model Ensembles [2.3499129784547654]
In-context Learning (ICL) は安価で効率的な代替手段であるが、高度な手法の精度と一致しない。
本稿では,複数の微調整小言語モデル(SLM)の専門知識を活用することでICLを強化する新しいアプローチであるEnsemble SuperICLを提案する。
論文 参考訳(メタデータ) (2024-10-29T09:02:37Z) - Tool Learning with Large Language Models: A Survey [60.733557487886635]
大規模言語モデル(LLM)を用いたツール学習は,高度に複雑な問題に対処するLLMの能力を強化するための,有望なパラダイムとして登場した。
この分野での注目と急速な進歩にもかかわらず、現存する文献は断片化され、体系的な組織が欠如している。
論文 参考訳(メタデータ) (2024-05-28T08:01:26Z) - LLM Inference Unveiled: Survey and Roofline Model Insights [62.92811060490876]
大規模言語モデル(LLM)推論は急速に進化しており、機会と課題のユニークなブレンドを提示している。
本調査は, 研究状況を要約するだけでなく, 屋上モデルに基づく枠組みを導入することによって, 従来の文献レビューから際立っている。
このフレームワークは、ハードウェアデバイスにLSMをデプロイする際のボトルネックを特定し、実用上の問題を明確に理解する。
論文 参考訳(メタデータ) (2024-02-26T07:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。