論文の概要: Cross-lingual robustness of LLM-brain alignment and its computational roots
- arxiv url: http://arxiv.org/abs/2605.21049v1
- Date: Wed, 20 May 2026 11:34:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.643567
- Title: Cross-lingual robustness of LLM-brain alignment and its computational roots
- Title(参考訳): LLM脳アライメントの言語間ロバスト性とその計算根
- Authors: Ni Yang, Rui He, Philipp Homan, Iris Sommer, Davide Staub, Wolfram Hinzen,
- Abstract要約: 大規模言語モデル(LLM)は、言語理解とトランスフォーマー深度の間の神経活動を確実に予測する。
脳-LLMアライメントを3言語に分けて検討するために,多言語,全脳符号化フレームワークを用いた。
- 参考スコア(独自算出の注目度): 7.342679013491229
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) reliably predict neural activity during language comprehension and transformer depth has been interpreted as mirroring hierarchical cortical organization. However, it remains unclear whether such alignment extends to subcortical regions, overlaps spatially across languages, and what the computational roots of such alignment are. Here, we used a multilingual, whole-brain encoding framework to examine brain-LLM alignment across three typologically distinct languages: Mandarin, English, and French during naturalistic story listening. Our results show that across languages, transformer-based models predicted activity in a distributed landscape spanning widely distributed cortical functional networks like limbic, ventral attention, default mode network, and subcortical structures. Spatial alignment patterns showed substantial cross-linguistic overlap and remained largely stable across model layers, with limited layer progression consistent with functional cortical hierarchies. Contrary to previous evidence, contextual embeddings did not outperform static embeddings. To test candidate computational explanations, we examined whether layer-wise brain scores reflect surprisal and intrinsic dimensionality, and thereby predictive processing and information compression. Neither of these two computational metrics mirrored neural alignment profiles. Our findings suggest that brain-LLM alignment is spatially robust and cross-linguistically stable but not explainable from predictive uncertainty or representational geometry. Rather than directly reflecting shared hierarchical computation, neural predictivity may primarily arise from distributed lexical-semantic correspondences that generalize across languages.
- Abstract(参考訳): 大言語モデル(LLM)は、言語理解とトランスフォーマー深度の間の神経活動を確実に予測する。
しかし、そのようなアライメントが皮質下領域に広がり、言語間で空間的に重なり合うのか、そしてそのようなアライメントの計算根は何であるかは定かではない。
そこで我々は,多言語,全脳符号化の枠組みを用いて,自然主義的物語聴取時の脳-LLMアライメントを3つの類型的に異なる言語(マンダリン,英語,フランス語)で検証した。
以上の結果から,変圧器を用いたモデルでは,四肢,腹側注意,デフォルトモードネットワーク,皮質下構造など,広く分散した皮質機能ネットワークにまたがる分散景観における活動が予測された。
空間アライメントパターンは, 言語間の重なり合いが大きく, 機能的皮質階層とほぼ一致し, モデル層全体にわたってほぼ安定であった。
以前の証拠とは対照的に、文脈埋め込みは静的埋め込みよりも優れていなかった。
そこで本研究では,階層的脳のスコアが主観的・内在的な次元を反映しているかどうかを検証し,予測処理と情報圧縮について検討した。
これら2つの計算指標のどちらも、ニューラルアライメントプロファイルを反映していない。
脳-LLMアライメントは空間的に堅牢で言語間安定であるが,予測の不確実性や表現幾何学から説明できないことが示唆された。
共有階層計算を直接反映するのではなく、ニューラルネットワークの予測は、主に言語全体にわたって一般化される分散語彙-意味対応から生じる可能性がある。
関連論文リスト
- From Human Cognition to Neural Activations: Probing the Computational Primitives of Spatial Reasoning in LLMs [2.3268065525165316]
空間知能は 基礎モデルにとって ますます重要な能力となります
空間推論ベンチマークにおける基礎モデルの性能が内部空間表現の構造化や言語モデルへの依存を反映しているかは、まだ不明である。
論文 参考訳(メタデータ) (2026-03-27T11:42:36Z) - Mechanistic Understanding and Mitigation of Language Confusion in English-Centric Large Language Models [56.61984030508691]
言語混乱に関する最初の機械論的解釈可能性研究について述べる。
混乱点(CP)がこの現象の中心であることを示す。
比較分析によって同定された少数の臨界ニューロンを多言語で調整したニューロンで編集すると、混乱が著しく軽減されることがわかった。
論文 参考訳(メタデータ) (2025-05-22T11:29:17Z) - Explanations of Large Language Models Explain Language Representations in the Brain [5.7916055414970895]
本稿では、言語処理と脳神経活動の関連性を高めるために、説明可能なAI(XAI)を用いた新しいアプローチを提案する。
帰属法を適用することで,先行する単語が予測に与える影響を定量化する。
より強い属性は、生物学的説明法を評価するために脳のアライメントを示唆している。
論文 参考訳(メタデータ) (2025-02-20T16:05:45Z) - Training Neural Networks as Recognizers of Formal Languages [87.06906286950438]
ニューラルネットワークを文字列のバイナリ分類器として直接訓練し評価する。
3つのニューラルアーキテクチャに対して、チョムスキー階層の様々な言語について結果を提供する。
我々の貢献は、将来の研究において、言語認識の主張を理論的に健全に検証するのに役立つだろう。
論文 参考訳(メタデータ) (2024-11-11T16:33:25Z) - Meta predictive learning model of languages in neural circuits [2.5690340428649328]
本稿では,予測符号化フレームワークにおける平均場学習モデルを提案する。
我々のモデルでは、ほとんどの接続は学習後に決定論的になる。
本モデルは,脳計算,次点予測,一般知能の関連性を調べるための出発点となる。
論文 参考訳(メタデータ) (2023-09-08T03:58:05Z) - Low-Dimensional Structure in the Space of Language Representations is
Reflected in Brain Responses [62.197912623223964]
言語モデルと翻訳モデルは,単語の埋め込み,構文的・意味的タスク,将来的な単語埋め込みとの間を円滑に介在する低次元構造を示す。
この表現埋め込みは、各特徴空間が、fMRIを用いて記録された自然言語刺激に対する人間の脳反応にどれだけうまく対応しているかを予測することができる。
これは、埋め込みが脳の自然言語表現構造の一部を捉えていることを示唆している。
論文 参考訳(メタデータ) (2021-06-09T22:59:12Z) - Mechanisms for Handling Nested Dependencies in Neural-Network Language
Models and Humans [75.15855405318855]
我々は,「深層学習」手法で訓練された現代人工ニューラルネットワークが,人間の文処理の中心的な側面を模倣するかどうかを検討した。
ネットワークは、大きなコーパスで次の単語を予測するためにのみ訓練されたが、分析の結果、局所的および長距離の構文合意をうまく処理する特別なユニットが出現した。
我々は,複数の名詞の単数/複数状態における体系的な変化を伴う文中の数一致の違反を人間が検出する行動実験において,モデルの予測を検証した。
論文 参考訳(メタデータ) (2020-06-19T12:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。