論文の概要: Beyond representational alignment with brain-guided language models for robust reasoning
- arxiv url: http://arxiv.org/abs/2606.11893v1
- Date: Wed, 10 Jun 2026 10:22:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.407795
- Title: Beyond representational alignment with brain-guided language models for robust reasoning
- Title(参考訳): 頑健な推論のための脳誘導言語モデルとの表現的アライメントを超えて
- Authors: Mingqing Xiao, Kai Du, Zhouchen Lin,
- Abstract要約: 大規模言語モデル(LLM)は推論関連領域の神経信号と一致していることを示す。
ニューラルネットワークの予測基準を用いて,LLMは推論関連領域における説明可能な分散のかなりの部分を説明する。
我々は、モデルと脳表現の結合構造によって誘導される方向に沿って、モデル表現を操る脳誘導フレームワークを提案する。
- 参考スコア(独自算出の注目度): 51.87370932573858
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The correspondence between large language models (LLMs) and the neural mechanisms underlying human higher-order cognition remains insufficiently characterized. Given that language and reasoning in the human brain appear dissociable, an open question is whether LLMs align with neural signals from reasoning-related regions and whether such signals can improve them. Here, focusing on deductive reasoning, we show that LLM internal representations are not only partially aligned with task-fMRI activity but can also be directly enhanced by these signals. Using a neural-predictivity metric, we find that LLMs explain a substantial fraction of the explainable variance in reasoning-related regions at the aggregate level, whereas predictivity within specific reasoning types is lower, indicating both alignment and divergence. Building on this, we propose a brain-guided framework: we steer model representations along directions induced by the joint structure of model and brain representations, applying intervention at inference and fine-tuning during training. We demonstrate that task-evoked brain signals can directly enhance LLM reasoning, yielding gains orthogonal to language-only supervision across 10 LLMs (1.5B-72B), with transfer across reasoning types and up to 13\% absolute accuracy gain. Our results advance LLM-brain correspondences from correlation to guidance, establishing a brain-signal-driven pathway toward more robust and cognitively aligned AI.
- Abstract(参考訳): 大規模言語モデル(LLM)と人間の高次認知の基盤となる神経機構の対応性は依然として不十分である。
人間の脳の言語と推論が解離するように見えることを考えると、LLMは推論関連領域の神経信号と整合し、そのような信号がそれらを改善できるかどうかが疑問である。
本稿では、帰納的推論に着目し、LLMの内部表現がタスク-fMRI活動と部分的に一致しているだけでなく、これらの信号によって直接拡張可能であることを示す。
ニューラルネットワークの予測基準を用いて, LLM はアグリゲーションレベルでの推論関連領域における説明可能な分散のかなりの部分を説明するのに対し, 特定の推論タイプの予測係数は低く, アライメントと発散の両方を示す。
モデルと脳表現の結合構造によって誘導される方向に沿って表現を操り、推論や訓練中の微調整に介入する。
タスク誘発脳信号はLLM推論を直接強化し,10個のLLM(1.5B-72B)にまたがって言語のみの制御に直交する利得が得られることを示した。
以上の結果から,より堅牢で認知に整合したAIへの脳信号駆動経路が確立された。
関連論文リスト
- Do Large Language Models Think Like the Brain? Sentence-Level Evidence from fMRI and Hierarchical Embeddings [28.210559128941593]
本研究では,大規模言語モデルにおける階層的表現が,人文理解時の動的神経応答とどのように一致しているかを検討する。
その結果、モデル性能の改善は、表現アーキテクチャを脳に似た階層へと進化させることを示した。
論文 参考訳(メタデータ) (2025-05-28T16:40:06Z) - Brain-like Functional Organization within Large Language Models [58.93629121400745]
人間の脳は長い間人工知能(AI)の追求にインスピレーションを与えてきた
最近のニューロイメージング研究は、人工ニューラルネットワーク(ANN)の計算的表現と、人間の脳の刺激に対する神経反応との整合性の説得力のある証拠を提供する。
本研究では、人工ニューロンのサブグループと機能的脳ネットワーク(FBN)を直接結合することで、このギャップを埋める。
このフレームワークはANサブグループをFBNにリンクし、大きな言語モデル(LLM)内で脳に似た機能的組織を記述できる。
論文 参考訳(メタデータ) (2024-10-25T13:15:17Z) - Generative causal testing to bridge data-driven models and scientific theories in language neuroscience [82.995061475971]
脳における言語選択性の簡潔な説明を生成するためのフレームワークである生成因果テスト(GCT)を提案する。
GCTは機能的選択性に類似した脳領域の細粒度の違いを識別できることを示す。
論文 参考訳(メタデータ) (2024-10-01T15:57:48Z) - Cognitive LLMs: Towards Integrating Cognitive Architectures and Large Language Models for Manufacturing Decision-making [51.737762570776006]
LLM-ACTRは、ヒトに適応し、多目的な意思決定を提供する新しいニューロシンボリックアーキテクチャである。
我々のフレームワークは、ACT-Rの内部決定過程の知識を潜在神経表現として抽出し、組み込む。
デザイン・フォー・マニュファクチャリング・タスクに関する我々の実験は、タスク性能の向上と基礎的意思決定能力の向上を両立させたものである。
論文 参考訳(メタデータ) (2024-08-17T11:49:53Z) - What Are Large Language Models Mapping to in the Brain? A Case Against Over-Reliance on Brain Scores [1.8175282137722093]
大規模言語モデル(LLM)の内部表現は最先端の脳スコアを達成し、人間の言語処理と計算原理を共有するという憶測に繋がる。
本稿では、LLM-to-Brainマッピングに関する衝撃的な研究で使用される3つのニューラルデータセットを分析し、参加者が短いパスを読み取るfMRIデータセットに特に焦点をあてる。
このデータセット上で訓練されたLLMの脳のスコアは、文の長さ、位置、代名詞による単語の埋め込みによって大きく説明できる。
論文 参考訳(メタデータ) (2024-06-03T17:13:27Z) - Do Large Language Models Mirror Cognitive Language Processing? [43.68923267228057]
大規模言語モデル(LLM)は、テキスト理解と論理的推論において顕著な能力を示した。
脳認知処理信号は、典型的には人間の言語処理を研究するために使用される。
論文 参考訳(メタデータ) (2024-02-28T03:38:20Z) - Towards LogiGLUE: A Brief Survey and A Benchmark for Analyzing Logical Reasoning Capabilities of Language Models [56.34029644009297]
大規模言語モデル(LLM)は、形式的知識表現(KR)システムの様々な制限を克服する能力を示した。
LLMは誘導的推論において最も優れているが、誘導的推論では最も効果が低い。
モデルの性能を評価するため,シングルタスクトレーニング,マルチタスクトレーニング,および「チェーンオブ思考」知識蒸留細調整技術について検討した。
論文 参考訳(メタデータ) (2023-10-02T01:00:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。