Fugu-MT 論文翻訳(概要): Explanations of Deep Language Models Explain Language Representations in the Brain

論文の概要: Explanations of Deep Language Models Explain Language Representations in the Brain

arxiv url: http://arxiv.org/abs/2502.14671v1
Date: Thu, 20 Feb 2025 16:05:45 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-21 22:18:11.728037
Title: Explanations of Deep Language Models Explain Language Representations in the Brain
Title（参考訳）: 脳内言語表現を記述した深部言語モデルの解説
Authors: Maryam Rahimi, Yadollah Yaghoobzadeh, Mohammad Reza Daliri,
Abstract要約: 大規模言語モデル(LLM)は人間のような性能を実現し、脳の言語処理機構と計算原理を共有する。近年の進歩は、人間のような性能を達成するだけでなく、脳の言語処理機構と計算原理を共有する大きな言語モデル(LLM)を生み出している。
参考スコア（独自算出の注目度）: 5.7916055414970895
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Recent advances in artificial intelligence have given rise to large language models (LLMs) that not only achieve human-like performance but also share computational principles with the brain's language processing mechanisms. While previous research has primarily focused on aligning LLMs' internal representations with neural activity, we introduce a novel approach that leverages explainable AI (XAI) methods to forge deeper connections between the two domains. Using attribution methods, we quantified how preceding words contribute to an LLM's next-word predictions and employed these explanations to predict fMRI recordings from participants listening to the same narratives. Our findings demonstrate that attribution methods robustly predict brain activity across the language network, surpassing traditional internal representations in early language areas. This alignment is hierarchical: early-layer explanations correspond to the initial stages of language processing in the brain, while later layers align with more advanced stages. Moreover, the layers more influential on LLM next-word prediction$\unicode{x2014}$those with higher attribution scores$\unicode{x2014}$exhibited stronger alignment with neural activity. This work establishes a bidirectional bridge between AI and neuroscience. First, we demonstrate that attribution methods offer a powerful lens for investigating the neural mechanisms of language comprehension, revealing how meaning emerges from preceding context. Second, we propose using brain alignment as a metric to evaluate the validity of attribution methods, providing a framework for assessing their biological plausibility.
Abstract（参考訳）: 近年の人工知能の進歩は、人間のような性能を達成するだけでなく、脳の言語処理機構と計算原理を共有する大きな言語モデル(LLM)を生み出している。これまでの研究は主に、LLMの内部表現と神経活動の整合性に重点を置いてきたが、我々は、説明可能なAI(XAI)手法を利用して2つのドメイン間のより深い接続を鍛える新しいアプローチを導入する。帰属法を用いて,先行する単語がLLMの次単語予測にどのように寄与するかを定量化し,これらの説明を用いて,同じ物語を聴いた参加者のfMRI記録を予測する。本研究は, 言語ネットワークにおける脳活動の予測手法が, 早期言語領域における従来の内的表現を上回り, 頑健に予測できることを示唆するものである。このアライメントは階層的であり、初期層の説明は脳の言語処理の初期段階に対応し、後期層はより高度な段階と一致している。さらに、LLMの次の単語予測に影響を及ぼすレイヤは、より高い属性スコアを持つ$\unicode{x2014}$those$\unicode{x2014}$exhibited strong alignment with neural activityである。この研究は、AIと神経科学の双方向ブリッジを確立する。まず、帰属法は、言語理解の神経機構を研究するための強力なレンズを提供し、先行する文脈から意味がどのように現れるかを明らかにする。第2に,脳のアライメントを指標としてアトリビューション手法の有効性を評価し,その生物学的妥当性を評価するための枠組みを提案する。

関連論文リスト

Far from the Shallow: Brain-Predictive Reasoning Embedding through Residual Disentanglement [43.96899536703126]
現代の大規模言語モデル(LLM)は、言語に対する神経反応をモデル化するためにますます使われている。彼らの内部表現は極めて「絡み合っている」ものであり、語彙、構文、意味、推論に関する情報を混ぜている。この絡み合いは、言語学的に浅い特徴に対する従来の脳のコード解析に偏っている。
論文参考訳（メタデータ） (2025-10-26T22:46:26Z)
Fine-grained Analysis of Brain-LLM Alignment through Input Attribution [10.06817336976995]
我々は,脳-LLMアライメントにおいて最も重要な単語を識別する,詳細な入力属性法を提案する。以上の結果から,BAとNWPは単語サブセットに大きく依存していることが判明した。
論文参考訳（メタデータ） (2025-10-14T10:19:01Z)
Do Large Language Models Think Like the Brain? Sentence-Level Evidence from fMRI and Hierarchical Embeddings [28.210559128941593]
本研究では,大規模言語モデルにおける階層的表現が,人文理解時の動的神経応答とどのように一致しているかを検討する。その結果、モデル性能の改善は、表現アーキテクチャを脳に似た階層へと進化させることを示した。
論文参考訳（メタデータ） (2025-05-28T16:40:06Z)
Generative causal testing to bridge data-driven models and scientific theories in language neuroscience [82.995061475971]
脳における言語選択性の簡潔な説明を生成するためのフレームワークである生成因果テスト(GCT)を提案する。 GCTは機能的選択性に類似した脳領域の細粒度の違いを識別できることを示す。
論文参考訳（メタデータ） (2024-10-01T15:57:48Z)
Brain-Like Language Processing via a Shallow Untrained Multihead Attention Network [16.317199232071232]
大規模言語モデル(LLM)は、人間の言語システムの効果的なモデルであることが示されている。本研究では、未学習モデルの驚くほどのアライメントを駆動する重要なアーキテクチャコンポーネントについて検討する。
論文参考訳（メタデータ） (2024-06-21T12:54:03Z)
What Are Large Language Models Mapping to in the Brain? A Case Against Over-Reliance on Brain Scores [1.8175282137722093]
大規模言語モデル(LLM)の内部表現は最先端の脳スコアを達成し、人間の言語処理と計算原理を共有するという憶測に繋がる。本稿では、LLM-to-Brainマッピングに関する衝撃的な研究で使用される3つのニューラルデータセットを分析し、参加者が短いパスを読み取るfMRIデータセットに特に焦点をあてる。このデータセット上で訓練されたLLMの脳のスコアは、文の長さ、位置、代名詞による単語の埋め込みによって大きく説明できる。
論文参考訳（メタデータ） (2024-06-03T17:13:27Z)
Language Reconstruction with Brain Predictive Coding from fMRI Data [28.217967547268216]
予測符号化の理論は、人間の脳が将来的な単語表現を継続的に予測していることを示唆している。 textscPredFTは、BLEU-1スコアが最大27.8%$の最先端のデコード性能を実現する。
論文参考訳（メタデータ） (2024-05-19T16:06:02Z)
Language Generation from Brain Recordings [68.97414452707103]
本稿では,大言語モデルと意味脳デコーダの容量を利用した生成言語BCIを提案する。提案モデルでは,視覚的・聴覚的言語刺激のセマンティック内容に整合したコヒーレントな言語系列を生成することができる。本研究は,直接言語生成におけるBCIの活用の可能性と可能性を示すものである。
論文参考訳（メタデータ） (2023-11-16T13:37:21Z)
Divergences between Language Models and Human Brains [59.100552839650774]
我々は,人間と機械語処理の相違点を体系的に探求する。我々は、LMがうまく捉えられない2つの領域、社会的/感情的知性と身体的常識を識別する。以上の結果から,これらの領域における微調整LMは,ヒト脳反応との整合性を向上させることが示唆された。
論文参考訳（メタデータ） (2023-11-15T19:02:40Z)
Deep Learning Models to Study Sentence Comprehension in the Human Brain [0.1503974529275767]
自然言語を処理する最近の人工ニューラルネットワークは、文レベルの理解を必要とするタスクにおいて、前例のないパフォーマンスを達成する。我々は、これらの人工言語モデルと人間の脳活動を比較する研究をレビューし、このアプローチが自然言語理解に関わる神経プロセスの理解をいかに改善したかを評価する。
論文参考訳（メタデータ） (2023-01-16T10:31:25Z)
Neural Language Models are not Born Equal to Fit Brain Data, but Training Helps [75.84770193489639]
音声ブックを聴く被験者の機能的磁気共鳴イメージングの時間軸予測に及ぼすテスト損失,トレーニングコーパス,モデルアーキテクチャの影響について検討した。各モデルの訓練されていないバージョンは、同じ単語をまたいだ脳反応の類似性を捉えることで、脳内のかなりの量のシグナルをすでに説明していることがわかりました。ニューラル言語モデルを用いたヒューマン・ランゲージ・システムの説明を目的とした今後の研究の実践を提案する。
論文参考訳（メタデータ） (2022-07-07T15:37:17Z)
Toward a realistic model of speech processing in the brain with self-supervised learning [67.7130239674153]
生波形で訓練された自己教師型アルゴリズムは有望な候補である。 We show that Wav2Vec 2.0 learns brain-like representations with little as 600 hours of unlabelled speech。
論文参考訳（メタデータ） (2022-06-03T17:01:46Z)
Long-range and hierarchical language predictions in brains and algorithms [82.81964713263483]
深層言語アルゴリズムは隣接した単語の予測に最適化されているが、人間の脳は長距離で階層的な予測を行うように調整されている。本研究は、予測符号化理論を強化し、自然言語処理における長距離および階層的予測の重要な役割を示唆する。
論文参考訳（メタデータ） (2021-11-28T20:26:07Z)
Model-based analysis of brain activity reveals the hierarchy of language in 305 subjects [82.81964713263483]
言語の神経基盤を分解する一般的なアプローチは、個人間で異なる刺激に対する脳の反応を関連付けている。そこで本研究では,自然刺激に曝露された被験者に対して,モデルに基づくアプローチが等価な結果が得られることを示す。
論文参考訳（メタデータ） (2021-10-12T15:30:21Z)
Low-Dimensional Structure in the Space of Language Representations is Reflected in Brain Responses [62.197912623223964]
言語モデルと翻訳モデルは,単語の埋め込み,構文的・意味的タスク,将来的な単語埋め込みとの間を円滑に介在する低次元構造を示す。この表現埋め込みは、各特徴空間が、fMRIを用いて記録された自然言語刺激に対する人間の脳反応にどれだけうまく対応しているかを予測することができる。これは、埋め込みが脳の自然言語表現構造の一部を捉えていることを示唆している。
論文参考訳（メタデータ） (2021-06-09T22:59:12Z)
Does injecting linguistic structure into language models lead to better alignment with brain recordings? [13.880819301385854]
言語モデルと脳記録との整合性は,構文的あるいは意味論的フォーマリズムからのアノテーションに偏りがある場合と評価する。提案手法は,脳内の意味の組成について,より標的となる仮説の評価を可能にする。
論文参考訳（メタデータ） (2021-01-29T14:42:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。