Fugu-MT 論文翻訳(概要): Language models and brain alignment: beyond word-level semantics and prediction

論文の概要: Language models and brain alignment: beyond word-level semantics and prediction

arxiv url: http://arxiv.org/abs/2212.00596v1
Date: Thu, 1 Dec 2022 15:48:51 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-02 16:41:20.788815
Title: Language models and brain alignment: beyond word-level semantics and prediction
Title（参考訳）: 言語モデルと脳アライメント : 単語レベルの意味論と予測を超えて
Authors: Gabriele Merlin and Mariya Toneva
Abstract要約: 近年の研究では、次の単語の予測が両者のアライメントに寄与する重要なメカニズムであることを示唆している。私たちは、人気のある事前訓練された言語モデルにおける2つの単純な摂動を通して、より良い理解に向けて第一歩を踏み出します。
参考スコア（独自算出の注目度）: 5.678337324555035
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Pretrained language models that have been trained to predict the next word over billions of text documents have been shown to also significantly predict brain recordings of people comprehending language. Understanding the reasons behind the observed similarities between language in machines and language in the brain can lead to more insight into both systems. Recent works suggest that the prediction of the next word is a key mechanism that contributes to the alignment between the two. What is not yet understood is whether prediction of the next word is necessary for this observed alignment or simply sufficient, and whether there are other shared mechanisms or information that is similarly important. In this work, we take a first step towards a better understanding via two simple perturbations in a popular pretrained language model. The first perturbation is to improve the model's ability to predict the next word in the specific naturalistic stimulus text that the brain recordings correspond to. We show that this indeed improves the alignment with the brain recordings. However, this improved alignment may also be due to any improved word-level or multi-word level semantics for the specific world that is described by the stimulus narrative. We aim to disentangle the contribution of next word prediction and semantic knowledge via our second perturbation: scrambling the word order at inference time, which reduces the ability to predict the next word, but maintains any newly learned word-level semantics. By comparing the alignment with brain recordings of these differently perturbed models, we show that improvements in alignment with brain recordings are due to more than improvements in next word prediction and word-level semantics.
Abstract（参考訳）: 何十億ものテキスト文書の次の単語を予測するために訓練された事前学習された言語モデルは、言語を理解する人々の脳の記録を著しく予測する。機械の言語と脳の言語の間に観察された類似点の背後にある理由を理解することは、両方のシステムについてより深い洞察をもたらす可能性がある。近年の研究では、次の単語の予測が両者のアライメントに寄与する重要なメカニズムであることを示唆している。まだ理解されていないのは、この観測されたアライメントに次の単語の予測が必要なのか、あるいは単に十分なのか、また同様の重要な共有メカニズムや情報が存在するかどうかである。この研究では、人気のある事前学習言語モデルにおける2つの単純な摂動を通して、理解を深める第一歩を踏み出す。第一の摂動は、脳記録が対応する特定の自然刺激テキストにおける次の単語を予測するモデルの能力を改善することである。これは脳の録音とのアライメントが向上することを示している。しかし、この改善されたアライメントは、刺激物語によって記述される特定の世界に対する単語レベルまたは複数ワードレベルのセマンティクスの改善による可能性もある。我々は,次の単語の予測と意味知識の寄与を,次の単語の予測能力の低下を図りながら,新たに学習した単語レベルのセマンティクスを維持するために,推論時に単語の順序を乱すという2つ目の摂動を通じて,解き放つことを目的としている。これらの異なる摂動モデルの脳記録とのアライメントを比較することで、脳記録とのアライメントの改善は、次の単語予測と単語レベルのセマンティクスの改善によるものであることを示す。

関連論文リスト

Explanations of Large Language Models Explain Language Representations in the Brain [5.7916055414970895]
本稿では、言語処理と脳神経活動の関連性を高めるために、説明可能なAI(XAI)を用いた新しいアプローチを提案する。帰属法を適用することで,先行する単語が予測に与える影響を定量化する。より強い属性は、生物学的説明法を評価するために脳のアライメントを示唆している。
論文参考訳（メタデータ） (2025-02-20T16:05:45Z)
Improving semantic understanding in speech language models via brain-tuning [19.732593005537606]
言語モデルは、人間の脳の自然言語に対する反応と驚くほど一致している。現在のモデルは低レベルの音声機能に大きく依存しており、脳関連セマンティクスが欠如していることを示している。我々は、fMRI記録による微調整により、脳関連バイアスを直接モデルに誘導することで、この制限に対処する。
論文参考訳（メタデータ） (2024-10-11T20:06:21Z)
Causal Graph in Language Model Rediscovers Cortical Hierarchy in Human Narrative Processing [0.0]
これまでの研究では、言語モデルの特徴がfMRI脳活動にマッピングできることが示されている。これは、言語モデルにおける情報処理と人間の脳の間に共通点があるのだろうか? 言語モデルにおける情報フローパターンを推定するために,異なる層間の因果関係について検討した。
論文参考訳（メタデータ） (2023-11-17T10:09:12Z)
Humans and language models diverge when predicting repeating text [52.03471802608112]
我々は,人間とLMのパフォーマンスが分岐するシナリオを提示する。人間とGPT-2 LMの予測はテキストスパンの最初のプレゼンテーションで強く一致しているが、メモリが役割を担い始めると、その性能は急速にバラバラになる。このシナリオが,LMを人間の行動に近づける上で,今後の作業に拍車をかけることを期待しています。
論文参考訳（メタデータ） (2023-10-10T08:24:28Z)
Meta predictive learning model of languages in neural circuits [2.5690340428649328]
本稿では,予測符号化フレームワークにおける平均場学習モデルを提案する。我々のモデルでは、ほとんどの接続は学習後に決定論的になる。本モデルは,脳計算,次点予測,一般知能の関連性を調べるための出発点となる。
論文参考訳（メタデータ） (2023-09-08T03:58:05Z)
Why can neural language models solve next-word prediction? A mathematical perspective [53.807657273043446]
本研究では,英語文の実例をモデル化するための形式言語群について検討する。我々の証明は、ニューラルネットワークモデルにおける埋め込み層と完全に接続されたコンポーネントの異なる役割を強調します。
論文参考訳（メタデータ） (2023-06-20T10:41:23Z)
Retentive or Forgetful? Diving into the Knowledge Memorizing Mechanism of Language Models [49.39276272693035]
大規模事前学習型言語モデルは、顕著な記憶能力を示している。プレトレーニングのないバニラニューラルネットワークは、破滅的な忘れ物問題に悩まされていることが長年観察されてきた。 1)バニラ言語モデルは忘れがちである; 2)事前学習は暗黙の言語モデルにつながる; 3)知識の妥当性と多様化は記憶形成に大きな影響を及ぼす。
論文参考訳（メタデータ） (2023-05-16T03:50:38Z)
Training language models for deeper understanding improves brain alignment [5.678337324555035]
言語を深く理解するシステムの構築は、自然言語処理(NLP)の中心的な目標の1つである。より深い物語理解のための学習言語モデルにより、より豊かな表現が可能となり、人間の脳活動との整合性が向上したことを示す。
論文参考訳（メタデータ） (2022-12-21T10:15:19Z)
Joint processing of linguistic properties in brains and language models [14.997785690790032]
人間の脳と言語モデルによる言語情報の詳細な処理の対応について検討する。特定の言語特性の除去は脳のアライメントを著しく低下させる。これらの知見は、脳と言語モデルとの整合における特定の言語情報の役割の明確な証拠である。
論文参考訳（メタデータ） (2022-12-15T19:13:42Z)
Neural Language Models are not Born Equal to Fit Brain Data, but Training Helps [75.84770193489639]
音声ブックを聴く被験者の機能的磁気共鳴イメージングの時間軸予測に及ぼすテスト損失,トレーニングコーパス,モデルアーキテクチャの影響について検討した。各モデルの訓練されていないバージョンは、同じ単語をまたいだ脳反応の類似性を捉えることで、脳内のかなりの量のシグナルをすでに説明していることがわかりました。ニューラル言語モデルを用いたヒューマン・ランゲージ・システムの説明を目的とした今後の研究の実践を提案する。
論文参考訳（メタデータ） (2022-07-07T15:37:17Z)
Long-range and hierarchical language predictions in brains and algorithms [82.81964713263483]
深層言語アルゴリズムは隣接した単語の予測に最適化されているが、人間の脳は長距離で階層的な予測を行うように調整されている。本研究は、予測符号化理論を強化し、自然言語処理における長距離および階層的予測の重要な役割を示唆する。
論文参考訳（メタデータ） (2021-11-28T20:26:07Z)
Towards Zero-shot Language Modeling [90.80124496312274]
人間の言語学習に誘導的に偏りを持つニューラルモデルを構築した。類型的に多様な訓練言語のサンプルからこの分布を推測する。我々は、保留言語に対する遠隔監視として、追加の言語固有の側情報を利用する。
論文参考訳（メタデータ） (2021-08-06T23:49:18Z)
Mechanisms for Handling Nested Dependencies in Neural-Network Language Models and Humans [75.15855405318855]
我々は,「深層学習」手法で訓練された現代人工ニューラルネットワークが,人間の文処理の中心的な側面を模倣するかどうかを検討した。ネットワークは、大きなコーパスで次の単語を予測するためにのみ訓練されたが、分析の結果、局所的および長距離の構文合意をうまく処理する特別なユニットが出現した。我々は,複数の名詞の単数/複数状態における体系的な変化を伴う文中の数一致の違反を人間が検出する行動実験において,モデルの予測を検証した。
論文参考訳（メタデータ） (2020-06-19T12:00:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。