論文の概要: Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis
- arxiv url: http://arxiv.org/abs/2605.15440v1
- Date: Thu, 14 May 2026 21:44:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 03:45:13.14423
- Title: Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis
- Title(参考訳): なぜ言語モデルは人間より驚いていないのか?Parse Multiplicity Mismatch仮説の検証
- Authors: William Timkey, Brian Dillon, Tal Linzen,
- Abstract要約: 予備理論は、単語の処理困難は文脈におけるその予測可能性によって決定されると仮定する。
LMは、自然主義的なテキストの読み出し時間を予測することに成功したが、統語的曖昧さの制御された研究において観察される困難度を体系的に過小評価した。
このことは、LMと人間が同時に利用できるパース数の違いは、人間の文章処理とLMに基づく仮定を一致させることができないことを示唆している。
- 参考スコア(独自算出の注目度): 14.478855009044807
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Surprisal theory posits that the processing difficulty of a word is determined by its predictability in context, offering a potential link between human sentence processing and next-word predictions from language models. While language model (LM) surprisals successfully predict reading times in naturalistic text, they systematically underpredict the magnitude of difficulty observed in controlled studies of syntactic ambiguity, particularly in garden path sentences. This mismatch might arise from differences in the computational constraints between humans and LMs. Here we test one such hypothesis, specifically, that LMs may be able to simultaneously consider a greater number of distinct sentence interpretations at once, compared to humans. Using Recurrent Neural Network Grammars (RNNGs) with word-synchronous beam search, we systematically vary the number of simultaneous parses used to compute word surprisal, and then use these surprisals to predict human reading times. Reducing the number of simultaneous active parses indeed increases the magnitude of predicted garden path effects, but not nearly enough to capture the full magnitude of the effects in humans. This suggests that differences in the number of simultaneous parses available to LMs and humans cannot reconcile LM-based surprisal with human sentence processing.
- Abstract(参考訳): 予備理論では、単語の処理困難は文脈における予測可能性によって決定され、人間の文処理と言語モデルからの次の単語予測との潜在的なリンクを提供する。
言語モデル (LM) は, 自然主義的テキストにおける読解時間の予測に成功しているが, 統語的曖昧さの制御研究, 特に庭道文において観察される難易度を体系的に過小評価する。
このミスマッチは、人間とLM間の計算的制約の違いから生じる可能性がある。
ここでは、このような仮説の一つ、具体的には、LMが同時に、人間に比べて多くの異なる文解釈を同時に考えることができるかもしれないという仮説をテストする。
単語同期ビームサーチを用いたRecurrent Neural Network Grammars (RNNGs) を用いて、単語素数計算に使用される同時パース数を体系的に変化させ、これらの素数を用いて人間の読取時間を推定する。
同時に活動するパースの数を減らせば、予想される庭道効果の規模は大きくなるが、人間の効果の完全な大きさを捉えるには十分ではない。
このことは、LMと人間が同時に利用できるパース数の違いは、人間の文章処理とLMに基づく仮定を一致させることが出来ないことを示唆している。
関連論文リスト
- Probing for Reading Times [60.30314214800421]
我々は、英語、ギリシャ語、ヘブライ語、ロシア語、トルコ語における人間の読書時間を表す言語モデル表現を探索する。
その結果,初期層からの表現は,初回固定や視線持続時間などの早期通過の予測において極めて優れていた。
論文 参考訳(メタデータ) (2026-04-20T18:12:59Z) - An Existence Proof for Neural Language Models That Can Explain Garden-Path Effects via Surprisal [21.29543663048103]
本研究は, 園芸効果を前提として, 園芸効果を説明できるニューラルLMの構築が不可能かどうかを考察する。
以上の結果から,微調整されたLMは過剰に適合せず,ガーデニングパスアイテムの読解速度を低下させることに成功した。
論文 参考訳(メタデータ) (2026-04-20T14:01:11Z) - Predicting Sentence Acceptability Judgments in Multimodal Contexts [22.053970196200925]
これまでの研究は、人間の文受容性判定を予測するディープニューラルネットワーク(DNN)の能力について検討してきた。
視覚画像への事前曝露が人や大言語モデル(LLM)の判断に及ぼす影響を考察する。
以上の結果から,視覚的イメージが人間の受容性評価にはほとんど影響を与えていないことが示唆された。
論文 参考訳(メタデータ) (2026-02-24T13:54:38Z) - Multipath parsing in the brain [4.605070569473395]
人間は言葉ごとの文章を聴く順番で理解する。
本研究では,音声ブックを聴きながら機能的ニューロイメージングを行う人々の時系列データと,段階的依存からの予測を関連づけることで,これらの構文的あいまいさを人間がどのように処理するかを検討する。
英語と中国語の両方でマルチパス解析の証拠が見つかる。このマルチパス効果に関連する脳領域には、両側上側頭回を含む。
論文 参考訳(メタデータ) (2024-01-31T18:07:12Z) - Testing the Predictions of Surprisal Theory in 11 Languages [77.45204595614]
本研究では,11言語における副次的時間と読解時間の関係について検討する。
より多様な言語に焦点をあてることで、これらの結果は、情報理論と言語間のインクリメンタル言語処理の最も堅牢なリンクを提供すると論じる。
論文 参考訳(メタデータ) (2023-07-07T15:37:50Z) - Syntactic Surprisal From Neural Models Predicts, But Underestimates,
Human Processing Difficulty From Syntactic Ambiguities [19.659811811023374]
言語モデルから構文予測可能性を推定する手法を提案する。
構文的予測可能性と語彙的予測可能性とを独立に扱うことで,園路効果のより大きい推定結果が得られた。
本研究は, 庭道文に付随する処理コストの要因は, 予測可能性だけではないという仮説を支持する。
論文 参考訳(メタデータ) (2022-10-21T18:30:56Z) - Mechanisms for Handling Nested Dependencies in Neural-Network Language
Models and Humans [75.15855405318855]
我々は,「深層学習」手法で訓練された現代人工ニューラルネットワークが,人間の文処理の中心的な側面を模倣するかどうかを検討した。
ネットワークは、大きなコーパスで次の単語を予測するためにのみ訓練されたが、分析の結果、局所的および長距離の構文合意をうまく処理する特別なユニットが出現した。
我々は,複数の名詞の単数/複数状態における体系的な変化を伴う文中の数一致の違反を人間が検出する行動実験において,モデルの予測を検証した。
論文 参考訳(メタデータ) (2020-06-19T12:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。