Fugu-MT 論文翻訳(概要): Syntactic Surprisal From Neural Models Predicts, But Underestimates, Human Processing Difficulty From Syntactic Ambiguities

論文の概要: Syntactic Surprisal From Neural Models Predicts, But Underestimates, Human Processing Difficulty From Syntactic Ambiguities

arxiv url: http://arxiv.org/abs/2210.12187v2
Date: Tue, 1 Aug 2023 22:23:09 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-03 18:12:11.133209
Title: Syntactic Surprisal From Neural Models Predicts, But Underestimates, Human Processing Difficulty From Syntactic Ambiguities
Title（参考訳）: ニューラルモデルによる構文的サブプライズ、しかし過小評価、構文的曖昧性による人間の処理の難しさ
Authors: Suhas Arehalli, Brian Dillon, Tal Linzen
Abstract要約: 言語モデルから構文予測可能性を推定する手法を提案する。構文的予測可能性と語彙的予測可能性とを独立に扱うことで,園路効果のより大きい推定結果が得られた。本研究は, 庭道文に付随する処理コストの要因は, 予測可能性だけではないという仮説を支持する。
参考スコア（独自算出の注目度）: 19.659811811023374
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Humans exhibit garden path effects: When reading sentences that are temporarily structurally ambiguous, they slow down when the structure is disambiguated in favor of the less preferred alternative. Surprisal theory (Hale, 2001; Levy, 2008), a prominent explanation of this finding, proposes that these slowdowns are due to the unpredictability of each of the words that occur in these sentences. Challenging this hypothesis, van Schijndel & Linzen (2021) find that estimates of the cost of word predictability derived from language models severely underestimate the magnitude of human garden path effects. In this work, we consider whether this underestimation is due to the fact that humans weight syntactic factors in their predictions more highly than language models do. We propose a method for estimating syntactic predictability from a language model, allowing us to weigh the cost of lexical and syntactic predictability independently. We find that treating syntactic predictability independently from lexical predictability indeed results in larger estimates of garden path. At the same time, even when syntactic predictability is independently weighted, surprisal still greatly underestimate the magnitude of human garden path effects. Our results support the hypothesis that predictability is not the only factor responsible for the processing cost associated with garden path sentences.
Abstract（参考訳）: 人間は庭道の効果を示す: 一時的に構造的に曖昧な文章を読むと、その構造が不明瞭になり、あまり好ましくない選択肢が好まれる。この発見の顕著な説明であるサプライズ理論(Hale, 2001; Levy, 2008)は、これらの減速はこれらの文で起こる各単語の予測不能に起因することを示唆している。この仮説に挑戦したvan schijndel & linzen (2021) は、言語モデルに由来する単語予測可能性のコストの見積もりが人間の庭の道の影響の大きさをひどく過小評価していることを発見した。本研究では、この過小評価が、言語モデルよりも人間の重み付け構文因子が高いという事実によるものであるかを検討する。本稿では,言語モデルから構文予測可能性を推定し,語彙予測と構文予測のコストを独立に評価する手法を提案する。構文的予測可能性と語彙的予測可能性とを独立に扱うことで,園路の予測がより大きくなることがわかった。同時に、統語的予測可能性が独立して重み付けされているとしても、前提は、人間の庭道効果の規模を大幅に過小評価する。本研究は, 庭道文に付随する処理コストの要因は, 予測可能性だけではないという仮説を支持する。

関連論文リスト

Human Supervision as an Information Bottleneck: A Unified Theory of Error Floors in Human-Guided Learning [51.56484100374058]
制約は、モデルスケールや最適化よりも、監督チャネルの構造的特性を反映している、と我々は主張する。我々は、人間の監督チャネルが潜在評価対象に十分でない場合、情報伝達チャネルとして機能することを示す統一理論を開発する。
論文参考訳（メタデータ） (2026-02-26T19:11:32Z)
Clozing the Gap: Exploring Why Language Model Surprisal Outperforms Cloze Surprisal [7.591490481106253]
クローズタスクに対する人間の反応を利用するか、言語モデル(LM)からの確率を使用するかの2つの方法で、単語がどれだけ予測可能かを定量化できる。 LM確率の利点に関する3つの仮説の証拠を提示する。
論文参考訳（メタデータ） (2026-01-14T21:38:54Z)
SPAWNing Structural Priming Predictions from a Cognitively Motivated Parser [20.83447226847776]
我々は、SPAWNを用いて、英語の相対節の構造に関する2つの理論から、プライミング予測を生成する。パルティシパル・パーゼ理論の予測は人間の行動と一致しているが、ウィズ・ディレティオン理論の予測には一致しなかった。
論文参考訳（メタデータ） (2024-03-11T22:58:58Z)
PROPRES: Investigating the Projectivity of Presupposition with Various Triggers and Environments [13.896697187967547]
我々は新しいデータセット、PROPRES(PROPRES)を導入する。人間の評価は、ある場合において、人間が様々な射影性を示すことを示している。本研究は, 実用的推論の探索研究は, 人間の判断の多様性を余分に考慮する必要があることを示唆している。
論文参考訳（メタデータ） (2023-12-14T09:07:57Z)
Temperature-scaling surprisal estimates improve fit to human reading times -- but does it do so for the "right reasons"? [15.773775387121097]
大規模な言語モデルのキャリブレーションは,通常モデルサイズによって改善されることを示す。温度スケーリングの確率は、読み取り時間に体系的に適合することがわかった。
論文参考訳（メタデータ） (2023-11-15T19:34:06Z)
Humans and language models diverge when predicting repeating text [52.03471802608112]
我々は,人間とLMのパフォーマンスが分岐するシナリオを提示する。人間とGPT-2 LMの予測はテキストスパンの最初のプレゼンテーションで強く一致しているが、メモリが役割を担い始めると、その性能は急速にバラバラになる。このシナリオが,LMを人間の行動に近づける上で,今後の作業に拍車をかけることを期待しています。
論文参考訳（メタデータ） (2023-10-10T08:24:28Z)
Testing the Predictions of Surprisal Theory in 11 Languages [77.45204595614]
本研究では,11言語における副次的時間と読解時間の関係について検討する。より多様な言語に焦点をあてることで、これらの結果は、情報理論と言語間のインクリメンタル言語処理の最も堅牢なリンクを提供すると論じる。
論文参考訳（メタデータ） (2023-07-07T15:37:50Z)
Naturalistic Causal Probing for Morpho-Syntax [76.83735391276547]
スペインにおける実世界のデータに対する入力レベルの介入に対する自然主義的戦略を提案する。提案手法を用いて,共同設立者から文章中の形態・症状の特徴を抽出する。本研究では,事前学習したモデルから抽出した文脈化表現に対する性別と数字の因果効果を解析するために,本手法を適用した。
論文参考訳（メタデータ） (2022-05-14T11:47:58Z)
Uncertainty estimation of pedestrian future trajectory using Bayesian approximation [137.00426219455116]
動的トラフィックシナリオでは、決定論的予測に基づく計画は信頼できない。著者らは、決定論的アプローチが捉えられない近似を用いて予測中の不確実性を定量化する。将来の状態の不確実性に対する降雨重量と長期予測の影響について検討した。
論文参考訳（メタデータ） (2022-05-04T04:23:38Z)
Does referent predictability affect the choice of referential form? A computational approach using masked coreference resolution [10.73926355134268]
本稿では,参照予測可能性の新しい計算量を用いた参照表現のダイナミクスについて検討する。モデル出力と参照形式の関係に関する統計的分析は、予測可能性が参照の形式に影響を与えるという仮説を支持する。
論文参考訳（メタデータ） (2021-09-27T14:54:46Z)
Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文参考訳（メタデータ） (2020-10-15T16:39:26Z)
Mechanisms for Handling Nested Dependencies in Neural-Network Language Models and Humans [75.15855405318855]
我々は,「深層学習」手法で訓練された現代人工ニューラルネットワークが,人間の文処理の中心的な側面を模倣するかどうかを検討した。ネットワークは、大きなコーパスで次の単語を予測するためにのみ訓練されたが、分析の結果、局所的および長距離の構文合意をうまく処理する特別なユニットが出現した。我々は,複数の名詞の単数/複数状態における体系的な変化を伴う文中の数一致の違反を人間が検出する行動実験において,モデルの予測を検証した。
論文参考訳（メタデータ） (2020-06-19T12:00:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。