Fugu-MT 論文翻訳(概要): Deconstructing sentence disambiguation by joint latent modeling of reading paradigms: LLM surprisal is not enough

論文の概要: Deconstructing sentence disambiguation by joint latent modeling of reading paradigms: LLM surprisal is not enough

arxiv url: http://arxiv.org/abs/2602.04489v1
Date: Wed, 04 Feb 2026 12:27:49 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-05 19:45:11.520771
Title: Deconstructing sentence disambiguation by joint latent modeling of reading paradigms: LLM surprisal is not enough
Title（参考訳）: 読解パラダイムの連立潜在モデルによる文の曖昧化:LLMは十分ではない
Authors: Dario Paape, Tal Linzen, Shravan Vasishth,
Abstract要約: 本研究では,4つの読解パラダイムにまたがる人間の読解行動の潜在過程混合モデルを提案する。このモデルは、庭園パス確率、庭園パスコスト、再分析コストを区別する。本モデルでは, 読解行動, 質問応答, 文法的判断に関して, 経験的パターンを再現可能であることを示す。
参考スコア（独自算出の注目度）: 13.226250437905255
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Using temporarily ambiguous garden-path sentences ("While the team trained the striker wondered ...") as a test case, we present a latent-process mixture model of human reading behavior across four different reading paradigms (eye tracking, uni- and bidirectional self-paced reading, Maze). The model distinguishes between garden-path probability, garden-path cost, and reanalysis cost, and yields more realistic processing cost estimates by taking into account trials with inattentive reading. We show that the model is able to reproduce empirical patterns with regard to rereading behavior, comprehension question responses, and grammaticality judgments. Cross-validation reveals that the mixture model also has better predictive fit to human reading patterns and end-of-trial task data than a mixture-free model based on GPT-2-derived surprisal values. We discuss implications for future work.
Abstract（参考訳）: テストケースとして、一時的にあいまいな庭道文(「ストライカーが疑問に思った」)を用いて、4つの異なる読書パラダイム(目追跡、一方向、二方向のセルフペースト、マゼ)にわたる人間の読書行動の潜在プロセス混合モデルを提示した。このモデルは、庭道の確率、庭道のコスト、再分析コストを区別し、意図しない読影による試行を考慮し、より現実的な処理コストを見積もる。本モデルでは, 読解行動, 質問応答, 文法的判断に関して, 経験的パターンを再現可能であることを示す。クロスバリデーションにより,混合モデルはGPT-2由来の予備値に基づく混合自由モデルよりも,ヒトの読影パターンや終末タスクデータに適合することがわかった。今後の仕事の意味について論じる。

関連論文リスト

UPLME: Uncertainty-Aware Probabilistic Language Modelling for Robust Empathy Regression [8.823417072582348]
共感回帰のための教師付き学習は、騒々しい自己報告の共感スコアによって挑戦される。回帰設定におけるラベルノイズを捕捉する不確実性を考慮した確率的言語モデリングフレームワークUPLMEを提案する。
論文参考訳（メタデータ） (2025-08-05T14:46:28Z)
Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2480439325792]
この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文参考訳（メタデータ） (2025-02-11T19:24:09Z)
CONTESTS: a Framework for Consistency Testing of Span Probabilities in Language Models [16.436592723426305]
単語スパンに関節確率を割り当てる異なる方法で、言語モデルが同じ値を生成するかどうかは不明である。我々の研究はConTestSという新しいフレームワークを導入し、交換可能な完了順序と条件付き順序でスコアの整合性を評価する統計的テストを含む。
論文参考訳（メタデータ） (2024-09-30T06:24:43Z)
Evaluating Generative Language Models in Information Extraction as Subjective Question Correction [49.729908337372436]
本稿では,新しい評価手法SQC-Scoreを提案する。主観的質問訂正の原則に着想を得て,新しい評価手法SQC-Scoreを提案する。 3つの情報抽出タスクの結果から,SQC-Scoreは基準値よりもアノテータの方が好ましいことが示された。
論文参考訳（メタデータ） (2024-04-04T15:36:53Z)
Extracting or Guessing? Improving Faithfulness of Event Temporal Relation Extraction [87.04153383938969]
本研究では,TempRel抽出モデルの忠実度を2つの観点から改善する。第1の視点は、文脈記述に基づいて真に抽出することである。第2の視点は、適切な不確実性評価を提供することである。
論文参考訳（メタデータ） (2022-10-10T19:53:13Z)
Explain, Edit, and Understand: Rethinking User Study Design for Evaluating Model Explanations [97.91630330328815]
我々はクラウドソーシング研究を行い、真偽のホテルレビューと偽のホテルレビューを区別するために訓練された詐欺検出モデルと対話する。単語の線形バッグモデルでは、トレーニング中に特徴係数にアクセスした参加者は、非説明制御と比較して、テストフェーズにおいてモデルの信頼性が大幅に低下する可能性があることを観察する。
論文参考訳（メタデータ） (2021-12-17T18:29:56Z)
On the Lack of Robust Interpretability of Neural Text Classifiers [14.685352584216757]
本研究では,事前学習したトランスフォーマーエンコーダをベースとしたニューラルテキスト分類器の解釈の堅牢性を評価する。どちらのテストも、期待された行動から驚くほど逸脱しており、実践者が解釈から引き出す可能性のある洞察の程度について疑問を呈している。
論文参考訳（メタデータ） (2021-06-08T18:31:02Z)
Empowering Language Understanding with Counterfactual Reasoning [141.48592718583245]
本稿では,反現実的思考を模倣した反現実的推論モデルを提案する。特に,各実例に対して代表的対実サンプルを生成する生成モジュールを考案し,その対実サンプルと実例サンプルを比較してモデル予測を振り返るレトロスペクティブモジュールを考案した。
論文参考訳（メタデータ） (2021-06-06T06:36:52Z)
Generative Temporal Difference Learning for Infinite-Horizon Prediction [101.59882753763888]
我々は、無限確率的地平線を持つ環境力学の予測モデルである$gamma$-modelを導入する。トレーニングタイムとテストタイムの複合的なエラーの間には、そのトレーニングが避けられないトレードオフを反映しているかについて議論する。
論文参考訳（メタデータ） (2020-10-27T17:54:12Z)
A Semiparametric Approach to Interpretable Machine Learning [9.87381939016363]
機械学習におけるブラックボックスモデルは、複雑な問題と高次元設定において優れた予測性能を示した。透明性と解釈可能性の欠如は、重要な意思決定プロセスにおけるそのようなモデルの適用性を制限します。半パラメトリック統計学のアイデアを用いて予測モデルにおける解釈可能性と性能のトレードオフを行う新しい手法を提案する。
論文参考訳（メタデータ） (2020-06-08T16:38:15Z)
In Pursuit of Interpretable, Fair and Accurate Machine Learning for Criminal Recidivism Prediction [19.346391120556884]
本研究では、二項予測よりも確率を出力する解釈可能なモデルを訓練し、定量的フェアネス定義を用いてモデルを評価する。フロリダ州とケンタッキー州の2つの異なる犯罪再犯データセット上で,ブラックボックスと解釈可能なMLモデルを生成した。いくつかの解釈可能なMLモデルは、ブラックボックスMLモデルと同様に復調を予測でき、CompASやアーノルドPSAよりも正確である。
論文参考訳（メタデータ） (2020-05-08T17:16:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。