論文の概要: Surprisal Takes It All: Eye Tracking Based Cognitive Evaluation of Text Readability Measures
- arxiv url: http://arxiv.org/abs/2502.11150v1
- Date: Sun, 16 Feb 2025 14:51:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:12:53.662777
- Title: Surprisal Takes It All: Eye Tracking Based Cognitive Evaluation of Text Readability Measures
- Title(参考訳): 視線追跡に基づくテキスト可読性尺度の認知的評価
- Authors: Keren Gruteke Klein, Shachar Frenkel, Omer Shubi, Yevgeni Berzak,
- Abstract要約: 可読性評価のための新しいアイトラッキング手法を提案する。
既存の可読性公式は読みやすさの予測因子として適度であることがわかった。
単語あたりの平均長、頻度、特に副詞は読みやすさの指標として既存の可読性公式より優れている傾向にある。
- 参考スコア(独自算出の注目度): 1.2062053320259833
- License:
- Abstract: Text readability measures are widely used in many real-world scenarios and in NLP. These measures have primarily been developed by predicting reading comprehension outcomes, while largely neglecting what is perhaps the core aspect of a readable text: reading ease. In this work, we propose a new eye tracking based methodology for evaluating readability measures, which focuses on their ability to account for reading facilitation effects in text simplification, as well as for text reading ease more broadly. Using this approach, we find that existing readability formulas are moderate to poor predictors of reading ease. We further find that average per-word length, frequency, and especially surprisal tend to outperform existing readability formulas as measures of reading ease. We thus propose surprisal as a simple unsupervised alternative to existing measures.
- Abstract(参考訳): テキストの可読性測定は多くの実世界のシナリオやNLPで広く使われている。
これらの尺度は主に、読みやすいテキストの中核的な側面である読みやすさを無視しながら、読みやすい結果を予測することによって開発されてきた。
そこで本研究では,テキストの簡易化における読み出し促進効果を考慮し,より広い範囲で読みやすくする,可読性評価のための新しいアイトラッキング手法を提案する。
このアプローチを用いることで、既存の可読性公式は読みやすさの予測因子として適度であることがわかった。
さらに,単語ごとの平均長,頻度,特に副詞は,読みやすさの指標として既存の可読性公式よりも優れる傾向にある。
そこで我々は,既存の対策に代わる単純な教師なしの代替手段として,仮定を提案する。
関連論文リスト
- A Bayesian Approach to Harnessing the Power of LLMs in Authorship Attribution [57.309390098903]
著者の属性は、文書の起源または著者を特定することを目的としている。
大きな言語モデル(LLM)とその深い推論能力と長距離テキストアソシエーションを維持する能力は、有望な代替手段を提供する。
IMDbおよびブログデータセットを用いた結果, 著者10名を対象に, 著者1名に対して, 85%の精度が得られた。
論文 参考訳(メタデータ) (2024-10-29T04:14:23Z) - Free-text Rationale Generation under Readability Level Control [6.338124510580766]
我々は,可読性レベル制御の影響下で,大規模言語モデル (LLM) が合理的生成をいかに行うかを検討する。
要求された可読性は、しばしば測定されたテキストの複雑さと一致しないが、説明はそのような命令に適応できる。
我々のアノテータは、すべての可読性レベルにおける理性に対する概ね満足のいく印象を確認します。
論文 参考訳(メタデータ) (2024-07-01T15:34:17Z) - Previously on the Stories: Recap Snippet Identification for Story
Reading [51.641565531840186]
本稿では,手作り評価データセットを用いたRecap Snippet Identificationと呼ばれる,この有用なタスクに関する最初のベンチマークを提案する。
本実験により,提案課題は,提案課題がスニペット間のプロット相関の深い理解を必要とするため,PLM,LSM,および提案手法に難題であることが判明した。
論文 参考訳(メタデータ) (2024-02-11T18:27:14Z) - Generating Summaries with Controllable Readability Levels [67.34087272813821]
テキストの複雑さ、主題、読者の背景知識など、可読性レベルに影響を与える要因がいくつかある。
現在のテキスト生成アプローチでは制御が洗練されておらず、結果として読者の習熟度にカスタマイズされないテキストが作られる。
可読性を制御するための3つのテキスト生成手法を開発した。命令ベースの可読性制御,要求される可読性と観測される可読性の間のギャップを最小限に抑える強化学習,および,ルックアヘッドを用いて今後の復号化ステップの可読性を評価する復号手法である。
論文 参考訳(メタデータ) (2023-10-16T17:46:26Z) - LC-Score: Reference-less estimation of Text Comprehension Difficulty [0.0]
我々は、参照なしのフランス語テキストに対して、テキスト理解度を訓練するための簡単なアプローチであるtextscLC-Scoreを提示する。
我々の目的は,テキストがtextitLangage Clair (LC, textitClear Language) ガイドラインに適合する範囲を定量的に把握することである。
i) 統計モデルの学習に使用される言語的動機付け指標を使用すること,(ii) 事前学習された言語モデルを利用したテキストから直接ニューラルラーニングを行うこと,の2つのアプローチを探索する。
論文 参考訳(メタデータ) (2023-10-04T11:49:37Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Readability Research: An Interdisciplinary Approach [62.03595526230364]
我々は,可読性研究の包括的枠組みである可読性研究のための強固な基盤を提供することを目指している。
可読性(Readability)とは、ページから読み手への情報フローに影響を与える視覚情報設計の側面を指す。
これらのアスペクトはオンデマンドで修正可能で、読み手がテキストから処理し、意味を導き出すのが簡単になる。
論文 参考訳(メタデータ) (2021-07-20T16:52:17Z) - On the Interpretability and Significance of Bias Metrics in Texts: a
PMI-based Approach [3.2326259807823026]
我々は、テキスト中のバイアスを定量化するために、別のPMIベースのメトリクスを分析する。
これは条件付き確率の関数として表すことができ、単語共起の言葉で簡単に解釈できる。
論文 参考訳(メタデータ) (2021-04-13T19:34:17Z) - Interactive Fiction Game Playing as Multi-Paragraph Reading
Comprehension with Reinforcement Learning [94.50608198582636]
対話型フィクション(IF)ゲームと実際の自然言語テキストは、言語理解技術に対する新たな自然な評価を提供する。
IFゲーム解決の新たな視点を捉え,MPRC(Multi-Passage Reading)タスクとして再フォーマットする。
論文 参考訳(メタデータ) (2020-10-05T23:09:20Z) - Text as Environment: A Deep Reinforcement Learning Text Readability
Assessment Model [2.826553192869411]
最先端のテキスト可読性評価モデルの効率は、深層強化学習モデルを用いてさらに改善することができる。
WeebitとCambridge ExamsのモデルとBERTテキスト可読性モデルのような最先端のモデルを比較すると、他のモデルよりもはるかに少ない入力テキストで最先端の精度を達成できることが示される。
論文 参考訳(メタデータ) (2019-12-12T13:54:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。