論文の概要: Modeling Bottom-up Information Quality during Language Processing
- arxiv url: http://arxiv.org/abs/2509.17047v1
- Date: Sun, 21 Sep 2025 11:59:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.088601
- Title: Modeling Bottom-up Information Quality during Language Processing
- Title(参考訳): 言語処理におけるボトムアップ情報品質のモデル化
- Authors: Cui Ding, Yanning Yin, Lena A. Jäger, Ethan Gotlieb Wilcox,
- Abstract要約: 視覚情報と単語識別の相互情報としてボトムアップ情報の「品質」に対する情報理論的操作を提案する。
我々は、英語と中国語のデータを用いて、情報品質の低下が読書時間に与える影響を推定する。
- 参考スコア(独自算出の注目度): 3.3861246056563616
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contemporary theories model language processing as integrating both top-down expectations and bottom-up inputs. One major prediction of such models is that the quality of the bottom-up inputs modulates ease of processing -- noisy inputs should lead to difficult and effortful comprehension. We test this prediction in the domain of reading. First, we propose an information-theoretic operationalization for the "quality" of bottom-up information as the mutual information (MI) between visual information and word identity. We formalize this prediction in a mathematical model of reading as a Bayesian update. Second, we test our operationalization by comparing participants' reading times in conditions where words' information quality has been reduced, either by occluding their top or bottom half, with full words. We collect data in English and Chinese. We then use multimodal language models to estimate the mutual information between visual inputs and words. We use these data to estimate the specific effect of reduced information quality on reading times. Finally, we compare how information is distributed across visual forms. In English and Chinese, the upper half contains more information about word identity than the lower half. However, the asymmetry is more pronounced in English, a pattern which is reflected in the reading times.
- Abstract(参考訳): 現代理論では、言語処理をトップダウンの期待とボトムアップのインプットの両方を統合するものとしてモデル化している。
このようなモデルの1つの大きな予測は、ボトムアップ入力の品質が処理の容易さを調節するということだ。
我々はこの予測を読書の領域で検証する。
まず,視覚情報と単語識別の相互情報(MI)としてボトムアップ情報の「品質」に対する情報理論的操作を提案する。
我々はこの予測をベイズ更新の数学的モデルとして定式化する。
第2に, 単語情報の質が低下した状況において, 参加者の読解時間を比較することにより, 操作性を検証した。
私たちは英語と中国語でデータを収集する。
次に、マルチモーダル言語モデルを用いて、視覚入力と単語間の相互情報を推定する。
これらのデータを用いて、情報品質の低下が読書時間に与える影響を推定する。
最後に、情報がどのように視覚的形態に分散されているかを比較する。
英語と中国語では、上半身は下半身よりも単語の同一性に関するより多くの情報を含んでいる。
しかし、非対称性は英語でより発音され、そのパターンは読み上げ時間に反映される。
関連論文リスト
- Visual Grounding Helps Learn Word Meanings in Low-Data Regimes [47.7950860342515]
現代のニューラル言語モデル(LM)は、人間の文の生成と理解をモデル化するための強力なツールである。
しかし、これらの結果を得るためには、LMは明らかに非人間的な方法で訓練されなければならない。
より自然主義的に訓練されたモデルは、より人間らしい言語学習を示すのか?
本稿では,言語習得における重要なサブタスクである単語学習の文脈において,この問題を考察する。
論文 参考訳(メタデータ) (2023-10-20T03:33:36Z) - Disco-Bench: A Discourse-Aware Evaluation Benchmark for Language
Modelling [70.23876429382969]
本研究では,多種多様なNLPタスクに対して,文内談話特性を評価できるベンチマークを提案する。
ディスコ・ベンチは文学領域における9つの文書レベルのテストセットから構成されており、豊富な談話現象を含んでいる。
また,言語分析のために,対象モデルが談話知識を学習するかどうかを検証できる診断テストスイートを設計する。
論文 参考訳(メタデータ) (2023-07-16T15:18:25Z) - Bidirectional Representations for Low Resource Spoken Language
Understanding [39.208462511430554]
双方向リッチ符号化における音声符号化のための表現モデルを提案する。
このアプローチでは、表現を学習するために、マスク付き言語モデリングの目的を使用する。
得られたエンコーディングの性能は、複数のデータセットで比較できるモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-11-24T17:05:16Z) - ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality
Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。
統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文 参考訳(メタデータ) (2021-07-30T17:58:54Z) - Comparison of Interactive Knowledge Base Spelling Correction Models for
Low-Resource Languages [81.90356787324481]
低リソース言語に対する正規化の推進は、パターンの予測が難しいため、難しい作業である。
この研究は、ターゲット言語データに様々な量を持つニューラルモデルとキャラクタ言語モデルの比較を示す。
我々の利用シナリオは、ほぼゼロのトレーニング例によるインタラクティブな修正であり、より多くのデータが収集されるにつれてモデルを改善する。
論文 参考訳(メタデータ) (2020-10-20T17:31:07Z) - Simultaneous Machine Translation with Visual Context [42.88121241096681]
同時機械翻訳(SiMT)は、連続的な入力テキストストリームを低レイテンシで最高の品質で別の言語に変換することを目的としている。
我々は、様々なマルチモーダルアプローチと視覚的特徴が最先端のSiMTフレームワークに与える影響を分析する。
論文 参考訳(メタデータ) (2020-09-15T18:19:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。