Fugu-MT 論文翻訳(概要): Modeling Bottom-up Information Quality during Language Processing

論文の概要: Modeling Bottom-up Information Quality during Language Processing

arxiv url: http://arxiv.org/abs/2509.17047v1
Date: Sun, 21 Sep 2025 11:59:47 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-23 18:58:16.088601
Title: Modeling Bottom-up Information Quality during Language Processing
Title（参考訳）: 言語処理におけるボトムアップ情報品質のモデル化
Authors: Cui Ding, Yanning Yin, Lena A. Jäger, Ethan Gotlieb Wilcox,
Abstract要約: 視覚情報と単語識別の相互情報としてボトムアップ情報の「品質」に対する情報理論的操作を提案する。我々は、英語と中国語のデータを用いて、情報品質の低下が読書時間に与える影響を推定する。
参考スコア（独自算出の注目度）: 3.3861246056563616
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Contemporary theories model language processing as integrating both top-down expectations and bottom-up inputs. One major prediction of such models is that the quality of the bottom-up inputs modulates ease of processing -- noisy inputs should lead to difficult and effortful comprehension. We test this prediction in the domain of reading. First, we propose an information-theoretic operationalization for the "quality" of bottom-up information as the mutual information (MI) between visual information and word identity. We formalize this prediction in a mathematical model of reading as a Bayesian update. Second, we test our operationalization by comparing participants' reading times in conditions where words' information quality has been reduced, either by occluding their top or bottom half, with full words. We collect data in English and Chinese. We then use multimodal language models to estimate the mutual information between visual inputs and words. We use these data to estimate the specific effect of reduced information quality on reading times. Finally, we compare how information is distributed across visual forms. In English and Chinese, the upper half contains more information about word identity than the lower half. However, the asymmetry is more pronounced in English, a pattern which is reflected in the reading times.
Abstract（参考訳）: 現代理論では、言語処理をトップダウンの期待とボトムアップのインプットの両方を統合するものとしてモデル化している。このようなモデルの1つの大きな予測は、ボトムアップ入力の品質が処理の容易さを調節するということだ。我々はこの予測を読書の領域で検証する。まず,視覚情報と単語識別の相互情報(MI)としてボトムアップ情報の「品質」に対する情報理論的操作を提案する。我々はこの予測をベイズ更新の数学的モデルとして定式化する。第2に, 単語情報の質が低下した状況において, 参加者の読解時間を比較することにより, 操作性を検証した。私たちは英語と中国語でデータを収集する。次に、マルチモーダル言語モデルを用いて、視覚入力と単語間の相互情報を推定する。これらのデータを用いて、情報品質の低下が読書時間に与える影響を推定する。最後に、情報がどのように視覚的形態に分散されているかを比較する。英語と中国語では、上半身は下半身よりも単語の同一性に関するより多くの情報を含んでいる。しかし、非対称性は英語でより発音され、そのパターンは読み上げ時間に反映される。

関連論文リスト

Visual Grounding Helps Learn Word Meanings in Low-Data Regimes [47.7950860342515]
現代のニューラル言語モデル(LM)は、人間の文の生成と理解をモデル化するための強力なツールである。しかし、これらの結果を得るためには、LMは明らかに非人間的な方法で訓練されなければならない。より自然主義的に訓練されたモデルは、より人間らしい言語学習を示すのか? 本稿では,言語習得における重要なサブタスクである単語学習の文脈において,この問題を考察する。
論文参考訳（メタデータ） (2023-10-20T03:33:36Z)
Disco-Bench: A Discourse-Aware Evaluation Benchmark for Language Modelling [70.23876429382969]
本研究では,多種多様なNLPタスクに対して,文内談話特性を評価できるベンチマークを提案する。ディスコ・ベンチは文学領域における9つの文書レベルのテストセットから構成されており、豊富な談話現象を含んでいる。また,言語分析のために,対象モデルが談話知識を学習するかどうかを検証できる診断テストスイートを設計する。
論文参考訳（メタデータ） (2023-07-16T15:18:25Z)
Localization vs. Semantics: Visual Representations in Unimodal and Multimodal Models [57.08925810659545]
既存の視覚・言語モデルと視覚のみのモデルにおける視覚表現の比較分析を行う。我々の経験的観察は、視覚・言語モデルがラベル予測タスクに優れていることを示唆している。我々の研究は、視覚学習における言語の役割に光を当て、様々な事前学習モデルの実証的なガイドとして機能することを願っている。
論文参考訳（メタデータ） (2022-12-01T05:00:18Z)
Bidirectional Representations for Low Resource Spoken Language Understanding [39.208462511430554]
双方向リッチ符号化における音声符号化のための表現モデルを提案する。このアプローチでは、表現を学習するために、マスク付き言語モデリングの目的を使用する。得られたエンコーディングの性能は、複数のデータセットで比較できるモデルよりも優れていることを示す。
論文参考訳（メタデータ） (2022-11-24T17:05:16Z)
A Unified Understanding of Deep NLP Models for Text Classification [88.35418976241057]
我々は、テキスト分類のためのNLPモデルの統一的な理解を可能にする視覚解析ツールDeepNLPVisを開発した。主要なアイデアは相互情報に基づく尺度であり、モデルの各レイヤがサンプル内の入力語の情報をどのように保持するかを定量的に説明する。コーパスレベル、サンプルレベル、単語レベルビジュアライゼーションで構成されるマルチレベルビジュアライゼーションは、全体トレーニングセットから個々のサンプルまでの分析をサポートする。
論文参考訳（メタデータ） (2022-06-19T08:55:07Z)
Training Language Models with Natural Language Feedback [51.36137482891037]
3段階学習アルゴリズムを用いてモデル出力の言語フィードバックから学習する。合成実験において、まず言語モデルがフィードバックを正確に組み込んで改良を行うかどうかを評価する。人間の手書きフィードバックのサンプルは100程度しかなく, 学習アルゴリズムはGPT-3モデルを微調整し, ほぼ人間レベルの要約を行う。
論文参考訳（メタデータ） (2022-04-29T15:06:58Z)
ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文参考訳（メタデータ） (2021-07-30T17:58:54Z)
LET: Linguistic Knowledge Enhanced Graph Transformer for Chinese Short Text Matching [29.318730227080675]
外部知識基盤としてHowNetを導入し,単語のあいまいさに対処する言語知識拡張グラフ変換器(LET)を提案する。 2つの中国語データセットによる実験結果から、我々のモデルは様々な典型的なテキストマッチング手法より優れていることが示された。
論文参考訳（メタデータ） (2021-02-25T04:01:51Z)
Comparison of Interactive Knowledge Base Spelling Correction Models for Low-Resource Languages [81.90356787324481]
低リソース言語に対する正規化の推進は、パターンの予測が難しいため、難しい作業である。この研究は、ターゲット言語データに様々な量を持つニューラルモデルとキャラクタ言語モデルの比較を示す。我々の利用シナリオは、ほぼゼロのトレーニング例によるインタラクティブな修正であり、より多くのデータが収集されるにつれてモデルを改善する。
論文参考訳（メタデータ） (2020-10-20T17:31:07Z)
Simultaneous Machine Translation with Visual Context [42.88121241096681]
同時機械翻訳(SiMT)は、連続的な入力テキストストリームを低レイテンシで最高の品質で別の言語に変換することを目的としている。我々は、様々なマルチモーダルアプローチと視覚的特徴が最先端のSiMTフレームワークに与える影響を分析する。
論文参考訳（メタデータ） (2020-09-15T18:19:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。