論文の概要: Individual corpora predict fast memory retrieval during reading
- arxiv url: http://arxiv.org/abs/2010.10176v1
- Date: Tue, 20 Oct 2020 10:18:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 07:12:32.585176
- Title: Individual corpora predict fast memory retrieval during reading
- Title(参考訳): 個人コーパスによる読み出し時の高速メモリ検索予測
- Authors: Markus J. Hofmann, Lara M\"uller, Andre R\"olke, Ralph Radach and
Chris Biemann
- Abstract要約: 標準コーパスに基づく単語確率は、最初の固定期間と1回目の視線期間を考慮できる。
その結果,個人の長期記憶構造を表すコーパスは,通常のコーパスよりも読み出し性能をよく説明できることがわかった。
- 参考スコア(独自算出の注目度): 18.441544348848616
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The corpus, from which a predictive language model is trained, can be
considered the experience of a semantic system. We recorded everyday reading of
two participants for two months on a tablet, generating individual corpus
samples of 300/500K tokens. Then we trained word2vec models from individual
corpora and a 70 million-sentence newspaper corpus to obtain individual and
norm-based long-term memory structure. To test whether individual corpora can
make better predictions for a cognitive task of long-term memory retrieval, we
generated stimulus materials consisting of 134 sentences with uncorrelated
individual and norm-based word probabilities. For the subsequent eye tracking
study 1-2 months later, our regression analyses revealed that individual, but
not norm-corpus-based word probabilities can account for first-fixation
duration and first-pass gaze duration. Word length additionally affected gaze
duration and total viewing duration. The results suggest that corpora
representative for an individual's longterm memory structure can better explain
reading performance than a norm corpus, and that recently acquired information
is lexically accessed rapidly.
- Abstract(参考訳): 予測言語モデルが訓練されたコーパスは、意味システムの経験と見なすことができる。
2人の参加者をタブレットで2ヶ月間毎日読み上げ、300/500kトークンの個々のコーパスサンプルを生成した。
次に、個人コーパスと7000万文の新聞コーパスからWord2vecモデルを訓練し、個人と標準に基づく長期記憶構造を得た。
コーパスが長期記憶検索の認知課題に対してより良い予測ができるかどうかを検証するために,非相関な個人と規範に基づく単語確率の134文からなる刺激材料を作成した。
1~2ヵ月後の眼球追跡研究において,本研究の回帰分析により,初回固定期間と初回視線継続期間は,標準コーパス型単語確率ではなく,個人が考慮できることが明らかとなった。
単語の長さは、視線持続時間と総視聴時間にも影響した。
その結果、個人の長期記憶構造を表すコーパスは、通常のコーパスよりも読み出し性能をよく説明でき、最近取得した情報も高速にアクセス可能であることが示唆された。
関連論文リスト
- Individual Text Corpora Predict Openness, Interests, Knowledge and Level of Education [0.5825410941577593]
個々の検索履歴から経験への開放性の個性次元を予測することができる。
個々のテキストコーパス(IC)は,平均500万ワードトークン数214人の参加者から生成される。
論文 参考訳(メタデータ) (2024-03-29T21:44:24Z) - LongFNT: Long-form Speech Recognition with Factorized Neural Transducer [64.75547712366784]
文レベルの長文特徴を語彙予測器の出力と直接融合するLongFNT-Textアーキテクチャを提案する。
また,LongFNT法の有効性を,相対単語誤り率(WER)が19%,GigaSpeechコーパスが12%,LongFNT法が19%であった。
論文 参考訳(メタデータ) (2022-11-17T08:48:27Z) - Decoding speech perception from non-invasive brain recordings [48.46819575538446]
非侵襲的な記録から知覚音声の自己教師付き表現をデコードするために、コントラスト学習で訓練されたモデルを導入する。
我々のモデルでは、3秒のMEG信号から、1,000以上の異なる可能性から最大41%の精度で対応する音声セグメントを識別できる。
論文 参考訳(メタデータ) (2022-08-25T10:01:43Z) - One Size Does Not Fit All: The Case for Personalised Word Complexity
Models [4.035753155957698]
複雑な単語識別(CWI)は、読者が理解し難いと思われるテキスト内の単語を検出することを目的としている。
本稿では,個人読者の単語の複雑さを予測する上で,個人モデルが最も優れていることを示す。
論文 参考訳(メタデータ) (2022-05-05T10:53:31Z) - Language Models Explain Word Reading Times Better Than Empirical
Predictability [20.38397241720963]
認知読解研究における従来のアプローチは、文章の文脈から単語を予測することは、完結確率によって最もよく捉えられると仮定している。
確率言語モデルは、CCPよりも構文的および意味的効果の深い説明を提供する。
現在の単語のN-gramとRNN確率は、トピックモデルやCCPと比較して、より一貫して読み出し性能を予測できる。
論文 参考訳(メタデータ) (2022-02-02T16:38:43Z) - Leveraging Pre-trained Language Model for Speech Sentiment Analysis [58.78839114092951]
本研究では、事前学習された言語モデルを用いて、文章の感情情報を学習し、音声の感情分析を行う。
本稿では,言語モデルを用いた擬似ラベルに基づく半教師付き訓練戦略を提案する。
論文 参考訳(メタデータ) (2021-06-11T20:15:21Z) - An analysis of full-size Russian complexly NER labelled corpus of
Internet user reviews on the drugs based on deep learning and language neural
nets [94.37521840642141]
我々は、インターネットユーザーレビューのフルサイズのロシアの複雑なNERラベルコーパスを提示します。
高度なディープラーニングニューラルネットワークセットは、ロシアのテキストから薬理学的に有意義な実体を抽出するために使用される。
論文 参考訳(メタデータ) (2021-04-30T19:46:24Z) - Pose-based Body Language Recognition for Emotion and Psychiatric Symptom
Interpretation [75.3147962600095]
通常のRGBビデオから始まるボディーランゲージに基づく感情認識のための自動フレームワークを提案する。
心理学者との連携により,精神症状予測の枠組みを拡張した。
提案されたフレームワークの特定のアプリケーションドメインは限られた量のデータしか供給しないため、フレームワークは小さなトレーニングセットで動作するように設計されている。
論文 参考訳(メタデータ) (2020-10-30T18:45:16Z) - Mechanisms for Handling Nested Dependencies in Neural-Network Language
Models and Humans [75.15855405318855]
我々は,「深層学習」手法で訓練された現代人工ニューラルネットワークが,人間の文処理の中心的な側面を模倣するかどうかを検討した。
ネットワークは、大きなコーパスで次の単語を予測するためにのみ訓練されたが、分析の結果、局所的および長距離の構文合意をうまく処理する特別なユニットが出現した。
我々は,複数の名詞の単数/複数状態における体系的な変化を伴う文中の数一致の違反を人間が検出する行動実験において,モデルの予測を検証した。
論文 参考訳(メタデータ) (2020-06-19T12:00:05Z) - On the Predictive Power of Neural Language Models for Human Real-Time
Comprehension Behavior [29.260666424382446]
我々は、自然言語テキストコーパスにおいて、その次の単語の予測が人間の読書時間をどのように予測するかを、2ダース以上のモデルで検証する。
これらのモデルの特徴が、その心理測定的予測能力や、人間の読書行動を予測する能力をどのように決定するかを評価する。
任意の難易度に対して、ディープトランスフォーマーモデルとn-gramモデルはLSTMや構造的に制御されたニューラルモデルよりも優れた心理測定予測力を示す。
論文 参考訳(メタデータ) (2020-06-02T19:47:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。