論文の概要: Eye-tracking based classification of Mandarin Chinese readers with and
without dyslexia using neural sequence models
- arxiv url: http://arxiv.org/abs/2210.09819v1
- Date: Tue, 18 Oct 2022 12:57:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 13:19:03.637908
- Title: Eye-tracking based classification of Mandarin Chinese readers with and
without dyslexia using neural sequence models
- Title(参考訳): ニューラルシークエンスモデルを用いた視線追跡に基づく読解障害のない中国語読解者の分類
- Authors: Patrick Haller, Andreas S\"auberli, Sarah Elisabeth Kiener, Jinger
Pan, Ming Yan, Lena J\"ager
- Abstract要約: 文全体の特徴を集約することなく刺激全体の眼球運動を処理する2つの簡単なシーケンスモデルを提案する。
言語刺激を,文脈的単語埋め込みと手作業による言語的特徴抽出という2つの方法でモデルに組み込む。
以上の結果から, (i) 中国語などの書体であっても, シークエンスモデルでは視線上のディプレクシアを分類し, 最先端のパフォーマンスを達成できることがわかった。
- 参考スコア(独自算出の注目度): 7.639036130018945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Eye movements are known to reflect cognitive processes in reading, and
psychological reading research has shown that eye gaze patterns differ between
readers with and without dyslexia. In recent years, researchers have attempted
to classify readers with dyslexia based on their eye movements using Support
Vector Machines (SVMs). However, these approaches (i) are based on highly
aggregated features averaged over all words read by a participant, thus
disregarding the sequential nature of the eye movements, and (ii) do not
consider the linguistic stimulus and its interaction with the reader's eye
movements. In the present work, we propose two simple sequence models that
process eye movements on the entire stimulus without the need of aggregating
features across the sentence. Additionally, we incorporate the linguistic
stimulus into the model in two ways -- contextualized word embeddings and
manually extracted linguistic features. The models are evaluated on a Mandarin
Chinese dataset containing eye movements from children with and without
dyslexia. Our results show that (i) even for a logographic script such as
Chinese, sequence models are able to classify dyslexia on eye gaze sequences,
reaching state-of-the-art performance, and (ii) incorporating the linguistic
stimulus does not help to improve classification performance.
- Abstract(参考訳): 眼球運動は読書における認知過程を反映していることが知られており、心理学的読解研究により、失読症の有無によって眼球運動パターンが異なることが示されている。
近年,支援ベクターマシン(svms)を用いた眼球運動に基づく読字障害のある読者の分類が試みられている。
しかし これらのアプローチは
(i) 参加者が読み取るすべての単語を平均する高度に集約された特徴に基づいており、眼球運動の逐次的性質を無視している。
(二) 言語刺激と読取者の眼球運動との相互作用を考慮しない。
本研究は,文全体にわたる特徴を集約することなく,刺激全体の眼球運動を処理する2つの簡単なシーケンスモデルを提案する。
さらに,文脈的単語埋め込みと手作業による言語特徴抽出の2つの方法で言語刺激をモデルに組み込む。
モデルは、失読症児と無症候児の眼球運動を含む中国語のデータセットで評価される。
私たちの結果は
(i)中国語などの書体でも、シークエンスモデルは視線系列のディフレキシアを分類し、最先端のパフォーマンスに到達することができる。
(ii)言語刺激を組み込むことは分類性能の向上に寄与しない。
関連論文リスト
- Pixel Sentence Representation Learning [67.4775296225521]
本研究では,視覚表現学習プロセスとして,文レベルのテキスト意味論の学習を概念化する。
タイポスや単語順シャッフルのような視覚的に接地されたテキスト摂動法を採用し、人間の認知パターンに共鳴し、摂動を連続的に認識できるようにする。
我々のアプローチは、大規模に教師なしのトピックアライメントトレーニングと自然言語推論監督によってさらに強化されている。
論文 参考訳(メタデータ) (2024-02-13T02:46:45Z) - Caregiver Talk Shapes Toddler Vision: A Computational Study of Dyadic
Play [8.164232628099619]
本稿では, ディヤドプレイにおける視覚表現学習の計算モデルを提案する。
実介護者の統計値に一致した発話は, カテゴリー認識の改善を支援する表現を生じさせることを示す。
論文 参考訳(メタデータ) (2023-12-07T08:18:40Z) - ScanDL: A Diffusion Model for Generating Synthetic Scanpaths on Texts [0.5520145204626482]
読書における眼球運動は精神言語研究において重要な役割を担っている。
眼球運動データの不足とアプリケーション時の利用不可能は、この研究のラインにとって大きな課題となっている。
ScanDLはテキスト上で合成スキャンパスを生成する新しい離散シーケンス対シーケンス拡散モデルである。
論文 参考訳(メタデータ) (2023-10-24T07:52:19Z) - Integrating large language models and active inference to understand eye
movements in reading and dyslexia [0.0]
本稿では,階層型能動推論を用いた新しい計算モデルを提案し,視線と視線の動きをシミュレートする。
本モデルでは、失読症などの読取時の眼球運動に対する不適応推論効果の探索を可能にする。
論文 参考訳(メタデータ) (2023-08-09T13:16:30Z) - Linguistic More: Taking a Further Step toward Efficient and Accurate
Scene Text Recognition [92.6211155264297]
Scene Text Recognition (STR) タスクの単純さと効率性から,視覚モデルへの注目が高まっている。
最近の視覚モデルでは,(1)純粋な視覚に基づく問合せによって注意のドリフトが発生し,認識不良が生じ,言語的不感なドリフト(LID)問題として要約される。
我々は,正確なテキスト認識のための視覚モデルの言語的能力を検討するために,$textbfL$inguistic $textbfP$erception $textbfV$ision model (LPV)を提案する。
論文 参考訳(メタデータ) (2023-05-09T02:52:47Z) - Eyettention: An Attention-based Dual-Sequence Model for Predicting Human
Scanpaths during Reading [3.9766585251585282]
我々は、単語列と時間列の固定を同時に処理する最初の二重系列モデルであるEyettentionを開発する。
スキャンパスの予測において、Eyettentionは最先端のモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-04-21T07:26:49Z) - Model-based analysis of brain activity reveals the hierarchy of language
in 305 subjects [82.81964713263483]
言語の神経基盤を分解する一般的なアプローチは、個人間で異なる刺激に対する脳の反応を関連付けている。
そこで本研究では,自然刺激に曝露された被験者に対して,モデルに基づくアプローチが等価な結果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-12T15:30:21Z) - From Two to One: A New Scene Text Recognizer with Visual Language
Modeling Network [70.47504933083218]
本稿では,視覚情報と言語情報を結合として見る視覚言語モデリングネットワーク(VisionLAN)を提案する。
VisionLANは39%のスピード向上を実現し、正確な認識のための視覚的特徴を高めるために言語情報を適応的に検討する。
論文 参考訳(メタデータ) (2021-08-22T07:56:24Z) - Decomposing lexical and compositional syntax and semantics with deep
language models [82.81964713263483]
GPT2のような言語変換器の活性化は、音声理解中の脳活動に線形にマップすることが示されている。
本稿では,言語モデルの高次元アクティベーションを,語彙,構成,構文,意味表現の4つのクラスに分類する分類法を提案する。
その結果は2つの結果が浮かび上がった。
まず、構成表現は、語彙よりも広範な皮質ネットワークを募集し、両側の側頭、頭頂、前頭前皮質を包含する。
論文 参考訳(メタデータ) (2021-03-02T10:24:05Z) - Automatic selection of eye tracking variables in visual categorization
in adults and infants [0.4194295877935867]
視覚カテゴリーの非学習者から学習者を識別するために,その有用性の分析に基づいて視線追跡変数を自動選択する手法を提案する。
判別変数の小さな集合を同定する際,これらの手法の間に顕著な一致が認められた。
論文 参考訳(メタデータ) (2020-10-28T15:44:57Z) - A Novel Attention-based Aggregation Function to Combine Vision and
Language [55.7633883960205]
本稿では,視覚と言語のための新しい完全適応型還元法を提案する。
具体的には,各モータリティの各要素のスコアの集合を,クロスアテンションの新たな変種を用いて計算する。
我々は、画像テキストマッチングと視覚的質問応答のアプローチを試行し、他の縮小選択と公正な比較を構築した。
論文 参考訳(メタデータ) (2020-04-27T18:09:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。