論文の概要: TURead: An eye movement dataset of Turkish reading
- arxiv url: http://arxiv.org/abs/2312.01114v1
- Date: Sat, 2 Dec 2023 12:10:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-05 19:05:22.802657
- Title: TURead: An eye movement dataset of Turkish reading
- Title(参考訳): TURead:トルコ語読みの眼球運動データセット
- Authors: Cengiz Acarturk, Aysegul Ozkan, Tugce Nur Pekcetin, Zuhal Ormanoglu,
Bilal Kirkici
- Abstract要約: TURead (英語: TURead) は、トルコ語における無声・口頭文読解の眼球運動データセットである。
対象単語を単語長とトルコ語でよく使われる接尾辞を2つ追加することで、対象単語を操作できるターゲットワードアプローチを採用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this study, we present TURead, an eye movement dataset of silent and oral
sentence reading in Turkish, an agglutinative language with a shallow
orthography understudied in reading research. TURead provides empirical data to
investigate the relationship between morphology and oculomotor control. We
employ a target-word approach in which target words are manipulated by word
length and by the addition of two commonly used suffixes in Turkish. The
dataset contains well-established eye movement variables; prelexical
characteristics such as vowel harmony and bigram-trigram frequencies and word
features, such as word length, predictability, frequency, eye voice span
measures, Cloze test scores of the root word and suffix predictabilities, as
well as the scores obtained from two working memory tests. Our findings on
fixation parameters and word characteristics are in line with the patterns
reported in the relevant literature.
- Abstract(参考訳): 本研究では,トルコ語における無言文と口頭文の読みの目の動きデータセットであるtureadを提案する。
TUReadは形態学と眼球運動制御の関係を調べるための実証データを提供する。
対象語を単語長とトルコ語でよく使われる2つの接尾辞の追加によって操作する目標語アプローチを用いる。
このデータセットは、よく確立された眼球運動変数、母音調和やbigram-trigram周波数などの語彙的特徴、単語長、予測可能性、頻度、眼球音声スパン測度、根語のクローズテストスコア、接尾辞予測可能性、および2つの作業記憶テストから得られたスコアを含む。
固定パラメータと単語特性は関連する文献で報告されたパターンと一致している。
関連論文リスト
- Quantifying the redundancy between prosody and text [67.07817268372743]
我々は大きな言語モデルを用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
単語が持つ情報と韻律情報の間には,複数の韻律的特徴にまたがる高い冗長性が存在する。
それでも、韻律的特徴はテキストから完全には予測できないことが観察され、韻律は単語の上下に情報を運ぶことが示唆された。
論文 参考訳(メタデータ) (2023-11-28T21:15:24Z) - Information-Theoretic Characterization of Vowel Harmony: A
Cross-Linguistic Study on Word Lists [18.138642719651994]
自然言語辞書における母音の予測可能性に基づく調和性の情報理論的尺度を定義する。
音素レベル言語モデル(PLM)を用いてこの調和性を推定する。
我々の研究は、単語リストが類型研究にとって貴重な資源であることを実証している。
論文 参考訳(メタデータ) (2023-08-09T11:32:16Z) - How word semantics and phonology affect handwriting of Alzheimer's
patients: a machine learning based analysis [20.36565712578267]
本研究は,アルツハイマー病患者の手書き書字に意味論と音韻論がどのような影響を及ぼすかを検討した。
我々は、6つの手書き作業から得られたデータを用いて、それぞれが以下のカテゴリの1つに属する単語をコピーする必要がある。
実験の結果,特徴選択により,単語の種類ごとに異なる特徴セットを導出できることがわかった。
論文 参考訳(メタデータ) (2023-07-06T13:35:06Z) - Neighboring Words Affect Human Interpretation of Saliency Explanations [65.29015910991261]
単語レベルのサリエンシの説明は、しばしばテキストベースのモデルで特徴属性を伝えるために使われる。
近年の研究では、単語の長さなどの表面的要因が、コミュニケーションされたサリエンシスコアの人間の解釈を歪めてしまうことが報告されている。
本研究では,単語の近傍にある単語のマーキングが,その単語の重要性に対する説明者の認識にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2023-05-04T09:50:25Z) - Using BERT Embeddings to Model Word Importance in Conversational
Transcripts for Deaf and Hard of Hearing Users [14.45228936875838]
聴覚障害や聴覚障害は、生放送中はキャプションに頼っている。
テレビ放送のキャプションの評価は、様々なキャプション評価指標を用いて規制当局によって評価される。
テキスト中の単語の相対的重要性を考慮に入れたキャプション評価指標を構築する必要がある。
論文 参考訳(メタデータ) (2022-06-24T16:35:57Z) - Syllabic Quantity Patterns as Rhythmic Features for Latin Authorship
Attribution [74.27826764855911]
我々は、ラテン散文の計算的オーサシップ属性のタスクにおいて、リズミカルな特徴を導出する基盤として、音節量を用いる。
2つの異なる機械学習手法を用いて3つの異なるデータセットを用いて実験を行い、音節量に基づくリズム特徴がラテン散文の著者の識別に有用であることを示した。
論文 参考訳(メタデータ) (2021-10-27T06:25:31Z) - Clinical Named Entity Recognition using Contextualized Token
Representations [49.036805795072645]
本稿では,各単語の意味的意味をより正確に把握するために,文脈型単語埋め込み手法を提案する。
言語モデル(C-ELMo)とC-Flair(C-Flair)の2つの深い文脈型言語モデル(C-ELMo)を事前訓練する。
明示的な実験により、静的単語埋め込みとドメインジェネリック言語モデルの両方と比較して、我々のモデルは劇的に改善されている。
論文 参考訳(メタデータ) (2021-06-23T18:12:58Z) - Deep Learning for Prominence Detection in Children's Read Speech [13.041607703862724]
子どもの読書記録のラベル付きデータセットを,話者に依存しない著名単語の検出のために検討する。
事前調整されたランダムフォレストアンサンブル予測器をRNNシーケンスに置き換え、潜在的なコンテキスト依存性を利用する。
深層学習を用いて、基本周波数、強度、スペクトル形状の低レベル音響輪郭から単語レベル特徴を得る。
論文 参考訳(メタデータ) (2021-04-12T14:15:08Z) - Fake it Till You Make it: Self-Supervised Semantic Shifts for
Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。
本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。
3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文 参考訳(メタデータ) (2021-01-30T18:59:43Z) - Temporal Embeddings and Transformer Models for Narrative Text
Understanding [72.88083067388155]
キャラクタ関係モデリングのための物語テキスト理解のための2つのアプローチを提案する。
これらの関係の時間的進化は動的単語埋め込みによって説明され、時間とともに意味的変化を学ぶように設計されている。
最新の変換器モデルBERTに基づく教師付き学習手法を用いて文字間の静的な関係を検出する。
論文 参考訳(メタデータ) (2020-03-19T14:23:12Z) - Identification of primary and collateral tracks in stuttered speech [22.921077940732]
臨床およびNLPパースペクティブに着想を得て, 拡散検出のための新しい評価フレームワークを提案する。
本稿では, 半方向性インタビューのコーパスから, 強制整列型ディスフルエンシデータセットを提案する。
単語ベースのスパン特徴を用いることで,音声による予測のベースラインよりも優れることを示す。
論文 参考訳(メタデータ) (2020-03-02T16:50:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。