論文の概要: Every word counts: A multilingual analysis of individual human alignment
with model attention
- arxiv url: http://arxiv.org/abs/2210.04963v1
- Date: Wed, 5 Oct 2022 12:44:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 16:02:32.380604
- Title: Every word counts: A multilingual analysis of individual human alignment
with model attention
- Title(参考訳): すべての単語を数える: モデル注意を伴う個人のアライメントの多言語分析
- Authors: Stephanie Brandl and Nora Hollenstein
- Abstract要約: 我々は、母国語(L1)と英語(L2)の両方で読む13言語話者の視線追跡データを解析する。
言語間ではかなりの差異があるだけでなく、スキップ率、総読解時間、語彙知識(LexTALE)といった個々の読解行動が人間とモデルの整合性に影響を与えることも見出した。
- 参考スコア(独自算出の注目度): 7.066531752554282
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human fixation patterns have been shown to correlate strongly with
Transformer-based attention. Those correlation analyses are usually carried out
without taking into account individual differences between participants and are
mostly done on monolingual datasets making it difficult to generalise findings.
In this paper, we analyse eye-tracking data from speakers of 13 different
languages reading both in their native language (L1) and in English as language
learners (L2). We find considerable differences between languages but also that
individual reading behaviour such as skipping rate, total reading time and
vocabulary knowledge (LexTALE) influence the alignment between humans and
models to an extent that should be considered in future studies.
- Abstract(参考訳): 人間の固定パターンはトランスフォーマーに基づく注意と強く相関している。
これらの相関分析は通常、参加者間の個人差を考慮せずに行われ、主に単言語データセットで行われ、結果の一般化が困難である。
本稿では,13ヶ国語話者が母国語 (l1) と英語 (l2) の両方で読む視線追跡データを,言語学習者 (l2) として分析する。
言語間の有意な差異を見出すとともに, スキップ率, 総読解時間, 語彙知識(語彙知識, 語彙知識)などの個々の読解行動が, 今後の研究で考慮すべき程度まで人間とモデル間のアライメントに影響を与えることも見いだした。
関連論文リスト
- The Role of Language Imbalance in Cross-lingual Generalisation: Insights from Cloned Language Experiments [57.273662221547056]
本研究では,言語間一般化の非直感的な新規ドライバである言語不均衡について検討する。
学習中に支配的な言語が存在することが、あまり頻度の低い言語の性能を高めることを観察する。
分析を実言語に拡張するにつれ、頻繁な言語は依然として恩恵を受けていますが、言語不均衡が言語間の一般化を引き起こすかどうかは決定的ではありません。
論文 参考訳(メタデータ) (2024-04-11T17:58:05Z) - Comparing Biases and the Impact of Multilingual Training across Multiple
Languages [70.84047257764405]
ダウンストリーム感情分析タスクにおいて,イタリア語,中国語,英語,ヘブライ語,スペイン語のバイアス分析を行う。
我々は、既存の感情バイアスのテンプレートを、人種、宗教、国籍、性別の4つの属性で、イタリア語、中国語、ヘブライ語、スペイン語に適応させる。
以上の結果から,各言語の文化に支配的な集団の嗜好など,バイアス表現の類似性を明らかにした。
論文 参考訳(メタデータ) (2023-05-18T18:15:07Z) - Cross-Lingual Transfer of Cognitive Processing Complexity [11.939409227407769]
我々は,構造的複雑さの認知指標として,文レベルの視線追跡パターンを用いる。
マルチ言語モデル XLM-RoBERTa は,13言語に対して様々なパターンを予測できることを示す。
論文 参考訳(メタデータ) (2023-02-24T15:48:23Z) - An Analysis of Social Biases Present in BERT Variants Across Multiple
Languages [0.0]
多様な言語からなる単言語BERTモデルにおけるバイアスについて検討する。
文の擬似類似度に基づいて,任意のバイアスを測定するテンプレートベースの手法を提案する。
偏見探索の現在の手法は言語に依存していると結論付けている。
論文 参考訳(メタデータ) (2022-11-25T23:38:08Z) - A Linguistic Investigation of Machine Learning based Contradiction
Detection Models: An Empirical Analysis and Future Perspectives [0.34998703934432673]
本稿では,2つの自然言語推論データセットについて,その言語的特徴について分析する。
目標は、特に機械学習モデルを理解するのが難しい、構文的および意味的特性を特定することである。
論文 参考訳(メタデータ) (2022-10-19T10:06:03Z) - Analyzing the Mono- and Cross-Lingual Pretraining Dynamics of
Multilingual Language Models [73.11488464916668]
本研究では,多言語事前学習プロセスのダイナミクスについて検討する。
我々は,XLM-Rプレトレーニング全体から抽出したチェックポイントを,一連の言語的タスクを用いて探索する。
分析の結果,より複雑なものよりも低レベルな言語スキルが得られ,早期に高い言語性能が得られることがわかった。
論文 参考訳(メタデータ) (2022-05-24T03:35:00Z) - Cross-lingual Lifelong Learning [53.06904052325966]
本稿では,言語間連続学習(CCL)の評価パラダイムを提案する。
マルチリンガルなシーケンシャルな学習を特に難しいものにするための洞察を提供する。
この分析の意味は、異なる言語間連続学習のデシダータを測り、バランスをとる方法のレシピを含む。
論文 参考訳(メタデータ) (2022-05-23T09:25:43Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。