論文の概要: An exploratory study of L1-specific non-words
- arxiv url: http://arxiv.org/abs/2009.01134v1
- Date: Wed, 2 Sep 2020 15:18:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-22 19:00:38.408475
- Title: An exploratory study of L1-specific non-words
- Title(参考訳): L1特異的非単語の探索的研究
- Authors: David Alfter
- Abstract要約: 異なる言語モデルを持つ非単語の再ランク付けは、スウェーデン性に知覚的な違いをもたらす」。
実験結果から,L1の非単語はスウェーデン語の非単語に次いで2番目に遅く処理されていることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we explore L1-specific non-words, i.e. non-words in a target
language (in this case Swedish) that are re-ranked by a different-language
language model. We surmise that speakers of a certain L1 will react different
to L1-specific non-words than to general non-words. We present the results from
two small case studies exploring whether re-ranking non-words with different
language models leads to a perceived difference in `Swedishness' (pilot study
1) and whether German and English native speakers have longer reaction times in
a lexical decision task when presented with their respective L1-specific
non-words (pilot study 2). Tentative results seem to indicate that L1-specific
non-words are processed second-slowest, after purely Swedish-looking non-words.
- Abstract(参考訳): 本稿では,L1固有の非単語,すなわち対象言語(スウェーデン語の場合)における非単語について検討する。
特定のL1話者は一般の非単語よりもL1固有の非単語に反応する。
異なる言語モデルで非単語を並べ替えることで「swedishness」が認識されるか(パイロット研究1)と、ドイツ語と英語の母語話者がそれぞれl1固有の非単語を提示した場合の語彙決定タスクで反応時間が長くなるか(パイロット研究2)を考察した。
実験の結果,L1の非単語はスウェーデン語の非単語に次いで2番目に遅く処理されていることが明らかとなった。
関連論文リスト
- Language-Specific Neurons: The Key to Multilingual Capabilities in Large
Language Models [122.25217086389425]
大規模言語モデル(LLM)は、特別にキュレートされた多言語並列コーパスで事前訓練されることなく、顕著な多言語機能を示す。
LLM内の言語特異的ニューロンを識別するための新しい検出手法である言語アクティベーション確率エントロピー(LAPE)を提案する。
以上の結果から,LLMが特定の言語を処理できる能力は,神経細胞のサブセットが少なすぎるためであることが示唆された。
論文 参考訳(メタデータ) (2024-02-26T09:36:05Z) - What Linguistic Features and Languages are Important in LLM Translation? [4.888605304379589]
7BのLlama2モデルは、これまでに見たすべての言語に対して10 BLEUスコアを超える。
構文的類似性は、翻訳品質を決定する上で、必ずしも主要な言語要因ではない。
一部の言語は、英語よりも訓練データが少ないにもかかわらず、英語に匹敵する強い相関関係を示している。
論文 参考訳(メタデータ) (2024-02-21T16:32:38Z) - Tasks That Language Models Don't Learn [0.41699156597945664]
本稿では,H-TESTと呼ばれる一連の課題を通して,言語の視覚的聴覚特性を実証的に調査する。
このベンチマークは、知覚経験を自然に統合する人間の言語理解と、LLMの知覚不足処理能力の基本的なギャップを浮き彫りにする。
論文 参考訳(メタデータ) (2024-02-17T17:52:24Z) - Comparing Hallucination Detection Metrics for Multilingual Generation [70.77449818379056]
本稿では,幻覚検出指標が英語以外の言語でどのように機能するかを理解するためのギャップを埋めることを目的とする。
語彙的メトリクスや自然言語推論(NLI)に基づくメトリクスなど,さまざまな検出指標の有効性を評価する。
我々の経験的分析により,語彙的指標は限られた有効性を示すが,NLIに基づく指標は文レベルでの高リソース言語では良好に機能することがわかった。
論文 参考訳(メタデータ) (2024-02-16T08:10:34Z) - Native Language Identification with Large Language Models [60.80452362519818]
我々はGPTモデルがNLI分類に熟練していることを示し、GPT-4は0ショット設定でベンチマーク11テストセットで91.7%の新たなパフォーマンス記録を樹立した。
また、従来の完全教師付き設定とは異なり、LLMは既知のクラスに制限されずにNLIを実行できることを示す。
論文 参考訳(メタデータ) (2023-12-13T00:52:15Z) - Second Language Acquisition of Neural Language Models [17.356128991925576]
この研究は、第2言語(L2)によるニューラル言語モデル(LM)の獲得に光を当てている。
我々は,人間のL2獲得に類似したシナリオでバイリンガルLMを訓練し,言語学的視点から言語間移動を解析した。
論文 参考訳(メタデータ) (2023-06-05T14:32:41Z) - Low-resource Bilingual Dialect Lexicon Induction with Large Language
Models [24.080565202390314]
バイエルン方言とアレマン方言の2つの方言について,バイリンガル語彙誘導パイプラインの解析を行った。
この設定は、リソースの不足、言語の関連性、方言の正書法における標準化の欠如など、いくつかの課題を引き起こす。
論文 参考訳(メタデータ) (2023-04-19T20:20:41Z) - Phrase translation using a bilingual dictionary and n-gram data: A case
study from Vietnamese to English [2.363388546004777]
言語L1のフレーズを辞書ベースのアプローチで言語L2に翻訳する過去のアプローチでは、初期翻訳を再構築するために文法規則が必要である。
本稿では,辞書に存在しないL1句をL2に翻訳するために,文法規則を使わずに新しい手法を提案する。
論文 参考訳(メタデータ) (2022-08-05T07:16:25Z) - AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages
with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。
言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。
その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T20:23:45Z) - Probing Pretrained Language Models for Lexical Semantics [76.73599166020307]
類型的多様言語と5つの異なる語彙課題にまたがる系統的経験分析を行った。
我々の結果は、普遍的に維持されるパターンとベストプラクティスを示しているが、言語やタスクにまたがる顕著なバリエーションを示している。
論文 参考訳(メタデータ) (2020-10-12T14:24:01Z) - Where New Words Are Born: Distributional Semantic Analysis of Neologisms
and Their Semantic Neighborhoods [51.34667808471513]
分散意味論のパラダイムで定式化されたセマンティック隣人のセマンティック・スパシティと周波数成長率という2つの要因の重要性について検討する。
いずれの因子も単語の出現を予測できるが,後者の仮説はより支持される。
論文 参考訳(メタデータ) (2020-01-21T19:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。