論文の概要: Is Cross-Lingual Transfer in Bilingual Models Human-Like? A Study with Overlapping Word Forms in Dutch and English
- arxiv url: http://arxiv.org/abs/2604.07067v1
- Date: Wed, 08 Apr 2026 13:17:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.548757
- Title: Is Cross-Lingual Transfer in Bilingual Models Human-Like? A Study with Overlapping Word Forms in Dutch and English
- Title(参考訳): バイリンガルモデルにおける言語間移動は人間に似ているか? オランダ語と英語の重なり合う単語形式を用いた研究
- Authors: Iza Škrjanec, Irene Elisabeth Winther, Vera Demberg, Stefan L. Frank,
- Abstract要約: コニャート(友人)は典型的にはファシリテーションを引き起こすが、言語間ホモグラフ(偽の友人)は干渉や効果を生じない。
バイリンガル言語モデルにおける言語間アクティベーションがこれらのパターンを反映しているかどうかを検討する。
- 参考スコア(独自算出の注目度): 12.996963143295654
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bilingual speakers show cross-lingual activation during reading, especially for words with shared surface form. Cognates (friends) typically lead to facilitation, whereas interlingual homographs (false friends) cause interference or no effect. We examine whether cross-lingual activation in bilingual language models mirrors these patterns. We train Dutch-English causal Transformers under four vocabulary-sharing conditions that manipulate whether (false) friends receive shared or language-specific embeddings. Using psycholinguistic stimuli from bilingual reading studies, we evaluate the models through surprisal and embedding similarity analyses. The models largely maintain language separation, and cross-lingual effects arise primarily when embeddings are shared. In these cases, both friends and false friends show facilitation relative to controls. Regression analyses reveal that these effects are mainly driven by frequency rather than consistency in form-meaning mapping. Only when just friends share embeddings are the qualitative patterns of bilinguals reproduced. Overall, bilingual language models capture some cross-linguistic activation effects. However, their alignment with human processing seems to critically depend on how lexical overlap is encoded, possibly limiting their explanatory adequacy as models of bilingual reading.
- Abstract(参考訳): バイリンガル話者は読み上げ中に言語間のアクティベーションを示す。
コニャート(友人)は典型的にはファシリテーションを引き起こすが、言語間ホモグラフ(偽の友人)は干渉や効果を生じない。
バイリンガル言語モデルにおける言語間アクティベーションがこれらのパターンを反映しているかどうかを検討する。
オランダ語と英語の因果変換器を4つの語彙共有条件で訓練し、(偽)友人が共有または言語固有の埋め込みを受けるかどうかを制御した。
バイリンガル読解研究の心理言語学的刺激を用いて,予備的および埋め込み的類似性分析によるモデルの評価を行った。
モデルは言語分離を主に維持し、埋め込みを共有する際には言語間効果が主に生じる。
これらのケースでは、友人と偽の友人の両方が、コントロールに対してファシリテーションを示す。
回帰分析により、これらの効果は主に形式的意味のマッピングにおける一貫性よりも周波数によって引き起こされることが明らかとなった。
友達が埋め込みを共有するときだけ、バイリンガルの質的なパターンが再現される。
全体として、バイリンガル言語モデルは言語間のアクティベーション効果を捉えている。
しかしながら、人間の処理との整合性は、どのように語彙的重複がコード化されているかに大きく依存しているようで、おそらくはバイリンガル読解のモデルとしての説明的妥当性を制限している。
関連論文リスト
- When Meanings Meet: Investigating the Emergence and Quality of Shared Concept Spaces during Multilingual Language Model Training [57.230355403478995]
本研究では,EuroLLMの事前学習における言語に依存しない概念空間の開発について検討する。
共有概念空間は早期に出現し、洗練され続けていますが、それらとの整合性は言語に依存しています。
従来の作業とは対照的に、細かな手作業分析により、翻訳品質の顕著な向上は、行動の変化を反映していることが判明した。
論文 参考訳(メタデータ) (2026-01-30T11:23:01Z) - False Friends Are Not Foes: Investigating Vocabulary Overlap in Multilingual Language Models [53.01170039144264]
多言語コーパスで訓練されたサブワードトークンライザは、言語間で重複するトークンを自然に生成する。
トークンの重複は言語間転送を促進するのか、それとも言語間の干渉を導入するのか?
相反する語彙を持つモデルでは、重なり合う結果が得られます。
論文 参考訳(メタデータ) (2025-09-23T07:47:54Z) - On the Acquisition of Shared Grammatical Representations in Bilingual Language Models [6.266732217239363]
言語間移動は、現代言語モデルの多言語能力にとって重要であるが、どのように起こるかはよく理解されていない。
第二言語でトレーニングを始めると、モノリンガル言語モデルに何が起こるのかを尋ねる。
共有多言語表現の証拠を見つけるために,人間の文法表現を研究するために用いられる構造プライミングに目を向ける。
論文 参考訳(メタデータ) (2025-03-05T23:27:58Z) - Crosslingual Structural Priming and the Pre-Training Dynamics of
Bilingual Language Models [6.845954748361076]
構造プライミングを用いて、モデル出力に対する因果効果を持つ抽象文法表現をテストする。
オランダ語と英語のバイリンガル設定にアプローチを拡張し,事前学習時のオランダ語と英語のモデルを評価する。
また,第2言語に曝露すると,言語間構造的プライミング効果が早期に出現し,その言語でのデータトークンが100万個未満であることが判明した。
論文 参考訳(メタデータ) (2023-10-11T22:57:03Z) - Cross-Lingual Ability of Multilingual Masked Language Models: A Study of
Language Structure [54.01613740115601]
本稿では,構成順序,構成,単語共起の3つの言語特性について検討する。
我々の主な結論は、構成順序と単語共起の寄与は限定的である一方、構成は言語間移動の成功にとってより重要であるということである。
論文 参考訳(メタデータ) (2022-03-16T07:09:35Z) - Discovering Representation Sprachbund For Multilingual Pre-Training [139.05668687865688]
多言語事前学習モデルから言語表現を生成し、言語分析を行う。
すべての対象言語を複数のグループにクラスタリングし、表現のスプラックバンドとして各グループに名前を付ける。
言語間ベンチマークで実験を行い、強いベースラインと比較して大幅な改善が達成された。
論文 参考訳(メタデータ) (2021-09-01T09:32:06Z) - On Negative Interference in Multilingual Models: Findings and A
Meta-Learning Treatment [59.995385574274785]
従来の信念に反して、負の干渉は低リソース言語にも影響を及ぼすことを示す。
メタ学習アルゴリズムは、より優れた言語間変換性を得、負の干渉を軽減する。
論文 参考訳(メタデータ) (2020-10-06T20:48:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。