論文の概要: Multilinguality of Large Language Models From a Structural Perspective
- arxiv url: http://arxiv.org/abs/2606.01800v1
- Date: Mon, 01 Jun 2026 07:18:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.485997
- Title: Multilinguality of Large Language Models From a Structural Perspective
- Title(参考訳): 構造的観点からみた大規模言語モデルの多言語性
- Authors: Haruki Sakajo, Yusuke Sakai, Hidetaka Kamigaito, Taro Watanabe,
- Abstract要約: 大規模言語モデル(LLM)は、多言語データに対する事前および後訓練によって複数の言語を処理するのに優れている。
その結果,低リソース言語は高水準言語や中級言語と構造的に異なることが明らかとなった。
- 参考スコア(独自算出の注目度): 55.097821802807566
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have excelled in processing multiple languages through pre- and post-training on multilingual data, even though English dominates the training data. Prior work focusing on token representations has revealed how those LLMs process non-English text. Although these analyses have provided insightful findings, they fail to capture a structural view, which is an inherent property of language. In this study, we explore the multilinguality of LLMs through representational structural analysis. Our findings reveal that low-resource languages are structurally more different from English than high- and mid-resource languages, and that language-specific post-training alters their structures while preserving inter-language relationships.
- Abstract(参考訳): 大規模言語モデル(LLM)は、英語が訓練データを支配しているにもかかわらず、多言語データの事前および後訓練によって複数の言語を処理するのに優れている。
トークン表現に焦点を当てた以前の研究は、これらのLLMが非英語テキストをどのように処理するかを明らかにした。
これらの分析は洞察力のある発見をもたらしたが、言語固有の性質である構造的視点を捉えられなかった。
本研究では,LLMの多言語性について,表現構造解析を用いて検討する。
その結果,低リソース言語はハイ・ミッド・ソース言語と構造的に異なっており,言語固有のポストトレーニングは言語間関係を保ちながら構造を変化させていることがわかった。
関連論文リスト
- Are the LLMs Capable of Maintaining at Least the Language Genus? [5.748049484273442]
種レベルの効果は存在するが、訓練資源の可用性によって強く条件付けされていることを示す。
以上の結果から,LLMは属レベルの構造をコードするが,学習データの不均衡が多言語的性能を形作る主要な要因であることが示唆された。
論文 参考訳(メタデータ) (2025-10-24T15:20:40Z) - Information Loss in LLMs' Multilingual Translation: The Role of Training Data, Language Proximity, and Language Family [0.9422186097220215]
本研究は,多言語翻訳における学習データ,言語親和性,言語族が情報損失に与える影響を系統的に検討する。
GPT-4とLlama 2の2つの大言語モデルについて,ラウンドトリップ翻訳により評価した。
論文 参考訳(メタデータ) (2025-06-29T17:21:05Z) - High-Dimensional Interlingual Representations of Large Language Models [65.77317753001954]
大規模言語モデル(LLM)は、多言語データセットに基づいて訓練され、言語間構造の形成を示唆する。
資源レベル, 類型, 地理的地域によって異なる31の多様な言語を探索する。
多言語 LLM は非一貫性な言語間アライメントを示す。
論文 参考訳(メタデータ) (2025-03-14T10:39:27Z) - How does a Multilingual LM Handle Multiple Languages? [0.0]
本研究では,多言語理解,意味表現,言語間知識伝達の能力について批判的に検討する。
コサイン類似性を用いた一貫性のための多言語単語埋め込みの分析により意味的類似性を評価する。
BLOOM-1.7B と Qwen2 を Named Entity Recognition と文類似性タスクを通して調べ、それらの言語構造を理解する。
論文 参考訳(メタデータ) (2025-02-06T18:08:14Z) - How Do Multilingual Language Models Remember Facts? [50.13632788453612]
これまでに同定された英語のリコール機構が多言語文脈に適用可能であることを示す。
我々は、リコール中の言語の役割をローカライズし、エンリッチメントが言語に依存しないことを発見した。
デコーダのみのLLMでは、FVは2つの異なる段階でこれらの2つの情報を構成する。
論文 参考訳(メタデータ) (2024-10-18T11:39:34Z) - Could We Have Had Better Multilingual LLMs If English Was Not the Central Language? [4.655168524016426]
大規模言語モデル(LLM)は、トレーニング対象の言語に対して強力な機械翻訳能力を示す。
我々の研究は、Llama2の翻訳能力について論じている。
実験の結果,7B Llama2モデルはこれまでに見たすべての言語に翻訳すると10 BLEU以上になることがわかった。
論文 参考訳(メタデータ) (2024-02-21T16:32:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。