論文の概要: Toward LLMs Beyond English-Centric Development
- arxiv url: http://arxiv.org/abs/2605.15613v1
- Date: Fri, 15 May 2026 04:51:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.173024
- Title: Toward LLMs Beyond English-Centric Development
- Title(参考訳): 英語を超越したLCMを目指して
- Authors: Sho Takase, Ukyo Honda,
- Abstract要約: 大規模言語モデル(LLM)が英語に大きく偏っていることを示す。
継続的な事前トレーニングは、ターゲット言語における文化的理解の改善であっても、ゼロからトレーニングするよりもコスト上の優位性を提供しない。
- 参考スコア(独自算出の注目度): 15.162927968488829
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Through an analysis of sequences generated by open-weight large language models (LLMs), we demonstrate that LLMs are heavily biased toward English. While continual pre-training is commonly used to adapt LLMs to a target language, we show that it does not offer a cost advantage over training from scratch, even for improving cultural understanding in the target language. These findings suggest that dedicated per-language investment may become increasingly important for future LLM development, rather than relying primarily on the expansion of English-centric resources.
- Abstract(参考訳): オープンウェイトな大言語モデル (LLM) によって生成されるシーケンスの解析を通じて, LLM が英語に大きく偏っていることを示す。
連続的な事前学習は、LLMを対象言語に適応させるのに一般的に使用されるが、ターゲット言語における文化的理解の向上においても、ゼロからトレーニングするよりもコスト上の優位性は示されていない。
これらの結果は、英語中心の資源の拡大に大きく依存するのではなく、言語ごとの投資が将来のLLM開発にとってますます重要になる可能性があることを示唆している。
関連論文リスト
- Position: LLMs Can be Good Tutors in English Education [120.25980336297444]
大規模言語モデル(LLM)は、英語教育において効果的な家庭教師として機能する可能性がある。
LLMは、データエンハンサー、学習材料の作成の改善、学生シミュレーションの3つの重要な役割を果たすことができる。
論文 参考訳(メタデータ) (2025-02-08T06:48:49Z) - Do Large Language Models Have an English Accent? Evaluating and Improving the Naturalness of Multilingual LLMs [13.558778781305998]
大規模言語モデル (LLM) は主に英語を基本言語として設計されている。
多言語である少数の人々でさえ、強い英語中心の偏見を示す傾向がある。
本稿では,多言語出力の語彙的および構文的自然性を評価するための新しい自動コーパスレベル指標を提案する。
論文 参考訳(メタデータ) (2024-10-21T12:34:17Z) - Lens: Rethinking Multilingual Enhancement for Large Language Models [70.85065197789639]
大規模言語モデル(LLM)における多言語機能向上のための新しいアプローチであるLensを提案する。
Lensは2つの部分空間で機能する: 言語に依存しない部分空間で、ターゲット言語と中心言語を一致させて強力な意味表現を継承する部分空間、言語固有の部分空間で、ターゲット言語と中心言語を分離して言語的特異性を保存する部分空間である。
レンズは、モデルの英語能力を維持しながら、多言語のパフォーマンスを著しく向上させ、既存の訓練後のアプローチと比べて計算コストの低い結果を得る。
論文 参考訳(メタデータ) (2024-10-06T08:51:30Z) - History, Development, and Principles of Large Language Models-An Introductory Survey [15.875687167037206]
自然言語処理(NLP)の基盤となる言語モデル
数十年にわたる広範な研究を経て、言語モデリングは、初期統計言語モデル(SLM)から、大規模言語モデル(LLM)の現代的景観へと進歩してきた。
論文 参考訳(メタデータ) (2024-02-10T01:18:15Z) - Supervised Knowledge Makes Large Language Models Better In-context Learners [94.89301696512776]
大規模言語モデル(LLM)は、素早い工学を通して、文脈内学習能力の出現を示す。
自然言語理解と質問応答におけるLLMの一般化性と事実性の向上という課題は、まだ未解決のままである。
本研究では, LLM の信頼性を高める枠組みを提案する。1) 分布外データの一般化,2) 差別モデルによる LLM のメリットの解明,3) 生成タスクにおける幻覚の最小化。
論文 参考訳(メタデータ) (2023-12-26T07:24:46Z) - Limits for Learning with Language Models [4.20859414811553]
大規模言語モデル(LLM)がボレル階層の第一段階を超えて概念を学習できないことを示す。
LLMは、細部と深い言語的理解を必要とするタスクについて、正式な保証なしに運用を続ける。
論文 参考訳(メタデータ) (2023-06-21T12:11:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。