Fugu-MT 論文翻訳(概要): High-quality Data-to-Text Generation for Severely Under-Resourced Languages with Out-of-the-box Large Language Models

論文の概要: High-quality Data-to-Text Generation for Severely Under-Resourced Languages with Out-of-the-box Large Language Models

arxiv url: http://arxiv.org/abs/2402.12267v1
Date: Mon, 19 Feb 2024 16:29:40 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-20 15:34:35.694357
Title: High-quality Data-to-Text Generation for Severely Under-Resourced Languages with Out-of-the-box Large Language Models
Title（参考訳）: アウト・オブ・ザ・ボックス大言語モデルを用いた重大リソース言語のための高品質データ・テキスト生成
Authors: Michela Lorandi and Anya Belz
Abstract要約: 我々は、事前訓練された大規模言語モデル(LLM)が、アンダーリソース言語のパフォーマンスギャップを埋める可能性について検討する。 LLM は,低リソース言語における技術の現状を,かなりのマージンで容易に設定できることがわかった。全ての言語について、人間の評価は最高のシステムで人間と同等のパフォーマンスを示すが、BLEUのスコアは英語に比べて崩壊する。
参考スコア（独自算出の注目度）: 5.632410663467911
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The performance of NLP methods for severely under-resourced languages cannot currently hope to match the state of the art in NLP methods for well resourced languages. We explore the extent to which pretrained large language models (LLMs) can bridge this gap, via the example of data-to-text generation for Irish, Welsh, Breton and Maltese. We test LLMs on these under-resourced languages and English, in a range of scenarios. We find that LLMs easily set the state of the art for the under-resourced languages by substantial margins, as measured by both automatic and human evaluations. For all our languages, human evaluation shows on-a-par performance with humans for our best systems, but BLEU scores collapse compared to English, casting doubt on the metric's suitability for evaluating non-task-specific systems. Overall, our results demonstrate the great potential of LLMs to bridge the performance gap for under-resourced languages.
Abstract（参考訳）: 高度にリソース不足な言語に対するNLPメソッドのパフォーマンスは、十分にリソースが確保された言語に対するNLPメソッドの最先端性を期待できない。我々は、アイルランド語、ウェールズ語、ブルトン語、マルタ語のdata-to-text生成の例を通して、事前訓練された大規模言語モデル(llm)がこのギャップを橋渡しできる範囲を調査した。我々は、これらの低リソース言語と英語のLLMを、様々なシナリオでテストする。 LLMは、自動評価と人的評価の両方で測定されるように、アンダーリソース言語におけるアートの状態をかなりのマージンで容易に設定できる。すべての言語において、人間による評価は最高のシステムに対して人間とほぼ同等のパフォーマンスを示すが、bleuスコアは英語と比較すると崩壊し、非タスク特有のシステムを評価するためのメトリクスの適合性に疑問を投げかけている。その結果,LLMが低リソース言語の性能ギャップを埋める可能性を示した。

関連論文リスト

Testing Low-Resource Language Support in LLMs Using Language Proficiency Exams: the Case of Luxembourgish [2.0533856328275273]
本研究では,ルクセンブルク語に対する評価ツール等の言語習熟度試験の実施可能性について検討した。また,ChatGPTやClaude,DeepSeek-R1といった大規模モデルは高いスコアを得るのが一般的である。また,このような言語試験における性能は,他のNLP課題における性能を予測するためにも有効であることがわかった。
論文参考訳（メタデータ） (2025-04-02T12:16:14Z)
Enhancing Code Generation for Low-Resource Languages: No Silver Bullet [55.39571645315926]
大規模言語モデル(LLM)は、プログラミング言語の構文、意味論、使用パターンを学ぶために、大規模で多様なデータセットに依存している。低リソース言語では、そのようなデータの限られた可用性は、モデルを効果的に一般化する能力を損なう。本稿では,低リソース言語におけるLLMの性能向上のためのいくつかの手法の有効性を実証研究する。
論文参考訳（メタデータ） (2025-01-31T12:23:28Z)
On Limitations of LLM as Annotator for Low Resource Languages [0.4194295877935868]
低リソース言語は、教師付き学習、アノテーション、分類といったタスクのための十分な言語データ、リソース、ツールが不足しているため、重大な課題に直面している。この不足は正確なモデルやデータセットの開発を妨げるため、感情分析やヘイトスピーチ検出といった重要なNLPタスクの実行が困難になる。このギャップを埋めるために、Large Language Models (LLM) は潜在的なアノテータの機会を提供する。
論文参考訳（メタデータ） (2024-11-26T17:55:37Z)
Think Carefully and Check Again! Meta-Generation Unlocking LLMs for Low-Resource Cross-Lingual Summarization [108.6908427615402]
CLS(Cross-lingual summarization)は、異なるターゲット言語でソーステキストの要約を生成することを目的としている。現在、インストラクションチューニング付き大規模言語モデル (LLM) は様々な英語タスクで優れている。近年の研究では、LCSタスクにおけるLCMの性能は、わずかな設定でも満足できないことが示されている。
論文参考訳（メタデータ） (2024-10-26T00:39:44Z)
LLMs for Extremely Low-Resource Finno-Ugric Languages [0.8192907805418583]
本稿では,Voro,Livonian,Komiに着目し,そのギャップに対処する。データ収集からチューニング,評価に至るまで,LLM作成のサイクルのほとんどを網羅する。本研究は,NLPの進歩によって,低リソースの言語が恩恵を受けることを保証するため,言語多様性を促進することを目的としている。
論文参考訳（メタデータ） (2024-10-24T16:48:12Z)
Generating bilingual example sentences with large language models as lexicography assistants [2.6550899846546527]
本稿では,資源レベルの異なる言語におけるバイリンガル辞書の例文の生成と評価におけるLLMの性能について検討する。 GDEX(Good Dictionary Example)基準に対するLCM生成例の品質評価を行った。
論文参考訳（メタデータ） (2024-10-04T06:45:48Z)
Quantifying Multilingual Performance of Large Language Models Across Languages [48.40607157158246]
大規模言語モデル(LLM)は、英語、ドイツ語、フランス語のような高リソース言語で、低リソース言語の能力は依然として不十分である。内部表現を用いたLLM性能に基づいて,言語をベンチマークし,ランク付けするための固有測度であるLanguage Rankerを提案する。分析の結果,高リソース言語は英語との類似度が高く,性能が優れ,低リソース言語は類似度が低いことがわかった。
論文参考訳（メタデータ） (2024-04-17T16:53:16Z)
Enhancing Multilingual Capabilities of Large Language Models through Self-Distillation from Resource-Rich Languages [60.162717568496355]
大規模言語モデル(LLM)は多言語コーパスで事前訓練されている。彼らのパフォーマンスは、いくつかのリソース豊富な言語と比較して、ほとんどの言語でまだ遅れています。
論文参考訳（メタデータ） (2024-02-19T15:07:32Z)
Zero-Shot Cross-Lingual Reranking with Large Language Models for Low-Resource Languages [51.301942056881146]
アフリカ語における言語間情報検索システムにおいて,大規模言語モデル (LLM) がリランカーとしてどのように機能するかを検討する。私たちの実装は、英語と4つのアフリカの言語(ハウサ語、ソマリ語、スワヒリ語、ヨルバ語)を対象としています。我々は、英語のクェリとアフリカの言葉の文節による言語横断的な格付けについて検討する。
論文参考訳（メタデータ） (2023-12-26T18:38:54Z)
GlotLID: Language Identification for Low-Resource Languages [51.38634652914054]
GlotLID-M は広い範囲、信頼性、効率性のデシラタを満たす LID モデルである。 1665の言語を識別し、以前の作業に比べてカバー範囲が大幅に増加した。
論文参考訳（メタデータ） (2023-10-24T23:45:57Z)
Democratizing LLMs for Low-Resource Languages by Leveraging their English Dominant Abilities with Linguistically-Diverse Prompts [75.33019401706188]
大規模言語モデル(LLM)は、少数の例を単純に観察することで、効果的にタスクを実行することが知られている。我々は,LLMが任意の言語から英語に翻訳するよう促すために,多種多様な高ソース言語から合成例を組み立てることを提案する。我々の教師なしプロンプト法は、英語と13のIndic言語と21のアフリカ低リソース言語間の翻訳において、異なる大きさのLLMにおける教師付き少ショット学習と同等に機能する。
論文参考訳（メタデータ） (2023-06-20T08:27:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。