Fugu-MT 論文翻訳(概要): Vuyko Mistral: Adapting LLMs for Low-Resource Dialectal Translation

論文の概要: Vuyko Mistral: Adapting LLMs for Low-Resource Dialectal Translation

arxiv url: http://arxiv.org/abs/2506.07617v1
Date: Mon, 09 Jun 2025 10:30:35 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-10 16:33:10.909106
Title: Vuyko Mistral: Adapting LLMs for Low-Resource Dialectal Translation
Title（参考訳）: Vuyko Mistral:低リソースの辞書翻訳にLLMを適用する
Authors: Roman Kyslyi, Yuliia Maksymiuk, Ihor Pysmennyi,
Abstract要約: 本稿では,ウクライナのフツル方言に大規模な言語モデルを適用するための最初の取り組みを紹介する。我々は、9852語対標準ウクライナ語の文対と7320語の単語マッピングの辞書の並列コーパスを作成しました。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper we introduce the first effort to adapt large language models (LLMs) to the Ukrainian dialect (in our case Hutsul), a low-resource and morphologically complex dialect spoken in the Carpathian Highlands. We created a parallel corpus of 9852 dialect-to-standard Ukrainian sentence pairs and a dictionary of 7320 dialectal word mappings. We also addressed data shortage by proposing an advanced Retrieval-Augmented Generation (RAG) pipeline to generate synthetic parallel translation pairs, expanding the corpus with 52142 examples. We have fine-tuned multiple open-source LLMs using LoRA and evaluated them on a standard-to-dialect translation task, also comparing with few-shot GPT-4o translation. In the absence of human annotators, we adopt a multi-metric evaluation strategy combining BLEU, chrF++, TER, and LLM-based judgment (GPT-4o). The results show that even small(7B) finetuned models outperform zero-shot baselines such as GPT-4o across both automatic and LLM-evaluated metrics. All data, models, and code are publicly released at: https://github.com/woters/vuyko-hutsul
Abstract（参考訳）: 本稿では,カルパチア高地で話される低資源かつ形態学的に複雑な方言であるウクライナ語方言(フツル語)に,大きな言語モデル(LLM)を適用するための最初の取り組みを紹介する。我々は、9852語対標準ウクライナ語の文対と7320語の単語マッピングの辞書の並列コーパスを作成しました。また, 合成並列変換ペアを生成するために, 先進Retrieval-Augmented Generation (RAG) パイプラインを提案し, コーパスを52142例に拡張することで, データ不足にも対処した。我々は,LoRAを用いて複数のオープンソースLLMを微調整し,標準音声翻訳タスクで評価し,また,数ショットのGPT-4o翻訳と比較した。ヒトアノテータが存在しない場合には,BLEU,chrF++,TER,LLMに基づく判定(GPT-4o)を組み合わせたマルチメトリック評価戦略を採用する。その結果、小型(7B)の微調整モデルでさえ、自動測定とLCM評価の両方でGPT-4oのようなゼロショットベースラインを上回ります。すべてのデータ、モデル、コードは、https://github.com/woters/vuyko-hutsulで公開されている。

関連論文リスト

NL in the Middle: Code Translation with LLMs and Intermediate Representations [66.41928783565795]
大きな言語モデル(LLM)はバグのあるコード翻訳を生成する。 LLMを用いたコード翻訳が自然言語(NL)と抽象構文木(AST)による中間表現の恩恵を受けるかどうかを検討する。
論文参考訳（メタデータ） (2025-07-11T14:29:21Z)
LLM-Based Evaluation of Low-Resource Machine Translation: A Reference-less Dialect Guided Approach with a Refined Sylheti-English Benchmark [1.3927943269211591]
本稿では,Large Language Models(LLMs)に基づく機械翻訳評価を強化する包括的フレームワークを提案する。我々は、Sylheti- English文ペア、対応する機械翻訳、およびネイティブ話者が注釈付けしたダイレクトアセスメント(DA)スコアを組み込むことで、ONUBADデータセットを拡張した。評価の結果,提案したパイプラインは既存の手法より常に優れており,スピアマン相関において+0.1083の高利得が得られることがわかった。
論文参考訳（メタデータ） (2025-05-18T07:24:13Z)
Idiosyncrasies in Large Language Models [54.26923012617675]
大規模言語モデル(LLM)における慣用句の公開と研究 LLM生成テキストへの微調整テキスト埋め込みモデルにより,優れた分類精度が得られることがわかった。我々はLLMを審査員として利用し、各モデルの慣用句の詳細かつオープンな記述を生成する。
論文参考訳（メタデータ） (2025-02-17T18:59:02Z)
What do Large Language Models Need for Machine Translation Evaluation? [12.42394213466485]
大規模言語モデル(LLM)は、微調整された多言語事前訓練言語モデルに匹敵する結果が得られる。本稿では,LLMの機械翻訳品質を評価するために,ソース,参照,翻訳エラー,ガイドラインなどの翻訳情報が必要であるかを検討する。
論文参考訳（メタデータ） (2024-10-04T09:50:45Z)
Low-Resource Machine Translation through Retrieval-Augmented LLM Prompting: A Study on the Mambai Language [1.1702440973773898]
本研究では,Timor-Lesteで話される低音源のオーストロネシア語であるMambaiへの英語翻訳における大規模言語モデルの利用について検討した。提案手法は, 並列文と辞書エントリの戦略的な選択と, プロンプトのための手法である。辞書をインプロンプトに含め,-IDFで検索した文とセマンティック埋め込みを混合することにより,翻訳品質が大幅に向上することがわかった。
論文参考訳（メタデータ） (2024-04-07T05:04:38Z)
Paloma: A Benchmark for Evaluating Language Model Fit [112.481957296585]
言語モデル (LM) の評価では、トレーニングから切り離されたモノリシックなデータに難易度が報告されるのが一般的である。 Paloma(Perplexity Analysis for Language Model Assessment)は、546の英語およびコードドメインに適合するLMを測定するベンチマークである。
論文参考訳（メタデータ） (2023-12-16T19:12:45Z)
Machine Translation for Ge'ez Language [0.0]
Ge'ezのような低リソース言語の機械翻訳は、語彙外単語、ドメインミスマッチ、ラベル付きトレーニングデータの欠如といった課題に直面している。言語関連性に基づく多言語ニューラルマシン翻訳(MNMT)モデルを開発した。また,最新のLCMであるGPT-3.5を用いて,ファジィマッチングを用いた数ショット翻訳実験を行った。
論文参考訳（メタデータ） (2023-11-24T14:55:23Z)
Chain-of-Dictionary Prompting Elicits Translation in Large Language Models [100.47154959254937]
大規模言語モデル(LLM)は多言語ニューラルマシン翻訳(MNMT)において驚くほど優れた性能を示した入力単語のサブセットに対する多言語辞書の連鎖による事前知識でLLMを拡張して翻訳能力を引き出す新しい方法であるCoDを提案する。
論文参考訳（メタデータ） (2023-05-11T05:19:47Z)
Multilingual Machine Translation with Large Language Models: Empirical Results and Analysis [103.89753784762445]
大規模言語モデル(LLM)は多言語機械翻訳(MMT)の処理において顕著な可能性を示した。本稿では, MMT における LLM の利点と課題を体系的に検討する。また,ChatGPTとGPT-4を含む8つのLLMを徹底的に評価した。
論文参考訳（メタデータ） (2023-04-10T15:51:30Z)
Massively Multilingual Shallow Fusion with Large Language Models [62.76735265311028]
複数の言語で浅い融合のための単一多言語言語モデル(LM)を訓練する。 GLaMは、推論中に同様の計算を行う密度の高いLMと比較して、イングランドのロングテールテストのWERを4.4%削減する。多言語浅層融合タスクでは、GLaMは50言語中41言語を改善し、平均相対的なWERの3.85%、最大10%の削減を実現している。
論文参考訳（メタデータ） (2023-02-17T14:46:38Z)
Using LSTM to Translate French to Senegalese Local Languages: Wolof as a Case Study [0.0]
我々は,低リソースのNiger-Congo言語であるWolofのニューラルマシン翻訳システムを提案する。私たちは7万行のフランス語-ウーロフ文の平行コーパスを集めました。われわれのモデルは、限られた量のフランス語とWolofのデータに基づいて訓練されている。
論文参考訳（メタデータ） (2020-03-27T17:09:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。