論文の概要: Lius: Translation Model Based Instructional Lingustic Using Continual Instruction Tuning In Kupang Malay
- arxiv url: http://arxiv.org/abs/2606.11786v1
- Date: Wed, 10 Jun 2026 08:20:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.359548
- Title: Lius: Translation Model Based Instructional Lingustic Using Continual Instruction Tuning In Kupang Malay
- Title(参考訳): Lius:Kupang Malayにおける継続的指導チューニングを用いた翻訳モデルに基づくインストラクショナル言語学
- Authors: Joanito Agili Lopo, Yunita Sari, Guntur Budi Herwanto,
- Abstract要約: 大きな言語モデル(LLM)は、翻訳タスクの新しい可能性を提供するが、低リソース言語を扱う場合、しばしばパフォーマンス劣化を経験する。
我々は,低リソース言語であるKupang Malay 上での微調整 LLM のアプローチを提案する。
- 参考スコア(独自算出の注目度): 0.09384603486206743
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Large Language Models (LLMs) offer new potential for translation tasks but often experience performance degradation when handling low-resource languages. To address this limitation, we propose an approach for fine-tuning LLMs on a low-resource language, Kupang Malay. Our approach involves designing a set of instructions by leveraging explicit lexical and semantic features from a bilingual dictionary, and introducing Continual Instruction Tuning (CIT), a training paradigm that enables iterative instruction-based training. Experimental results demonstrate that our model, named Lius, yields notable improvements over standard instruction-tuned models by outperforming 4-6 points, and surpassing both Neural Machine Translation (NMT) and Multilingual LLM models by 10-13 points on several evaluation metrics. These findings highlight the potential of our approach to mitigate the reliance on large-scale parallel data in low-resource language translation.
- Abstract(参考訳): 大きな言語モデル(LLM)は、翻訳タスクの新しい可能性を提供するが、低リソース言語を扱う場合、しばしばパフォーマンス劣化を経験する。
この制限に対処するために,低リソース言語であるKupang Malay 上での微調整 LLM のアプローチを提案する。
提案手法では,バイリンガル辞書から明示的な語彙的・意味的特徴を活用することで命令セットを設計し,反復的な命令ベーストレーニングを可能にするトレーニングパラダイムである継続命令チューニング(CIT)を導入する。
実験結果から,Liusと命名された我々のモデルは,4~6点を上回り,ニューラルネットワーク翻訳(NMT)モデルと多言語LLMモデルの両方を10~13点超えることで,標準的な命令調整モデルよりも顕著な改善が得られた。
これらの結果は,低リソース言語翻訳における大規模並列データへの依存を軽減するためのアプローチの可能性を強調した。
関連論文リスト
- Improving Low-Resource Translation with Dictionary-Guided Fine-Tuning and RL: A Spanish-to-Wayuunaiki Study [0.27998963147546146]
本稿では、外部辞書ツールとエンドツーエンドのトレーニングモデルを統合することにより、低リソース言語への翻訳を強化する新しいアプローチを提案する。
モデルが生成中のバイリンガル辞書を選択的に参照できるツール拡張型意思決定問題として翻訳を行う。
予備的な結果から, ツール拡張モデルでは, これまでの作業よりも+3.37BLEUの改善が達成された。
論文 参考訳(メタデータ) (2025-08-26T23:50:55Z) - Challenges in Adapting Multilingual LLMs to Low-Resource Languages using LoRA PEFT Tuning [0.4194295877935868]
本研究では,ローランド適応 (LoRA) -高効率ファインチューニング (PEFT) がマラウイの多言語Gemmaモデルに及ぼす影響について検討した。
52,000対の命令応答対を持つ翻訳データセットを用いて、評価結果が微調整後に低下する一方で、手動による評価では、微調整されたモデルが元のモデルよりも優れていることがしばしば示唆されている。
論文 参考訳(メタデータ) (2024-11-27T18:14:38Z) - TasTe: Teaching Large Language Models to Translate through Self-Reflection [82.83958470745381]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な性能を示した。
本稿では,自己回帰を通した翻訳を行うTasTeフレームワークを提案する。
WMT22ベンチマークにおける4つの言語方向の評価結果から,既存の手法と比較して,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-06-12T17:21:21Z) - Building Accurate Translation-Tailored LLMs with Language Aware Instruction Tuning [57.323716555996114]
オフターゲット翻訳は、特に低リソース言語では未解決の問題である。
最近の研究は、翻訳命令の機能を強調するために高度なプロンプト戦略を設計するか、LLMの文脈内学習能力を活用している。
本研究では,LLMの命令追従能力(特に翻訳方向)を向上させるために,2段階の微調整アルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-03-21T13:47:40Z) - TIM: Teaching Large Language Models to Translate with Comparison [78.66926087162672]
本稿では,LLMに翻訳学習を教えるために,サンプルを用いた新しいフレームワークを提案する。
我々のアプローチは、正しい翻訳例と間違った翻訳例をモデルに提示し、好みの損失を使ってモデルの学習をガイドすることである。
本研究は,翻訳タスクのための微調整LDMの新しい視点を提供し,高品質な翻訳を実現するための有望なソリューションを提供する。
論文 参考訳(メタデータ) (2023-07-10T08:15:40Z) - Exploiting Multilingualism in Low-resource Neural Machine Translation
via Adversarial Learning [3.2258463207097017]
Generative Adversarial Networks (GAN) はニューラルマシン翻訳(NMT)に有望なアプローチを提供する
GANでは、バイリンガルモデルと同様に、マルチリンガルNTTはモデルトレーニング中に各文の参照翻訳を1つだけ考慮している。
本稿では,DAASI(Denoising Adversarial Auto-Encoder-based Sentence Interpolation)アプローチによる文計算を提案する。
論文 参考訳(メタデータ) (2023-03-31T12:34:14Z) - Multilingual Neural Machine Translation:Can Linguistic Hierarchies Help? [29.01386302441015]
MNMT(Multilingual Neural Machine Translation)は、複数の言語間の翻訳をサポートする単一のNMTモデルを訓練する。
MNMTモデルの性能は、様々な言語から知識を伝達することで、負の転送によって翻訳性能が低下するので、訓練で使用される言語の種類に大きく依存する。
本稿では,MNMTにおける階層的知識蒸留(HKD)手法を提案する。
論文 参考訳(メタデータ) (2021-10-15T02:31:48Z) - Improving Massively Multilingual Neural Machine Translation and
Zero-Shot Translation [81.7786241489002]
ニューラルネットワーク翻訳(NMT)の多言語モデルは理論的には魅力的であるが、しばしばバイリンガルモデルに劣る。
我々は,多言語NMTが言語ペアをサポートするためにより強力なモデリング能力を必要とすることを論じる。
未知のトレーニング言語ペアの翻訳を強制するために,ランダムなオンライン翻訳を提案する。
論文 参考訳(メタデータ) (2020-04-24T17:21:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。