Fugu-MT 論文翻訳(概要): Relevance-guided Neural Machine Translation

論文の概要: Relevance-guided Neural Machine Translation

arxiv url: http://arxiv.org/abs/2312.00214v1
Date: Thu, 30 Nov 2023 21:52:02 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-04 16:12:54.256587
Title: Relevance-guided Neural Machine Translation
Title（参考訳）: 関連誘導型ニューラルネットワーク翻訳
Authors: Isidora Chara Tourni, Derry Wijaya
Abstract要約: ニューラルネットワーク翻訳(NMT)のための説明可能性に基づく学習手法を提案する。その結果,低リソース環境下でのトレーニングにおいて,本手法が有望であることが示唆された。
参考スコア（独自算出の注目度）: 5.691028372215281
License: http://creativecommons.org/licenses/by/4.0/
Abstract: With the advent of the Transformer architecture, Neural Machine Translation (NMT) results have shown great improvement lately. However, results in low-resource conditions still lag behind in both bilingual and multilingual setups, due to the limited amount of available monolingual and/or parallel data; hence, the need for methods addressing data scarcity in an efficient, and explainable way, is eminent. We propose an explainability-based training approach for NMT, applied in Unsupervised and Supervised model training, for translation of three languages of varying resources, French, Gujarati, Kazakh, to and from English. Our results show our method can be promising, particularly when training in low-resource conditions, outperforming simple training baselines; though the improvement is marginal, it sets the ground for further exploration of the approach and the parameters, and its extension to other languages.
Abstract（参考訳）: Transformerアーキテクチャの出現に伴い、ニューラルネットワーク翻訳(NMT)の結果は、最近大きく改善されている。しかし、低リソースの条件は、利用可能な単言語および/または並列データの量が限られているため、バイリンガルと多言語の両方において依然として遅れているため、効率的かつ説明可能な方法でデータの不足に対処する方法が必要となる。本研究では,NMTの教師なし・監督型モデルトレーニングに応用し,フランス語,グジャラート語,カザフ語,英語の3言語を翻訳するための説明可能性に基づく学習手法を提案する。提案手法は,低リソース条件下でのトレーニングでは特に,単純なトレーニングベースラインよりも優れており,その改善は限界はあるものの,アプローチとパラメータのさらなる探索,および他の言語への拡張の基盤となっている。

関連論文リスト

Beyond Many-Shot Translation: Scaling In-Context Demonstrations For Low-Resource Machine Translation [49.82863380286994]
In-context Learningは、低リソース機械翻訳にLarge Language Modelsを適用する新しい方法を提供するかもしれない。本研究では,Long-context モデルを用いた数千例のサンプルに対して,数ショット設定以上の低リソース機械翻訳ICLのスケーリングについて検討する。 JavaneseとSundaneseに関する我々の実験は、追加のコンテキストからのゲインがすばやく飽和し、最大コンテキストウィンドウの近くで分解可能であることを示している。
論文参考訳（メタデータ） (2026-02-04T17:02:22Z)
Pretraining Strategies using Monolingual and Parallel Data for Low-Resource Machine Translation [4.527982436089707]
この研究は、アフリカーンス語、スワヒリ語、ズールー語を含むいくつかの低リソース言語を考察している。このモデルは、未公開のアフリカの言語であるLingalaのために特別に開発されている。
論文参考訳（メタデータ） (2025-10-29T02:30:18Z)
Understanding and Analyzing Model Robustness and Knowledge-Transfer in Multilingual Neural Machine Translation using TX-Ray [3.2771631221674333]
本研究では,言語間の知識伝達が,極低リソース環境におけるニューラルマシン翻訳(MNMT)をいかに向上させるかを検討する。我々は、最小限の並列データを利用して、英語・ドイツ語・英語・フランス語・英語・スペイン語の翻訳を行い、言語間マッピングを確立する。逐次移動学習は40kパラレル文コーパスのベースラインよりも優れており,その有効性を示している。
論文参考訳（メタデータ） (2024-12-18T14:21:58Z)
Investigating Neural Machine Translation for Low-Resource Languages: Using Bavarian as a Case Study [1.6819960041696331]
本稿では,ドイツ語とバイエルン語の自動翻訳システムを開発するために,最先端のニューラルマシン翻訳技術を再考する。我々の実験では、バックトランスレーションとトランスファー学習を適用して、より多くのトレーニングデータを自動生成し、より高い翻訳性能を達成する。ボニフェロニ補正による統計的意義は驚くほど高いベースラインシステムを示し、バックトランスレーションにより大幅な改善がもたらされた。
論文参考訳（メタデータ） (2024-04-12T06:16:26Z)
Boosting Unsupervised Machine Translation with Pseudo-Parallel Data [2.900810893770134]
本研究では,モノリンガルコーパスから抽出した擬似並列文対と,モノリンガルコーパスから逆転写された合成文対を利用する訓練戦略を提案する。裏書きされたデータのみに基づいてトレーニングされたベースラインに対して、最大14.5 BLEUポイント(ウクライナ語)の改善を達成しました。
論文参考訳（メタデータ） (2023-10-22T10:57:12Z)
Semi-supervised Neural Machine Translation with Consistency Regularization for Low-Resource Languages [3.475371300689165]
本稿では,高品質な文ペアを増補し,半教師付き方式でNMTモデルを訓練することにより,低リソース言語の問題に対処する,シンプルかつ効果的な手法を提案する。具体的には、教師あり学習におけるクロスエントロピー損失と、疑似および拡張的対象文が与えられた教師なしのファッションにおけるKLディバージェンスを組み合わせる。実験の結果,提案手法はNMTベースライン,特に0.46-2.03BLEUスコアを持つ低リソースデータセットにおいて,NMTベースラインを大幅に改善することが示された。
論文参考訳（メタデータ） (2023-04-02T15:24:08Z)
High-resource Language-specific Training for Multilingual Neural Machine Translation [109.31892935605192]
負の干渉を軽減するために,HLT-MT(High-Resource Language-specific Training)を用いた多言語翻訳モデルを提案する。具体的には、まずマルチ言語モデルを高リソースペアでトレーニングし、デコーダの上部にある言語固有のモジュールを選択する。 HLT-MTは、高リソース言語から低リソース言語への知識伝達のために、利用可能なすべてのコーパスでさらに訓練されている。
論文参考訳（メタデータ） (2022-07-11T14:33:13Z)
Learning to Generalize to More: Continuous Semantic Augmentation for Neural Machine Translation [50.54059385277964]
CsaNMT(Continuous Semantic Augmentation)と呼ばれる新しいデータ拡張パラダイムを提案する。 CsaNMTは各トレーニングインスタンスを、同じ意味の下で適切なリテラル式をカバーできる隣接領域で拡張する。
論文参考訳（メタデータ） (2022-04-14T08:16:28Z)
Improving Multilingual Translation by Representation and Gradient Regularization [82.42760103045083]
表現レベルと勾配レベルの両方でNMTモデルを正規化するための共同手法を提案する。提案手法は,オフターゲット翻訳の発生率の低減とゼロショット翻訳性能の向上に有効であることを示す。
論文参考訳（メタデータ） (2021-09-10T10:52:21Z)
Continual Mixed-Language Pre-Training for Extremely Low-Resource Neural Machine Translation [53.22775597051498]
我々は,mbart を未熟な言語に効果的に適用するための,継続的な事前学習フレームワークを提案する。その結果,mBARTベースラインの微調整性能を一貫して改善できることが示された。私たちのアプローチは、両方の言語が元のmBARTの事前トレーニングで見られる翻訳ペアのパフォーマンスを高めます。
論文参考訳（メタデータ） (2021-05-09T14:49:07Z)
Multi-task Learning for Multilingual Neural Machine Translation [32.81785430242313]
本稿では,bitextデータ上での翻訳タスクと,モノリンガルデータ上での2つの認知タスクを併用してモデルを学習するマルチタスク学習フレームワークを提案する。提案手法は,高リソース言語と低リソース言語の両方の翻訳品質を効果的に向上できることを示す。
論文参考訳（メタデータ） (2020-10-06T06:54:12Z)
Leveraging Monolingual Data with Self-Supervision for Multilingual Neural Machine Translation [54.52971020087777]
モノリンガルデータを使用することで、マルチリンガルモデルにおける低リソース言語の翻訳品質が大幅に向上する。自己監督は多言語モデルのゼロショット翻訳品質を改善する。並列データやバックトランスレーションなしで、ro-en翻訳で最大33のBLEUを得る。
論文参考訳（メタデータ） (2020-05-11T00:20:33Z)
Pre-training via Leveraging Assisting Languages and Data Selection for Neural Machine Translation [49.51278300110449]
興味のある言語に対する単言語コーパスの不足を補うために,他の言語の単言語コーパスを活用することを提案する。低リソースの日英ニューラルマシン翻訳(NMT)のケーススタディでは、中国語とフランス語のモノリンガルコーパスを活用することで、日本語と英語のモノリンガルコーパスの不足を克服できることが示された。
論文参考訳（メタデータ） (2020-01-23T02:47:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。