論文の概要: Generating Diverse Translation with Perturbed kNN-MT
- arxiv url: http://arxiv.org/abs/2402.09344v1
- Date: Wed, 14 Feb 2024 17:46:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-15 14:22:10.489335
- Title: Generating Diverse Translation with Perturbed kNN-MT
- Title(参考訳): 摂動kn-mtによる多様な翻訳の生成
- Authors: Yuto Nishida, Makoto Morishita, Hidetaka Kamigaito, Taro Watanabe
- Abstract要約: そこで本研究では,kNN-MTを用いて,より多様な翻訳を生成する手法を提案する。
提案手法は,kNN-MTの検索空間を拡大し,過剰訂正問題に対処することで,多様な単語を候補に組み込むことを支援する。
- 参考スコア(独自算出の注目度): 31.93055771006252
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating multiple translation candidates would enable users to choose the
one that satisfies their needs. Although there has been work on diversified
generation, there exists room for improving the diversity mainly because the
previous methods do not address the overcorrection problem -- the model
underestimates a prediction that is largely different from the training data,
even if that prediction is likely. This paper proposes methods that generate
more diverse translations by introducing perturbed k-nearest neighbor machine
translation (kNN-MT). Our methods expand the search space of kNN-MT and help
incorporate diverse words into candidates by addressing the overcorrection
problem. Our experiments show that the proposed methods drastically improve
candidate diversity and control the degree of diversity by tuning the
perturbation's magnitude.
- Abstract(参考訳): 複数の翻訳候補を生成することで、ユーザーはニーズを満たす翻訳候補を選択できる。
多様化した世代への取り組みはあったが、主に、以前の手法が過度な修正問題に対処していないため、多様性を改善する余地がある。
本稿では, 摂動k-nearest 近傍機械翻訳 (kNN-MT) を導入して, より多様な翻訳を生成する手法を提案する。
提案手法は,kn-mtの検索空間を拡大し,過剰訂正問題に対処し,多様な単語を候補に組み込むのに役立つ。
提案手法は,摂動の大きさを調整し,候補の多様性を飛躍的に向上させ,多様性の程度を制御できることを示した。
関連論文リスト
- Balancing Diversity and Risk in LLM Sampling: How to Select Your Method and Parameter for Open-Ended Text Generation [60.493180081319785]
本稿では,各復号工程における多様性とリスクのトレードオフを考慮し,トラクションサンプリング手法の本質的な能力を推定する体系的手法を提案する。
本研究は,既存のトラクションサンプリング手法の総合的な比較と,ユーザのガイドラインとして推奨されるパラメータについて紹介する。
論文 参考訳(メタデータ) (2024-08-24T14:14:32Z) - Revisiting Machine Translation for Cross-lingual Classification [91.43729067874503]
この分野のほとんどの研究は、機械翻訳コンポーネントではなく多言語モデルに焦点を当てている。
より強力なMTシステムを用いて、原文のトレーニングと機械翻訳テキストの推論のミスマッチを緩和することにより、翻訳テストは以前想定していたよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-23T16:56:10Z) - Exploring Diversity in Back Translation for Low-Resource Machine
Translation [85.03257601325183]
バックトランスフォーメーションは、ニューラルマシントランスフォーメーションシステムの性能を改善するために最も広く使われている手法の1つである。
近年の研究では、生成された翻訳の「多様性」を増大させることにより、この手法の有効性を高めることを目指している。
この研究は、トレーニングデータの多様性を理解し、それを語彙的多様性と構文的多様性に分割する、より微妙なフレームワークを推し進めている。
論文 参考訳(メタデータ) (2022-06-01T15:21:16Z) - Mixup Decoding for Diverse Machine Translation [26.79346928424374]
入力文に対して異なる翻訳を生成する新しい手法であるMixDiversityを提案する。
重みを制御することにより,付加的なトレーニングを伴わずに,忠実性と多様性のトレードオフを実現することができる。
WMT'16 en-ro, WMT'14 en-de, WMT'17 zh-enの実験を行い, 従来の機械翻訳法よりも大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2021-09-08T02:39:03Z) - Modelling Latent Translations for Cross-Lingual Transfer [47.61502999819699]
従来のパイプラインの2つのステップ(翻訳と分類)を1つのモデルに統合する新しい手法を提案する。
我々は,多言語NLUタスクにおける新しい潜時翻訳モデルの評価を行った。
ゼロショットと数ショットの学習設定の両方で、平均2.7の精度ポイントのゲインを報告します。
論文 参考訳(メタデータ) (2021-07-23T17:11:27Z) - Decoding and Diversity in Machine Translation [90.33636694717954]
NMTが楽しむBLEUスコアに対して支払う費用の多様性の違いを特徴付ける。
本研究は,ジェンダー代名詞を翻訳する際に,検索が既知バイアスの正解源となることを示唆する。
論文 参考訳(メタデータ) (2020-11-26T21:09:38Z) - Uncertainty-Aware Semantic Augmentation for Neural Machine Translation [37.555675157198145]
本稿では,複数の意味的に等価なソース文間の普遍的な意味情報を明示的にキャプチャする不確実性を考慮した意味拡張を提案する。
我々のアプローチは、強いベースラインと既存の手法を大きく上回る。
論文 参考訳(メタデータ) (2020-10-09T07:48:09Z) - Target Conditioning for One-to-Many Generation [30.402378832810697]
本研究では,NMTモデルのデコーダを,対象文の領域を表す潜在変数に条件付けすることで,この一対多マッピングを明示的にモデル化することを提案する。
推論では、異なるドメインでデコードすることで、多様な翻訳を生成することができる。
モデルが生成する翻訳の質と多様性を3つの異なるデータセットで評価する。
論文 参考訳(メタデータ) (2020-09-21T11:01:14Z) - Syntax-aware Data Augmentation for Neural Machine Translation [76.99198797021454]
本稿では,ニューラルマシン翻訳のための新しいデータ拡張戦略を提案する。
文中の役割を考慮し,単語選択のための文特異的確率を設定した。
提案手法はWMT14の英語-ドイツ語データセットとIWSLT14のドイツ語-英語データセットを用いて評価する。
論文 参考訳(メタデータ) (2020-04-29T13:45:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。