論文の概要: Easy Guided Decoding in Providing Suggestions for Interactive Machine
Translation
- arxiv url: http://arxiv.org/abs/2211.07093v2
- Date: Fri, 2 Jun 2023 08:25:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-05 20:37:41.402029
- Title: Easy Guided Decoding in Providing Suggestions for Interactive Machine
Translation
- Title(参考訳): 対話型機械翻訳における簡単なガイド付き復号法の提案
- Authors: Ke Wang, Xin Ge, Jiayi Wang, Yu Zhao, Yuqi Zhang
- Abstract要約: 我々は、新しい制約付きデコーディングアルゴリズム、すなわちPrefix Suffix Guided Decoding (PSGD)を提案する。
PSGDは平均で10.87ドルのBLEUと8.62ドルのBLEUをWeTSとWMT 2022のTranslation Suggestionデータセットで改善している。
- 参考スコア(独自算出の注目度): 14.615314828955288
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine translation technology has made great progress in recent years, but
it cannot guarantee error free results. Human translators perform post editing
on machine translations to correct errors in the scene of computer aided
translation. In favor of expediting the post editing process, many works have
investigated machine translation in interactive modes, in which machines can
automatically refine the rest of translations constrained by human's edits.
Translation Suggestion (TS), as an interactive mode to assist human
translators, requires machines to generate alternatives for specific incorrect
words or phrases selected by human translators. In this paper, we utilize the
parameterized objective function of neural machine translation (NMT) and
propose a novel constrained decoding algorithm, namely Prefix Suffix Guided
Decoding (PSGD), to deal with the TS problem without additional training.
Compared to the state of the art lexically constrained decoding method, PSGD
improves translation quality by an average of $10.87$ BLEU and $8.62$ BLEU on
the WeTS and the WMT 2022 Translation Suggestion datasets, respectively, and
reduces decoding time overhead by an average of 63.4% tested on the WMT
translation datasets. Furthermore, on both of the TS benchmark datasets, it is
superior to other supervised learning systems trained with TS annotated data.
- Abstract(参考訳): 近年,機械翻訳技術は大きな進歩を遂げているが,誤りのない結果を保証することはできない。
人間の翻訳者は、コンピュータ翻訳の現場でエラーを修正するために機械翻訳のポスト編集を行う。
ポスト編集プロセスを促進するために、多くの作品が対話モードで機械翻訳を調査しており、機械は人間の編集によって制約された他の翻訳を自動的に洗練することができる。
翻訳提案(TS)は、人間の翻訳者を支援するインタラクティブモードとして、機械が人間の翻訳者によって選択された特定の不正確な単語やフレーズの代替語を生成する必要がある。
本稿では、ニューラルネットワーク翻訳(NMT)のパラメータ化目的関数を利用して、新たな制約付き復号アルゴリズム、すなわちPrefix Suffix Guided Decoding(PSGD)を提案する。
技術的制約付き復号法と比較すると、PSGD は平均 10.87$ BLEU と 8.62$ BLEU を WeTS と WMT 2022 Translation Suggestion データセットでそれぞれ改善し、WMT Translation Suggestion データセットでの平均 63.4% で復号時間オーバーヘッドを低減する。
さらに、TSベンチマークデータセットは、TSアノテートされたデータでトレーニングされた他の教師あり学習システムよりも優れている。
関連論文リスト
- A Data Selection Approach for Enhancing Low Resource Machine Translation Using Cross-Lingual Sentence Representations [0.4499833362998489]
本研究は,既存のデータセットが特に騒々しい英語-マラティー語対の事例に焦点を当てた。
データ品質問題の影響を軽減するために,言語間文表現に基づくデータフィルタリング手法を提案する。
その結果,IndicSBERTによるベースラインポストフィルタよりも翻訳品質が大幅に向上した。
論文 参考訳(メタデータ) (2024-09-04T13:49:45Z) - An approach for mistranslation removal from popular dataset for Indic MT
Task [5.4755933832880865]
トレーニングコーパスから誤訳を除去し,その性能と効率を評価するアルゴリズムを提案する。
実験には2つのIndic言語(IL)、すなわちHindi(HIN)とOdia(ODI)が選択される。
実験における翻訳の質は,BLEU, METEOR, RIBESなどの標準指標を用いて評価する。
論文 参考訳(メタデータ) (2024-01-12T06:37:19Z) - On the Copying Problem of Unsupervised NMT: A Training Schedule with a
Language Discriminator Loss [120.19360680963152]
unsupervised neural machine translation (UNMT)は多くの言語で成功している。
コピー問題、すなわち、入力文の一部を翻訳として直接コピーする問題は、遠い言語対に共通している。
本稿では,言語識別器の損失を取り入れた,シンプルだが効果的な訓練スケジュールを提案する。
論文 参考訳(メタデータ) (2023-05-26T18:14:23Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - ParroT: Translating during Chat using Large Language Models tuned with
Human Translation and Feedback [90.20262941911027]
ParroTはチャット中の翻訳機能を強化し、規制するフレームワークである。
具体的には、ParroTは、翻訳データを命令フォロースタイルに書き換える。
本稿では,ParroTモデルを微調整するための3つの命令タイプを提案する。
論文 参考訳(メタデータ) (2023-04-05T13:12:00Z) - Non-Parametric Online Learning from Human Feedback for Neural Machine
Translation [54.96594148572804]
本稿では,人間のフィードバックによるオンライン学習の課題について検討する。
従来手法では、高品質な性能を達成するために、オンラインモデル更新や翻訳メモリネットワークの追加が必要であった。
モデル構造を変更することなく、新しい非パラメトリックオンライン学習手法を提案する。
論文 参考訳(メタデータ) (2021-09-23T04:26:15Z) - ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality
Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。
統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文 参考訳(メタデータ) (2021-07-30T17:58:54Z) - Computer Assisted Translation with Neural Quality Estimation and
Automatic Post-Editing [18.192546537421673]
本稿では,機械翻訳出力の品質推定と自動編集のためのエンドツーエンドのディープラーニングフレームワークを提案する。
我々のゴールは、誤り訂正の提案を提供することであり、解釈可能なモデルにより、人間の翻訳者の負担を軽減することである。
論文 参考訳(メタデータ) (2020-09-19T00:29:00Z) - It's Easier to Translate out of English than into it: Measuring Neural
Translation Difficulty by Cross-Mutual Information [90.35685796083563]
クロスミューチュアル情報(英: Cross-mutual information、XMI)は、機械翻訳の難易度に関する非対称情報理論の指標である。
XMIは、ほとんどのニューラルマシン翻訳モデルの確率的性質を利用する。
本稿では,現代ニューラル翻訳システムを用いた言語間翻訳の難易度に関する最初の体系的および制御的な研究について述べる。
論文 参考訳(メタデータ) (2020-05-05T17:38:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。