論文の概要: Automatic Correction of Human Translations
- arxiv url: http://arxiv.org/abs/2206.08593v1
- Date: Fri, 17 Jun 2022 07:30:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-21 02:39:56.460441
- Title: Automatic Correction of Human Translations
- Title(参考訳): ヒト翻訳の自動補正
- Authors: Jessy Lin, Geza Kovacs, Aditya Shastry, Joern Wuebker, John DeNero
- Abstract要約: 人為的な翻訳を自動的に修正するタスクである翻訳誤り訂正(TEC)を導入する。
TECのヒューマンエラーは、自動編集後データセットのMTエラーよりも多種多様なエラーを示し、翻訳エラーははるかに少ないことを示す。
- 参考スコア(独自算出の注目度): 8.137198664755598
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce translation error correction (TEC), the task of automatically
correcting human-generated translations. Imperfections in machine translations
(MT) have long motivated systems for improving translations post-hoc with
automatic post-editing. In contrast, little attention has been devoted to the
problem of automatically correcting human translations, despite the intuition
that humans make distinct errors that machines would be well-suited to assist
with, from typos to inconsistencies in translation conventions. To investigate
this, we build and release the Aced corpus with three TEC datasets. We show
that human errors in TEC exhibit a more diverse range of errors and far fewer
translation fluency errors than the MT errors in automatic post-editing
datasets, suggesting the need for dedicated TEC models that are specialized to
correct human errors. We show that pre-training instead on synthetic errors
based on human errors improves TEC F-score by as much as 5.1 points. We
conducted a human-in-the-loop user study with nine professional translation
editors and found that the assistance of our TEC system led them to produce
significantly higher quality revised translations.
- Abstract(参考訳): 人為的な翻訳を自動的に修正するタスクである翻訳誤り訂正(TEC)を導入する。
機械翻訳(MT)の欠陥は、自動編集によるポストホック翻訳を改善するための長いモチベーションを持つ。
対照的に、人間の翻訳を自動修正する問題は、機械がタイプミスから翻訳慣行の不整合まで、支援するのに適しているという、人間が明確な誤りを犯すという直感にもかかわらず、ほとんど注目されていない。
これを調べるために、3つのTECデータセットでAcedコーパスを構築し、リリースする。
その結果、tecにおけるヒューマンエラーは、自動編集後のデータセットにおけるmtエラーよりも幅広い範囲のエラーと翻訳フラレンシエラーを示し、ヒューマンエラーの修正に特化した専用のtecモデルの必要性が示唆された。
人工的誤りに基づく事前学習はtec f-scoreを最大5.1ポイント向上させることを示した。
そこで我々は,9人のプロ翻訳編集者による人文内ユーザスタディを行い,TECシステムの支援により,より高品質な翻訳が得られた。
関連論文リスト
- Prompting Large Language Models with Human Error Markings for Self-Correcting Machine Translation [11.351365352611658]
後編集(PE)は、エラーを訂正し、専門ドメインの項翻訳品質を高めるために依然として必要である。
技術的領域における正しい一貫した項翻訳の必要性に対する翻訳記憶(TM)の強化に関するパイロット研究について述べる。
論文 参考訳(メタデータ) (2024-06-04T12:43:47Z) - Advancing Translation Preference Modeling with RLHF: A Step Towards
Cost-Effective Solution [57.42593422091653]
人間のフィードバックによる強化学習の活用による翻訳品質の向上について検討する。
強力な言語能力を持つ報酬モデルは、翻訳品質の微妙な違いをより敏感に学習することができる。
論文 参考訳(メタデータ) (2024-02-18T09:51:49Z) - HTEC: Human Transcription Error Correction [4.241671683889168]
高品質な人間の転写は、自動音声認識(ASR)モデルの訓練と改善に不可欠である。
人間の転写誤り訂正のためのHTECを提案する。
HTECは、誤った単語を予測しマスクするエラー検出モデルであるTrans-Checkerと、マスクされた位置を埋めるシーケンス対シーケンス生成モデルであるTrans-Fillerの2つのステージで構成されている。
論文 参考訳(メタデータ) (2023-09-18T19:03:21Z) - The Devil is in the Errors: Leveraging Large Language Models for
Fine-grained Machine Translation Evaluation [93.01964988474755]
AutoMQMは,大規模な言語モデルに対して,翻訳におけるエラーの識別と分類を求めるプロンプト技術である。
テキスト内学習と微調整によるラベル付きデータの影響について検討する。
次に, PaLM-2モデルを用いてAutoMQMを評価し, スコアのプロンプトよりも性能が向上することがわかった。
論文 参考訳(メタデータ) (2023-08-14T17:17:21Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - Easy Guided Decoding in Providing Suggestions for Interactive Machine
Translation [14.615314828955288]
我々は、新しい制約付きデコーディングアルゴリズム、すなわちPrefix Suffix Guided Decoding (PSGD)を提案する。
PSGDは平均で10.87ドルのBLEUと8.62ドルのBLEUをWeTSとWMT 2022のTranslation Suggestionデータセットで改善している。
論文 参考訳(メタデータ) (2022-11-14T03:40:02Z) - Non-Parametric Online Learning from Human Feedback for Neural Machine
Translation [54.96594148572804]
本稿では,人間のフィードバックによるオンライン学習の課題について検討する。
従来手法では、高品質な性能を達成するために、オンラインモデル更新や翻訳メモリネットワークの追加が必要であった。
モデル構造を変更することなく、新しい非パラメトリックオンライン学習手法を提案する。
論文 参考訳(メタデータ) (2021-09-23T04:26:15Z) - Detecting over/under-translation errors for determining adequacy in
human translations [0.0]
本稿では,翻訳評価における誤りチェックの一部として,OT/UT(Over and Under translations)の新たな手法を提案する。
我々は、機械翻訳(mt)出力に制限はせず、特に人間が生成した翻訳パイプラインでアプリケーションをターゲットにしています。
本システムの目的は、人間の翻訳ビデオ字幕からOT/UTエラーを高いエラーリコールで識別することである。
論文 参考訳(メタデータ) (2021-04-01T06:06:36Z) - Improving Translation Robustness with Visual Cues and Error Correction [58.97421756225425]
ノイズの多いテキストに対する翻訳の堅牢性を改善するビジュアルコンテキストのアイデアを紹介します。
また,誤り訂正を補助タスクとして扱うことで,新しい誤り訂正訓練手法を提案する。
論文 参考訳(メタデータ) (2021-03-12T15:31:34Z) - Computer Assisted Translation with Neural Quality Estimation and
Automatic Post-Editing [18.192546537421673]
本稿では,機械翻訳出力の品質推定と自動編集のためのエンドツーエンドのディープラーニングフレームワークを提案する。
我々のゴールは、誤り訂正の提案を提供することであり、解釈可能なモデルにより、人間の翻訳者の負担を軽減することである。
論文 参考訳(メタデータ) (2020-09-19T00:29:00Z) - On the Robustness of Language Encoders against Grammatical Errors [66.05648604987479]
我々は、非ネイティブ話者から実際の文法的誤りを収集し、これらの誤りをクリーンテキストデータ上でシミュレートするために敵攻撃を行う。
結果,全ての試験モデルの性能は影響するが,影響の程度は異なることがわかった。
論文 参考訳(メタデータ) (2020-05-12T11:01:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。