論文の概要: Correct Me If You Can: Learning from Error Corrections and Markings
- arxiv url: http://arxiv.org/abs/2004.11222v1
- Date: Thu, 23 Apr 2020 15:17:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 09:37:53.333767
- Title: Correct Me If You Can: Learning from Error Corrections and Markings
- Title(参考訳): できるなら正しい: エラー訂正とマーキングから学ぶ
- Authors: Julia Kreutzer, Nathaniel Berger, Stefan Riezler
- Abstract要約: 本稿では、アノテーションのコストと機械学習性に関する最初のユーザスタディを、あまり一般的でないアノテーション方式のエラーマーキングに対して提示する。
我々は、TEDの英語からドイツ語への翻訳における誤りマーキングによって、正確なクレジットの割り当てが可能であり、修正や編集よりも人的労力が大幅に少ないことを示す。
- 参考スコア(独自算出の注目度): 20.808561880051148
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sequence-to-sequence learning involves a trade-off between signal strength
and annotation cost of training data. For example, machine translation data
range from costly expert-generated translations that enable supervised
learning, to weak quality-judgment feedback that facilitate reinforcement
learning. We present the first user study on annotation cost and machine
learnability for the less popular annotation mode of error markings. We show
that error markings for translations of TED talks from English to German allow
precise credit assignment while requiring significantly less human effort than
correcting/post-editing, and that error-marked data can be used successfully to
fine-tune neural machine translation models.
- Abstract(参考訳): シーケンス対シーケンス学習は、トレーニングデータの信号強度とアノテーションコストのトレードオフを伴う。
例えば、機械翻訳データは、教師付き学習を可能にする高価な専門家による翻訳から、強化された学習を促進する品質判断フィードバックまで幅広い。
本稿では,誤差マーキングのあまり一般的でないアノテーションモードに対して,アノテーションコストと機械学習可能性に関する最初のユーザ調査を行う。
我々は、TEDトークを英語からドイツ語に翻訳する際のエラーマーキングは、修正/編集よりも人的労力が大幅に少なく、正確なクレジット割り当てが可能であり、エラーマーキングされたデータは、ニューラルネットワーク翻訳モデルにうまく利用できることを示した。
関連論文リスト
- Enhancing Supervised Learning with Contrastive Markings in Neural
Machine Translation Training [10.498938255717066]
ニューラルネットワーク翻訳(NMT)における指導的学習は、典型的には教師の強制パラダイムに従う。
コントラッシブマーキング目的による標準最大推定の簡易拡張を提案する。
コントラストマーキングによるトレーニングは教師付き学習の上に改善をもたらすことを示す。
論文 参考訳(メタデータ) (2023-07-17T11:56:32Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - ParroT: Translating during Chat using Large Language Models tuned with
Human Translation and Feedback [90.20262941911027]
ParroTはチャット中の翻訳機能を強化し、規制するフレームワークである。
具体的には、ParroTは、翻訳データを命令フォロースタイルに書き換える。
本稿では,ParroTモデルを微調整するための3つの命令タイプを提案する。
論文 参考訳(メタデータ) (2023-04-05T13:12:00Z) - DEEP: DEnoising Entity Pre-training for Neural Machine Translation [123.6686940355937]
機械翻訳モデルは通常、トレーニングコーパスで稀な名前付きエンティティの翻訳を貧弱に生成することが示されている。
文中の名前付きエンティティ翻訳精度を向上させるために,大量のモノリンガルデータと知識ベースを利用するDenoising Entity Pre-training法であるDEEPを提案する。
論文 参考訳(メタデータ) (2021-11-14T17:28:09Z) - End-to-End Lexically Constrained Machine Translation for Morphologically
Rich Languages [0.0]
本研究は, 機械翻訳による単語の正しいインフレクションを許容する機構について検討する。
英語とチェコ語のペアを用いた実験により, 自動評価と手動評価の両方において, 制約付き単語の翻訳が改良されることが示唆された。
論文 参考訳(メタデータ) (2021-06-23T13:40:13Z) - Detecting over/under-translation errors for determining adequacy in
human translations [0.0]
本稿では,翻訳評価における誤りチェックの一部として,OT/UT(Over and Under translations)の新たな手法を提案する。
我々は、機械翻訳(mt)出力に制限はせず、特に人間が生成した翻訳パイプラインでアプリケーションをターゲットにしています。
本システムの目的は、人間の翻訳ビデオ字幕からOT/UTエラーを高いエラーリコールで識別することである。
論文 参考訳(メタデータ) (2021-04-01T06:06:36Z) - Improving Translation Robustness with Visual Cues and Error Correction [58.97421756225425]
ノイズの多いテキストに対する翻訳の堅牢性を改善するビジュアルコンテキストのアイデアを紹介します。
また,誤り訂正を補助タスクとして扱うことで,新しい誤り訂正訓練手法を提案する。
論文 参考訳(メタデータ) (2021-03-12T15:31:34Z) - On the Robustness of Language Encoders against Grammatical Errors [66.05648604987479]
我々は、非ネイティブ話者から実際の文法的誤りを収集し、これらの誤りをクリーンテキストデータ上でシミュレートするために敵攻撃を行う。
結果,全ての試験モデルの性能は影響するが,影響の程度は異なることがわかった。
論文 参考訳(メタデータ) (2020-05-12T11:01:44Z) - It's Easier to Translate out of English than into it: Measuring Neural
Translation Difficulty by Cross-Mutual Information [90.35685796083563]
クロスミューチュアル情報(英: Cross-mutual information、XMI)は、機械翻訳の難易度に関する非対称情報理論の指標である。
XMIは、ほとんどのニューラルマシン翻訳モデルの確率的性質を利用する。
本稿では,現代ニューラル翻訳システムを用いた言語間翻訳の難易度に関する最初の体系的および制御的な研究について述べる。
論文 参考訳(メタデータ) (2020-05-05T17:38:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。