論文の概要: Is post-editing really faster than human translation?
- arxiv url: http://arxiv.org/abs/2312.12660v1
- Date: Tue, 19 Dec 2023 23:21:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-21 17:26:35.922633
- Title: Is post-editing really faster than human translation?
- Title(参考訳): ポスト編集は人間の翻訳より速いのか?
- Authors: Silvia Terribile
- Abstract要約: 本研究は,ニューラルマシン翻訳のHTおよびPEにおける翻訳速度とリビジョン速度の大規模研究である。
探索的なデータ分析アプローチを使用して、2.5年以上にわたって、11言語対にわたる879人の言語学者によって翻訳された9900万語のデータを調査する。
その結果, (a) PE は通常 HT よりも常に速いわけではないこと, (b) 平均速度値が誤解を招くこと, (c) 翻訳速度が高いこと, (d) 編集距離が後編集生産性のプロキシとして利用できないこと,などが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Time efficiency is paramount for the localisation industry, which demands
ever-faster turnaround times. However, translation speed is largely
underresearched, and there is a lack of clarity about how language service
providers (LSPs) can evaluate the performance of their post-editing (PE) and
human translation (HT) services. This study constitutes the first large-scale
investigation of translation and revision speed in HT and in the PE of neural
machine translation, based on real-world data from an LSP. It uses an
exploratory data analysis approach to investigate data for 90 million words
translated by 879 linguists across 11 language pairs, over 2.5 years. The
results of this research indicate that (a) PE is usually but not always faster
than HT; (b) average speed values may be misleading; (c) translation speed is
highly variable; and (d) edit distance cannot be used as a proxy for
post-editing productivity, because it does not correlate strongly with speed.
- Abstract(参考訳): 時間効率はローカライゼーション業界にとって最重要であり、より速いターンアラウンドタイムが要求される。
しかし、翻訳速度はほとんど調査されていないため、言語サービス提供者(LSP)がポスト編集(PE)サービスとヒューマン翻訳(HT)サービスの性能をどのように評価できるかは明確になっていない。
本研究は,LSPによる実世界データに基づいて,HTの翻訳とリビジョン速度,およびニューラルマシン翻訳のPEに関する大規模な研究である。
探索的データ分析アプローチを使用して、2.5年以上にわたって11の言語ペアにまたがる879の言語学者によって翻訳された9000万語のデータを調査している。
本研究の結果は,
(a)PEは通常はHTより速いわけではない。
b) 平均速度値は誤解を招くことがある。
(c)翻訳速度は高度に変動し、
(d)編集距離は、速度と強く相関しないため、編集後生産性のプロキシとして使用できない。
関連論文リスト
- Navigating the Minefield of MT Beam Search in Cascaded Streaming Speech Translation [4.20846752769876]
我々は,機械翻訳においてよく知られたビームサーチアルゴリズムを適用し,実時間音声翻訳システムで動作させる。
これは4つの重要な課題のために、当初予想されていたよりも複雑であることが判明した。
論文 参考訳(メタデータ) (2024-06-26T07:34:53Z) - LexMatcher: Dictionary-centric Data Collection for LLM-based Machine Translation [67.24113079928668]
本稿では、バイリンガル辞書に見られる感覚のカバレッジによって駆動されるデータキュレーション手法であるLexMatcherを提案する。
我々の手法は、WMT2022テストセットの確立されたベースラインよりも優れています。
論文 参考訳(メタデータ) (2024-06-03T15:30:36Z) - Towards Faster k-Nearest-Neighbor Machine Translation [56.66038663128903]
k-nearest-neighbor 機械翻訳アプローチは、トークンをデコードする際に、データストア全体の重い検索オーバーヘッドに悩まされる。
ニューラルネットワークの翻訳モデルとkNNが生成する確率によってトークンが共同で翻訳されるべきかどうかを予測するための,単純で効果的な多層パーセプトロン(MLP)ネットワークを提案する。
論文 参考訳(メタデータ) (2023-12-12T16:41:29Z) - Analyzing and Reducing the Performance Gap in Cross-Lingual Transfer
with Fine-tuning Slow and Fast [50.19681990847589]
既存の研究では、1つの(ソース)言語で微調整された多言語事前学習言語モデルが、非ソース言語の下流タスクでもうまく機能していることが示されている。
本稿では、微調整プロセスを分析し、パフォーマンスギャップがいつ変化するかを分析し、ネットワークの重みが全体のパフォーマンスに最も影響するかを特定する。
論文 参考訳(メタデータ) (2023-05-19T06:04:21Z) - Non-Parametric Domain Adaptation for End-to-End Speech Translation [72.37869362559212]
E2E-ST(End-to-End Speech Translation)は、エラー伝播の低減、レイテンシの低減、パラメータの削減などにより注目されている。
本稿では,E2E-STシステムのドメイン適応を実現するために,ドメイン固有のテキスト翻訳コーパスを活用する新しい非パラメトリック手法を提案する。
論文 参考訳(メタデータ) (2022-05-23T11:41:02Z) - Sub-Word Alignment Is Still Useful: A Vest-Pocket Method for Enhancing
Low-Resource Machine Translation [4.809907063232602]
我々は,親子間移動学習法を拡張するために,アライメントサブワード間の埋め込み重複を利用する。
我々は、My-En、Id-En、Tr-Enの翻訳シナリオのベンチマークデータセットで実験を行う。
論文 参考訳(メタデータ) (2022-05-09T06:44:24Z) - Exploiting Neural Query Translation into Cross Lingual Information
Retrieval [49.167049709403166]
既存のCLIRシステムは、高度ニューラルネットワーク翻訳(NMT)ではなく、統計ベースの機械翻訳(SMT)を主に活用している
本稿では,ユーザクリックスルーデータに基づいてクエリ変換ペアを抽出する新しいデータ拡張手法を提案する。
実験結果から,提案手法は強いベースラインよりも高い検索精度が得られることがわかった。
論文 参考訳(メタデータ) (2020-10-26T15:28:19Z) - Constraint Translation Candidates: A Bridge between Neural Query
Translation and Cross-lingual Information Retrieval [45.88734029123836]
本稿では,QTのオープンターゲット語彙検索空間を,検索インデックスデータベースから抽出した重要な単語の集合に限定することで,問題を緩和する新しい手法を提案する。
提案手法を実単語CLIRシステムで活用し,検討した。
論文 参考訳(メタデータ) (2020-10-26T15:27:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。