論文の概要: Automatic Classification of Human Translation and Machine Translation: A
Study from the Perspective of Lexical Diversity
- arxiv url: http://arxiv.org/abs/2105.04616v1
- Date: Mon, 10 May 2021 18:55:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-13 07:45:34.285064
- Title: Automatic Classification of Human Translation and Machine Translation: A
Study from the Perspective of Lexical Diversity
- Title(参考訳): 人間翻訳と機械翻訳の自動分類:語彙多様性の観点から
- Authors: Yingxue Fu, Mark-Jan Nederhof
- Abstract要約: 機械翻訳と人間の翻訳は、チャンスレベル以上の精度で分類できることを示しています。
機械翻訳の分類精度は人間の翻訳よりもはるかに高い。
- 参考スコア(独自算出の注目度): 1.5229257192293197
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: By using a trigram model and fine-tuning a pretrained BERT model for sequence
classification, we show that machine translation and human translation can be
classified with an accuracy above chance level, which suggests that machine
translation and human translation are different in a systematic way. The
classification accuracy of machine translation is much higher than of human
translation. We show that this may be explained by the difference in lexical
diversity between machine translation and human translation. If machine
translation has independent patterns from human translation, automatic metrics
which measure the deviation of machine translation from human translation may
conflate difference with quality. Our experiment with two different types of
automatic metrics shows correlation with the result of the classification task.
Therefore, we suggest the difference in lexical diversity between machine
translation and human translation be given more attention in machine
translation evaluation.
- Abstract(参考訳): トリグラムモデルと事前学習されたbertモデルを用いてシーケンス分類を微調整することにより,機械翻訳と人間の翻訳を確率レベル以上の精度で分類できることを示し,機械翻訳と人間の翻訳が系統的に異なることを示唆する。
機械翻訳の分類精度は人間の翻訳よりもはるかに高い。
このことは機械翻訳と人間の翻訳の語彙的多様性の違いによって説明できる可能性がある。
機械翻訳が人間の翻訳から独立したパターンを持つ場合、人間の翻訳から機械翻訳の逸脱を測定する自動メトリクスは、品質との違いを説明できる。
本実験では,2種類の自動測定値を用いて,分類作業の結果と相関関係を示す。
そこで本研究では,機械翻訳評価において,機械翻訳と人間翻訳の語彙的多様性の違いが注目されている。
関連論文リスト
- An Empirical Study on the Robustness of Massively Multilingual Neural Machine Translation [40.08063412966712]
多言語多言語ニューラルマシン翻訳(MMNMT)は低リソース言語の翻訳品質を高めることが証明されている。
インドネシア・中国語翻訳のためのロバストネス評価ベンチマークデータセットを作成する。
このデータセットは、異なるサイズの4つのNLLB-200モデルを使用して、自動的に中国語に翻訳される。
論文 参考訳(メタデータ) (2024-05-13T12:01:54Z) - Incorporating Human Translator Style into English-Turkish Literary
Machine Translation [0.26168876987285306]
我々は,翻訳者のスタイリスティックな特徴を考慮した機械翻訳モデルを開発した。
対象機械翻訳において,人間の翻訳スタイルを高度に再現できることが示される。
論文 参考訳(メタデータ) (2023-07-21T09:39:50Z) - Measuring Sentiment Bias in Machine Translation [1.567333808864147]
生成モデルによってテキストに誘導されるバイアスは、近年ますます大きな話題となっている。
2つの並列コーパス上の5つの異なる言語に対する3つのオープンアクセス機械翻訳モデルを比較した。
我々の統計テストはラベルの確率分布の変化を示しているが、翻訳プロセスによって引き起こされるバイアスを仮定するのに十分な一貫性があるように見えるものは見つからない。
論文 参考訳(メタデータ) (2023-06-12T14:40:29Z) - Revisiting Machine Translation for Cross-lingual Classification [91.43729067874503]
この分野のほとんどの研究は、機械翻訳コンポーネントではなく多言語モデルに焦点を当てている。
より強力なMTシステムを用いて、原文のトレーニングと機械翻訳テキストの推論のミスマッチを緩和することにより、翻訳テストは以前想定していたよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-23T16:56:10Z) - Decomposed Prompting for Machine Translation Between Related Languages
using Large Language Models [55.35106713257871]
DecoMTは、単語チャンク翻訳のシーケンスに翻訳プロセスを分解する、数発のプロンプトの新しいアプローチである。
DecoMTはBLOOMモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-05-22T14:52:47Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - Extrinsic Evaluation of Machine Translation Metrics [78.75776477562087]
文レベルでの翻訳と翻訳の良さを区別する上で,自動尺度が信頼性が高いかどうかは不明である。
我々は,3つの下流言語タスクにおいて,最も広く使用されているMTメトリクス(chrF,COMET,BERTScoreなど)のセグメントレベル性能を評価する。
実験の結果,各指標は下流結果の外部評価と負の相関を示すことがわかった。
論文 参考訳(メタデータ) (2022-12-20T14:39:58Z) - Using CollGram to Compare Formulaic Language in Human and Neural Machine
Translation [0.0]
質の高い新聞記事の人間とニューラルマシン翻訳における公式シーケンスの比較では、ニューラルマシン翻訳は低周波であるが強関連な公式シーケンスを含んでいることが示されている。
これらの差は統計的に有意であり、効果の大きさはほぼ常に中程度であった。
論文 参考訳(メタデータ) (2021-07-08T06:30:35Z) - Decoding and Diversity in Machine Translation [90.33636694717954]
NMTが楽しむBLEUスコアに対して支払う費用の多様性の違いを特徴付ける。
本研究は,ジェンダー代名詞を翻訳する際に,検索が既知バイアスの正解源となることを示唆する。
論文 参考訳(メタデータ) (2020-11-26T21:09:38Z) - Computer Assisted Translation with Neural Quality Estimation and
Automatic Post-Editing [18.192546537421673]
本稿では,機械翻訳出力の品質推定と自動編集のためのエンドツーエンドのディープラーニングフレームワークを提案する。
我々のゴールは、誤り訂正の提案を提供することであり、解釈可能なモデルにより、人間の翻訳者の負担を軽減することである。
論文 参考訳(メタデータ) (2020-09-19T00:29:00Z) - A Set of Recommendations for Assessing Human-Machine Parity in Language
Translation [87.72302201375847]
我々は、ハサンらの中国語から英語への翻訳調査を再評価する。
専門家による翻訳では誤りが著しく少なかった。
論文 参考訳(メタデータ) (2020-04-03T17:49:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。