論文の概要: Is it Great or Terrible? Preserving Sentiment in Neural Machine
Translation of Arabic Reviews
- arxiv url: http://arxiv.org/abs/2010.13814v1
- Date: Mon, 26 Oct 2020 18:01:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 18:55:56.961766
- Title: Is it Great or Terrible? Preserving Sentiment in Neural Machine
Translation of Arabic Reviews
- Title(参考訳): それは素晴らしいか、恐ろしいか?
アラビア語の機械翻訳における感情の保存
- Authors: Hadeel Saadany, Constantin Orasan
- Abstract要約: 本稿では,アラビア語から英語への書評の翻訳に関わる課題について考察する。
我々は、感情極性の誤った翻訳につながる誤りに焦点を当てる。
我々の分析は、アラビア語のオンライン翻訳ツールの出力が、中立なターゲットテキストを生成することによって、感情の伝達に失敗する可能性があることを示している。
- 参考スコア(独自算出の注目度): 3.553493344868413
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since the advent of Neural Machine Translation (NMT) approaches there has
been a tremendous improvement in the quality of automatic translation. However,
NMT output still lacks accuracy in some low-resource languages and sometimes
makes major errors that need extensive post-editing. This is particularly
noticeable with texts that do not follow common lexico-grammatical standards,
such as user generated content (UGC). In this paper we investigate the
challenges involved in translating book reviews from Arabic into English, with
particular focus on the errors that lead to incorrect translation of sentiment
polarity. Our study points to the special characteristics of Arabic UGC,
examines the sentiment transfer errors made by Google Translate of Arabic UGC
to English, analyzes why the problem occurs, and proposes an error typology
specific of the translation of Arabic UGC. Our analysis shows that the output
of online translation tools of Arabic UGC can either fail to transfer the
sentiment at all by producing a neutral target text, or completely flips the
sentiment polarity of the target word or phrase and hence delivers a wrong
affect message. We address this problem by fine-tuning an NMT model with
respect to sentiment polarity showing that this approach can significantly help
with correcting sentiment errors detected in the online translation of Arabic
UGC.
- Abstract(参考訳): ニューラルネットワーク翻訳(NMT)の登場以来、自動翻訳の品質は大幅に改善されてきた。
しかし、NMT出力は、一部の低リソース言語では精度に欠けており、時には大規模な後編集を必要とする大きなエラーを発生させることがある。
これは、ユーザ生成コンテンツ(UGC)のような一般的な語彙文法標準に従わないテキストで特に顕著である。
本稿では,アラビア語から英語への書評の翻訳にかかわる課題,特に感情極性の誤訳につながる誤りに着目した。
本研究は, アラビア語 UGC の特殊特性を指摘するとともに, アラビア語 UGC の Google Translate が英語に翻訳した感情伝達誤差を調査し, 問題の原因を分析し, アラビア語 UGC の翻訳に特有な誤り型付けを提案する。
我々の分析は、アラビア語 UGC のオンライン翻訳ツールの出力は、中立なターゲットテキストを生成することによって、感情の伝達に失敗するか、あるいはターゲット単語やフレーズの感情の極性を完全に反転させ、その結果、誤った感情メッセージを提供する可能性があることを示している。
本研究では, 感情極性に関するNMTモデルを微調整することにより, アラビア語 UGC のオンライン翻訳で検出された感情誤りの修正に有効であることを示す。
関連論文リスト
- xTower: A Multilingual LLM for Explaining and Correcting Translation Errors [22.376508000237042]
xTower は TowerBase 上に構築されたオープンな大規模言語モデル (LLM) である。
翻訳品質の大幅な向上を示すために, 様々な実験装置を用いてxTowerを検証した。
論文 参考訳(メタデータ) (2024-06-27T18:51:46Z) - Understanding and Addressing the Under-Translation Problem from the Perspective of Decoding Objective [72.83966378613238]
最新のニューラル・マシン・トランスレーション(NMT)システムでは、アンダー・トランスレーションとオーバー・トランスレーションの2つの課題が残っている。
我々は,NMTにおけるアンダートランスレーションの根本原因を詳細に分析し,デコード目的の観点から解説する。
本研究は,低翻訳の検知器としてEOS(End Of Sentence)予測の信頼性を活用し,低翻訳のリスクが高い候補を罰する信頼性に基づくペナルティを強化することを提案する。
論文 参考訳(メタデータ) (2024-05-29T09:25:49Z) - Mitigating Hallucinations and Off-target Machine Translation with
Source-Contrastive and Language-Contrastive Decoding [53.84948040596055]
修正された復号化目標を用いて、障害ケースを緩和する2つの関連手法を提案する。
大規模多言語モデルM2M-100 (418M) とSMaLL-100の実験は、これらの手法が幻覚やターゲット外の翻訳を抑制することを示した。
論文 参考訳(メタデータ) (2023-09-13T17:15:27Z) - Evaluation of Chinese-English Machine Translation of Emotion-Loaded
Microblog Texts: A Human Annotated Dataset for the Quality Assessment of
Emotion Translation [7.858458986992082]
本稿では,感情を重畳したテキストの翻訳において,現在の機械翻訳(MT)ツールがどのように機能するかに焦点を当てる。
本稿では,Multidimensional Quality Metrics(MQM)に基づく評価フレームワークを提案し,MT出力の詳細な誤差解析を行う。
論文 参考訳(メタデータ) (2023-06-20T21:22:45Z) - On the Copying Problem of Unsupervised NMT: A Training Schedule with a
Language Discriminator Loss [120.19360680963152]
unsupervised neural machine translation (UNMT)は多くの言語で成功している。
コピー問題、すなわち、入力文の一部を翻訳として直接コピーする問題は、遠い言語対に共通している。
本稿では,言語識別器の損失を取り入れた,シンプルだが効果的な訓練スケジュールを提案する。
論文 参考訳(メタデータ) (2023-05-26T18:14:23Z) - A Semi-supervised Approach for a Better Translation of Sentiment in
Dialectical Arabic UGT [2.6763498831034034]
NMTシステムのトレーニングにモノリンガルデータと並列データの両方を利用する半教師付きアプローチを導入する。
提案システムは,アラビア語の方言UGTのオンライン翻訳で検出された感情誤りの訂正に有効であることを示す。
論文 参考訳(メタデータ) (2022-10-21T11:55:55Z) - Rethink about the Word-level Quality Estimation for Machine Translation
from Human Judgement [57.72846454929923]
ベンチマークデータセットであるemphHJQEを作成し、専門家翻訳者が不適切な翻訳語を直接アノテートする。
本稿では,タグリファインメント戦略と木ベースのアノテーション戦略という2つのタグ補正戦略を提案し,TERベースの人工QEコーパスをemphHJQEに近づける。
その結果,提案したデータセットは人間の判断と一致しており,また,提案したタグ補正戦略の有効性も確認できた。
論文 参考訳(メタデータ) (2022-09-13T02:37:12Z) - ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality
Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。
統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文 参考訳(メタデータ) (2021-07-30T17:58:54Z) - It's not a Non-Issue: Negation as a Source of Error in Machine
Translation [33.991817055535854]
本稿では,17の翻訳方向をテストベッドとして用いた機械翻訳システムにおいて,翻訳否定が問題となるかを検討する。
実際、否定の存在は下流の品質に大きく影響し、場合によっては60%以上の品質低下をもたらします。
論文 参考訳(メタデータ) (2020-10-12T03:34:44Z) - It's Easier to Translate out of English than into it: Measuring Neural
Translation Difficulty by Cross-Mutual Information [90.35685796083563]
クロスミューチュアル情報(英: Cross-mutual information、XMI)は、機械翻訳の難易度に関する非対称情報理論の指標である。
XMIは、ほとんどのニューラルマシン翻訳モデルの確率的性質を利用する。
本稿では,現代ニューラル翻訳システムを用いた言語間翻訳の難易度に関する最初の体系的および制御的な研究について述べる。
論文 参考訳(メタデータ) (2020-05-05T17:38:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。