論文の概要: A Semi-supervised Approach for a Better Translation of Sentiment in
Dialectical Arabic UGT
- arxiv url: http://arxiv.org/abs/2210.11899v1
- Date: Fri, 21 Oct 2022 11:55:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 14:54:02.868751
- Title: A Semi-supervised Approach for a Better Translation of Sentiment in
Dialectical Arabic UGT
- Title(参考訳): アラビア語方言UGTにおける感性翻訳のための半教師付きアプローチ
- Authors: Hadeel Saadany, Constantin Orasan, Emad Mohamed, Ashraf Tantawy
- Abstract要約: NMTシステムのトレーニングにモノリンガルデータと並列データの両方を利用する半教師付きアプローチを導入する。
提案システムは,アラビア語の方言UGTのオンライン翻訳で検出された感情誤りの訂正に有効であることを示す。
- 参考スコア(独自算出の注目度): 2.6763498831034034
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the online world, Machine Translation (MT) systems are extensively used to
translate User-Generated Text (UGT) such as reviews, tweets, and social media
posts, where the main message is often the author's positive or negative
attitude towards the topic of the text. However, MT systems still lack accuracy
in some low-resource languages and sometimes make critical translation errors
that completely flip the sentiment polarity of the target word or phrase and
hence delivers a wrong affect message. This is particularly noticeable in texts
that do not follow common lexico-grammatical standards such as the dialectical
Arabic (DA) used on online platforms. In this research, we aim to improve the
translation of sentiment in UGT written in the dialectical versions of the
Arabic language to English. Given the scarcity of gold-standard parallel data
for DA-EN in the UGT domain, we introduce a semi-supervised approach that
exploits both monolingual and parallel data for training an NMT system
initialised by a cross-lingual language model trained with supervised and
unsupervised modeling objectives. We assess the accuracy of sentiment
translation by our proposed system through a numerical 'sentiment-closeness'
measure as well as human evaluation. We will show that our semi-supervised MT
system can significantly help with correcting sentiment errors detected in the
online translation of dialectical Arabic UGT.
- Abstract(参考訳): オンラインの世界では、レビュー、ツイート、ソーシャルメディア投稿などのユーザー生成テキスト(ugt)を翻訳するために機械翻訳(mt)システムが広く使われている。
しかし、mtシステムは一部の低リソース言語では正確性に欠けており、ターゲットの単語やフレーズの感情の極性を完全に反転させる重要な翻訳誤りを生じることがある。
これは特に、オンラインプラットフォームで使われる方言アラビア語(DA)のような一般的な語彙文法標準に従わないテキストで顕著である。
本研究では、アラビア語の方言版で書かれたUGTの感情の英語への翻訳を改善することを目的とする。
UGT領域におけるDA-ENのゴールドスタンダード並列データの不足を踏まえ,教師付きおよび教師なしモデリング目的を訓練した言語間モデルにより初期化したNMTシステムのトレーニングに,単言語と並列データの両方を活用する半教師付きアプローチを導入する。
提案システムによる感情翻訳の精度を,人間評価とともに数値的「感性閉鎖性」尺度を用いて評価する。
我々の半教師付きMTシステムは、方言のアラビア語 UGT のオンライン翻訳で検出された感情誤りの修正に大いに役立ちます。
関連論文リスト
- Understanding and Addressing the Under-Translation Problem from the Perspective of Decoding Objective [72.83966378613238]
最新のニューラル・マシン・トランスレーション(NMT)システムでは、アンダー・トランスレーションとオーバー・トランスレーションの2つの課題が残っている。
我々は,NMTにおけるアンダートランスレーションの根本原因を詳細に分析し,デコード目的の観点から解説する。
本研究は,低翻訳の検知器としてEOS(End Of Sentence)予測の信頼性を活用し,低翻訳のリスクが高い候補を罰する信頼性に基づくペナルティを強化することを提案する。
論文 参考訳(メタデータ) (2024-05-29T09:25:49Z) - It is Not as Good as You Think! Evaluating Simultaneous Machine
Translation on Interpretation Data [58.105938143865906]
我々は、実解釈データに基づいて、SiMTシステムをトレーニングし、テストすべきであると主張している。
以上の結果から,SiMTモデルが翻訳データと解釈データで評価された場合,最大13.83BLEUスコアの違いが明らかになった。
論文 参考訳(メタデータ) (2021-10-11T12:27:07Z) - Sentiment-Aware Measure (SAM) for Evaluating Sentiment Transfer by
Machine Translation Systems [0.0]
感情が主メッセージであるテキストの翻訳において、人間の翻訳者は感情を伝達する単語に特に注意を向ける。
MTシステムによるテキスト中の感情メッセージの翻訳精度を評価するのに適した数値的感情閉鎖性尺度を提案する。
論文 参考訳(メタデータ) (2021-09-30T07:35:56Z) - BLEU, METEOR, BERTScore: Evaluation of Metrics Performance in Assessing
Critical Translation Errors in Sentiment-oriented Text [1.4213973379473654]
オンラインコンテンツの機械翻訳(MT)は、複数の言語で書かれた投稿の処理に一般的に使用される。
本稿では,機械翻訳の致命的誤りを検出するための自動品質指標の有効性を評価する。
我々は、感情クリティカルなエラーの検出をより堅牢にするために、自動メトリクスの微調整が必要であると結論付けている。
論文 参考訳(メタデータ) (2021-09-29T07:51:17Z) - When Does Translation Require Context? A Data-driven, Multilingual
Exploration [71.43817945875433]
談話の適切な処理は機械翻訳(MT)の品質に大きく貢献する
文脈認識型MTにおける最近の研究は、評価中に少量の談話現象を標的にしようとしている。
談話現象のモデル性能を識別・評価するタグの集合である,多言語談話認識ベンチマークを開発した。
論文 参考訳(メタデータ) (2021-09-15T17:29:30Z) - Improving Multilingual Translation by Representation and Gradient
Regularization [82.42760103045083]
表現レベルと勾配レベルの両方でNMTモデルを正規化するための共同手法を提案する。
提案手法は,オフターゲット翻訳の発生率の低減とゼロショット翻訳性能の向上に有効であることを示す。
論文 参考訳(メタデータ) (2021-09-10T10:52:21Z) - ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality
Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。
統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文 参考訳(メタデータ) (2021-07-30T17:58:54Z) - Sentiment-based Candidate Selection for NMT [2.580271290008534]
本稿では,機械翻訳(mt)候補選択プロセスに自動感情スコアを組み込むデコーダ側手法を提案する。
我々は、英語とスペイン語の感情分類器を訓練し、ビームサーチによるベースラインMTモデルによって生成されたn-best候補を用いて、原文の感情スコアと翻訳の絶対差を最小化する候補を選択する。
人間の評価結果から,パイプライン上に構築されたオープンソースのMTモデルと比較して,ベースライン翻訳は口語的,感情重大なソーステキストよりも正確であることが示唆された。
論文 参考訳(メタデータ) (2021-04-10T19:01:52Z) - Is it Great or Terrible? Preserving Sentiment in Neural Machine
Translation of Arabic Reviews [3.553493344868413]
本稿では,アラビア語から英語への書評の翻訳に関わる課題について考察する。
我々は、感情極性の誤った翻訳につながる誤りに焦点を当てる。
我々の分析は、アラビア語のオンライン翻訳ツールの出力が、中立なターゲットテキストを生成することによって、感情の伝達に失敗する可能性があることを示している。
論文 参考訳(メタデータ) (2020-10-26T18:01:52Z) - It's Easier to Translate out of English than into it: Measuring Neural
Translation Difficulty by Cross-Mutual Information [90.35685796083563]
クロスミューチュアル情報(英: Cross-mutual information、XMI)は、機械翻訳の難易度に関する非対称情報理論の指標である。
XMIは、ほとんどのニューラルマシン翻訳モデルの確率的性質を利用する。
本稿では,現代ニューラル翻訳システムを用いた言語間翻訳の難易度に関する最初の体系的および制御的な研究について述べる。
論文 参考訳(メタデータ) (2020-05-05T17:38:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。