論文の概要: Evaluation of Google Translate for Mandarin Chinese translation using sentiment and semantic analysis
- arxiv url: http://arxiv.org/abs/2409.04964v2
- Date: Mon, 16 Sep 2024 10:00:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-17 22:28:35.715517
- Title: Evaluation of Google Translate for Mandarin Chinese translation using sentiment and semantic analysis
- Title(参考訳): 感情分析と意味分析を用いた中国語翻訳におけるGoogle翻訳の評価
- Authors: Xuechun Wang, Rodney Beard, Rohitash Chandra,
- Abstract要約: 大規模言語モデル(LLM)を用いた機械翻訳は,世界規模で大きな影響を与えている。
中国語は、中国の政府やメディアによる通信に用いられる公用語である。
本研究では、感情分析と意味分析を用いて、人間の専門家によるGoogle翻訳の翻訳品質の自動評価を行う。
- 参考スコア(独自算出の注目度): 1.3999481573773074
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Machine translation using large language models (LLMs) is having a significant global impact, making communication easier. Mandarin Chinese is the official language used for communication by the government and media in China. In this study, we provide an automated assessment of translation quality of Google Translate with human experts using sentiment and semantic analysis. In order to demonstrate our framework, we select the classic early twentieth-century novel 'The True Story of Ah Q' with selected Mandarin Chinese to English translations. We use Google Translate to translate the given text into English and then conduct a chapter-wise sentiment analysis and semantic analysis to compare the extracted sentiments across the different translations. Our results indicate that the precision of Google Translate differs both in terms of semantic and sentiment analysis when compared to human expert translations. We find that Google Translate is unable to translate some of the specific words or phrases in Chinese, such as Chinese traditional allusions. The mistranslations may be due to lack of contextual significance and historical knowledge of China.
- Abstract(参考訳): 大規模言語モデル(LLM)を用いた機械翻訳は、コミュニケーションを容易にし、世界規模で大きな影響を与えている。
中国語は、中国の政府やメディアによる通信に用いられる公用語である。
本研究では、感情分析と意味分析を用いて、人間の専門家によるGoogle翻訳の翻訳品質の自動評価を行う。
この枠組みを実証するため、20世紀前半の古典的小説「Ah Qの真話」を中国語から英語への翻訳で選択した。
Google Translateを使って、与えられたテキストを英語に翻訳し、章ごとの感情分析と意味分析を行い、異なる翻訳間で抽出された感情を比較する。
以上の結果から,Google翻訳の精度は,人文翻訳と比較して意味的・感情的分析の両面で異なることが示唆された。
Google Translateは中国語の特定の単語やフレーズを翻訳できないことがわかりました。
この誤訳は、中国の文脈的重要性と歴史的知識の欠如による可能性がある。
関連論文リスト
- Creative and Context-Aware Translation of East Asian Idioms with GPT-4 [20.834802250633686]
GPT-4は東アジアのイディオムの高品質な翻訳を生成できる。
低コストで、我々のコンテキスト対応翻訳は、人間のベースラインよりも、イディオム当たりの高品質な翻訳を実現することができる。
論文 参考訳(メタデータ) (2024-10-01T18:24:43Z) - Crossing the Threshold: Idiomatic Machine Translation through Retrieval
Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。
我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。
自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文 参考訳(メタデータ) (2023-10-10T23:47:25Z) - Discourse Representation Structure Parsing for Chinese [8.846860617823005]
本研究では,中国語意味表現のためのラベル付きデータがない場合の中国語意味解析の実現可能性について検討する。
そこで本研究では,中国語意味解析のためのテストスイートを提案し,解析性能の詳細な評価を行う。
実験の結果,中国語の意味解析の難易度は,主に副詞が原因であることが示唆された。
論文 参考訳(メタデータ) (2023-06-16T09:47:45Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - An evaluation of Google Translate for Sanskrit to English translation
via sentiment and semantic analysis [0.31317409221921144]
2022年、サンスクリット語はGoogle翻訳エンジンに追加された。
本研究では,Bhagavad Gitaを用いて,サンスクリット語のGoogle翻訳を評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-28T04:24:55Z) - Machine Translation for Accessible Multi-Language Text Analysis [1.5484595752241124]
英語への翻訳後に計算した英語学習尺度の精度が十分であることを示す。
これは、感情分析、トピック分析、単語の埋め込みという3つの主要な分析で、16以上の言語で示します。
論文 参考訳(メタデータ) (2023-01-20T04:11:38Z) - ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality
Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。
統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文 参考訳(メタデータ) (2021-07-30T17:58:54Z) - Improving Sentiment Analysis over non-English Tweets using Multilingual
Transformers and Automatic Translation for Data-Augmentation [77.69102711230248]
我々は、英語のつぶやきを事前学習し、自動翻訳を用いてデータ拡張を適用して非英語の言語に適応する多言語トランスフォーマーモデルを提案する。
我々のフランス語、スペイン語、ドイツ語、イタリア語での実験は、この手法が非英語のツイートの小さなコーパスよりも、トランスフォーマーの結果を改善する効果的な方法であることを示唆している。
論文 参考訳(メタデータ) (2020-10-07T15:44:55Z) - Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。
自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。
また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文 参考訳(メタデータ) (2020-04-09T17:54:30Z) - A Set of Recommendations for Assessing Human-Machine Parity in Language
Translation [87.72302201375847]
我々は、ハサンらの中国語から英語への翻訳調査を再評価する。
専門家による翻訳では誤りが著しく少なかった。
論文 参考訳(メタデータ) (2020-04-03T17:49:56Z) - A Corpus of Adpositional Supersenses for Mandarin Chinese [15.757892250956715]
マンダリン中国語ですべての表記が意味論的に注釈付けされたコーパスについて述べる。
提案手法は, 言語に依存しない意味的基準に従って, 超感覚の一般的な集合を定義する枠組みに適応する。
このスーパーセンスカテゴリーは、英語と構文的差異があるにもかかわらず、中国語の表記に適していることがわかった。
論文 参考訳(メタデータ) (2020-03-18T18:59:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。