論文の概要: Evaluation of Google Translate for Mandarin Chinese translation using sentiment and semantic analysis
- arxiv url: http://arxiv.org/abs/2409.04964v1
- Date: Sun, 8 Sep 2024 04:03:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 19:50:12.233925
- Title: Evaluation of Google Translate for Mandarin Chinese translation using sentiment and semantic analysis
- Title(参考訳): 感情分析と意味分析を用いた中国語翻訳におけるGoogle翻訳の評価
- Authors: Xuechun Wang, Rodney Beard, Rohitash Chandra,
- Abstract要約: 大規模言語モデル(LLM)を用いた機械翻訳は,世界規模で大きな影響を与えている。
本研究では、感情分析と意味分析を用いて、人間の専門家による機械翻訳モデルの自動評価を行う。
Google翻訳は中国語の特定の単語やフレーズを翻訳することができない。
- 参考スコア(独自算出の注目度): 1.3999481573773074
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Machine translation using large language models (LLMs) is having a significant global impact, making communication easier. Mandarin Chinese is the official language used for communication by the government, education institutes, and media in China. In this study, we provide an automated assessment of machine translation models with human experts using sentiment and semantic analysis. In order to demonstrate our framework, we select classic early twentieth-century novel 'The True Story of Ah Q' with selected Mandarin Chinese to English translations. We also us Google Translate to generate the given text into English and then conduct a chapter-wise sentiment analysis and semantic analysis to compare the extracted sentiments across the different translations. We utilise LLMs for semantic and sentiment analysis. Our results indicate that the precision of Google Translate differs both in terms of semantic and sentiment analysis when compared to human expert translations. We find that Google Translate is unable to translate some of the specific words or phrases in Chinese, such as Chinese traditional allusions. The mistranslations have to its lack of contextual significance and historical knowledge of China. Thus, this framework brought us some new insights about machine translation for Chinese Mandarin. The future work can explore other languages or types of texts with this framework.
- Abstract(参考訳): 大規模言語モデル(LLM)を用いた機械翻訳は、コミュニケーションを容易にし、世界規模で大きな影響を与えている。
中国語は、中国における政府、教育機関、メディアによるコミュニケーションに使用される公用語である。
本研究では、感情分析と意味分析を用いて、人間の専門家による機械翻訳モデルの自動評価を行う。
この枠組みを実証するため、20世紀前半の古典的小説「Ah Qの真話」を中国語から英語への翻訳で選択した。
また、Google Translateを使用して、与えられたテキストを英語に変換し、章ごとの感情分析と意味分析を行い、異なる翻訳間で抽出された感情を比較する。
LLMを意味分析や感情分析に活用する。
以上の結果から,Google翻訳の精度は,人文翻訳と比較して意味的・感情的分析の両面で異なることが示唆された。
Google Translateは中国語の特定の単語やフレーズを翻訳できないことがわかりました。
この誤訳は、中国の文脈的重要性と歴史的知識の欠如に起因している。
このように、この枠組みは中国マンダリンの機械翻訳に関する新たな洞察をもたらした。
将来の作業は、このフレームワークで他の言語やテキストのタイプを探索することができる。
関連論文リスト
- (Perhaps) Beyond Human Translation: Harnessing Multi-Agent Collaboration for Translating Ultra-Long Literary Texts [52.18246881218829]
本稿では,大言語モデル(LLM)をベースとした多エージェントフレームワークを,TransAgentsという企業として実装した。
本システムの有効性を評価するため,モノリンガル・ヒューマン・プライス(MHP)とバイリンガル・LLM・プライス(BLP)の2つの革新的な評価戦略を提案する。
論文 参考訳(メタデータ) (2024-05-20T05:55:08Z) - Crossing the Threshold: Idiomatic Machine Translation through Retrieval
Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。
我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。
自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文 参考訳(メタデータ) (2023-10-10T23:47:25Z) - Incorporating Human Translator Style into English-Turkish Literary
Machine Translation [0.26168876987285306]
我々は,翻訳者のスタイリスティックな特徴を考慮した機械翻訳モデルを開発した。
対象機械翻訳において,人間の翻訳スタイルを高度に再現できることが示される。
論文 参考訳(メタデータ) (2023-07-21T09:39:50Z) - Discourse Representation Structure Parsing for Chinese [8.846860617823005]
本研究では,中国語意味表現のためのラベル付きデータがない場合の中国語意味解析の実現可能性について検討する。
そこで本研究では,中国語意味解析のためのテストスイートを提案し,解析性能の詳細な評価を行う。
実験の結果,中国語の意味解析の難易度は,主に副詞が原因であることが示唆された。
論文 参考訳(メタデータ) (2023-06-16T09:47:45Z) - Shuo Wen Jie Zi: Rethinking Dictionaries and Glyphs for Chinese Language
Pre-training [50.100992353488174]
辞書知識と漢字の構造を持つ中国語PLMの意味理解能力を高める新しい学習パラダイムであるCDBERTを紹介する。
我々はCDBERTの2つの中核モジュールを Shuowen と Jiezi と名付け、そこで Shuowen は中国語辞書から最も適切な意味を取り出す過程を指す。
本パラダイムは,従来の中国語PLMのタスク間における一貫した改善を実証する。
論文 参考訳(メタデータ) (2023-05-30T05:48:36Z) - Exploring Human-Like Translation Strategy with Large Language Models [93.49333173279508]
大規模言語モデル(LLM)は、一般的なシナリオにおいて印象的な機能を示している。
本研究は,マルチアスペクト・プロンプトと選択のためのMAPSフレームワークを提案する。
品質推定に基づく選択機構を用いて,ノイズや不ヘッピーな知識を抽出する。
論文 参考訳(メタデータ) (2023-05-06T19:03:12Z) - Machine Translation for Accessible Multi-Language Text Analysis [1.5484595752241124]
英語への翻訳後に計算した英語学習尺度の精度が十分であることを示す。
これは、感情分析、トピック分析、単語の埋め込みという3つの主要な分析で、16以上の言語で示します。
論文 参考訳(メタデータ) (2023-01-20T04:11:38Z) - ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality
Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。
統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文 参考訳(メタデータ) (2021-07-30T17:58:54Z) - Time-Aware Ancient Chinese Text Translation and Inference [6.787414471399024]
我々は、古代漢文の翻訳をめぐる課題に対処することを目指している。
時代の違いによる言語的なギャップは、質の悪い翻訳をもたらす。
ほとんどの翻訳は、しばしばテキストを理解するのに非常に重要な文脈情報を欠いている。
論文 参考訳(メタデータ) (2021-07-07T12:23:52Z) - Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。
自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。
また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文 参考訳(メタデータ) (2020-04-09T17:54:30Z) - A Corpus of Adpositional Supersenses for Mandarin Chinese [15.757892250956715]
マンダリン中国語ですべての表記が意味論的に注釈付けされたコーパスについて述べる。
提案手法は, 言語に依存しない意味的基準に従って, 超感覚の一般的な集合を定義する枠組みに適応する。
このスーパーセンスカテゴリーは、英語と構文的差異があるにもかかわらず、中国語の表記に適していることがわかった。
論文 参考訳(メタデータ) (2020-03-18T18:59:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。