Fugu-MT 論文翻訳(概要): Evaluation of Google Translate for Mandarin Chinese translation using sentiment and semantic analysis

論文の概要: Evaluation of Google Translate for Mandarin Chinese translation using sentiment and semantic analysis

arxiv url: http://arxiv.org/abs/2409.04964v1
Date: Sun, 8 Sep 2024 04:03:55 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-10 19:50:12.233925
Title: Evaluation of Google Translate for Mandarin Chinese translation using sentiment and semantic analysis
Title（参考訳）: 感情分析と意味分析を用いた中国語翻訳におけるGoogle翻訳の評価
Authors: Xuechun Wang, Rodney Beard, Rohitash Chandra,
Abstract要約: 大規模言語モデル(LLM)を用いた機械翻訳は,世界規模で大きな影響を与えている。本研究では、感情分析と意味分析を用いて、人間の専門家による機械翻訳モデルの自動評価を行う。 Google翻訳は中国語の特定の単語やフレーズを翻訳することができない。
参考スコア（独自算出の注目度）: 1.3999481573773074
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Machine translation using large language models (LLMs) is having a significant global impact, making communication easier. Mandarin Chinese is the official language used for communication by the government, education institutes, and media in China. In this study, we provide an automated assessment of machine translation models with human experts using sentiment and semantic analysis. In order to demonstrate our framework, we select classic early twentieth-century novel 'The True Story of Ah Q' with selected Mandarin Chinese to English translations. We also us Google Translate to generate the given text into English and then conduct a chapter-wise sentiment analysis and semantic analysis to compare the extracted sentiments across the different translations. We utilise LLMs for semantic and sentiment analysis. Our results indicate that the precision of Google Translate differs both in terms of semantic and sentiment analysis when compared to human expert translations. We find that Google Translate is unable to translate some of the specific words or phrases in Chinese, such as Chinese traditional allusions. The mistranslations have to its lack of contextual significance and historical knowledge of China. Thus, this framework brought us some new insights about machine translation for Chinese Mandarin. The future work can explore other languages or types of texts with this framework.
Abstract（参考訳）: 大規模言語モデル(LLM)を用いた機械翻訳は、コミュニケーションを容易にし、世界規模で大きな影響を与えている。中国語は、中国における政府、教育機関、メディアによるコミュニケーションに使用される公用語である。本研究では、感情分析と意味分析を用いて、人間の専門家による機械翻訳モデルの自動評価を行う。この枠組みを実証するため、20世紀前半の古典的小説「Ah Qの真話」を中国語から英語への翻訳で選択した。また、Google Translateを使用して、与えられたテキストを英語に変換し、章ごとの感情分析と意味分析を行い、異なる翻訳間で抽出された感情を比較する。 LLMを意味分析や感情分析に活用する。以上の結果から,Google翻訳の精度は,人文翻訳と比較して意味的・感情的分析の両面で異なることが示唆された。 Google Translateは中国語の特定の単語やフレーズを翻訳できないことがわかりました。この誤訳は、中国の文脈的重要性と歴史的知識の欠如に起因している。このように、この枠組みは中国マンダリンの機械翻訳に関する新たな洞察をもたらした。将来の作業は、このフレームワークで他の言語やテキストのタイプを探索することができる。

関連論文リスト

Liaozhai through the Looking-Glass: On Paratextual Explicitation of Culture-Bound Terms in Machine Translation [70.43884512651668]
我々は、文学・翻訳研究からジェネットのパラテキスト論(1987年)を定式化し、機械翻訳におけるパラテキスト明示の課題を紹介した。古典中国語の短編集集Liaozhaiの4つの英訳から560の専門家対応パラテキストのデータセットを構築した。本研究は,言語的等価性を超えた機械翻訳におけるパラテクスト的明示の可能性を示すものである。
論文参考訳（メタデータ） (2025-09-27T16:27:36Z)
Do LLMs Understand Your Translations? Evaluating Paragraph-level MT with Question Answering [68.3400058037817]
本稿では,TREQA(Translation Evaluation via Question-Answering)について紹介する。我々は,TREQAが最先端のニューラルネットワークとLLMベースのメトリクスより優れていることを示し,代用段落レベルの翻訳をランク付けする。
論文参考訳（メタデータ） (2025-04-10T09:24:54Z)
An evaluation of LLMs and Google Translate for translation of selected Indian languages via sentiment and semantic analyses [0.17999333451993949]
大規模言語モデル(LLM)は低リソース言語を含む言語翻訳において顕著である。本研究では,サンスクリット語,テルグ語,ヒンディー語を含むインドの言語における選択されたLLMの意味的・感情的分析を用いた。
論文参考訳（メタデータ） (2025-03-27T11:35:40Z)
DRT: Deep Reasoning Translation via Long Chain-of-Thought [89.48208612476068]
本稿では,長いCoTをニューラルネットワーク翻訳(MT)に適用する試みであるDRTを紹介する。まず、既存の文献から模範文や比喩文を含む文を抽出し、その後、長い思考を通してこれらの文を翻訳する多エージェントフレームワークを開発する。 Qwen2.5とLLama-3.1をバックボーンとして使用することで、DRTモデルは機械翻訳中に思考プロセスを学ぶことができる。
論文参考訳（メタデータ） (2024-12-23T11:55:33Z)
The Role of Handling Attributive Nouns in Improving Chinese-To-English Machine Translation [5.64086253718739]
特に、中国語の帰属名詞による翻訳課題を対象とし、英語翻訳における曖昧さをしばしば引き起こす。省略粒子X('DE')を手動で挿入することで、この臨界関数ワードの処理方法を改善する。
論文参考訳（メタデータ） (2024-12-18T20:37:52Z)
Creative and Context-Aware Translation of East Asian Idioms with GPT-4 [20.834802250633686]
GPT-4は東アジアのイディオムの高品質な翻訳を生成できる。低コストで、我々のコンテキスト対応翻訳は、人間のベースラインよりも、イディオム当たりの高品質な翻訳を実現することができる。
論文参考訳（メタデータ） (2024-10-01T18:24:43Z)
Crossing the Threshold: Idiomatic Machine Translation through Retrieval Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文参考訳（メタデータ） (2023-10-10T23:47:25Z)
Discourse Representation Structure Parsing for Chinese [8.846860617823005]
本研究では,中国語意味表現のためのラベル付きデータがない場合の中国語意味解析の実現可能性について検討する。そこで本研究では,中国語意味解析のためのテストスイートを提案し,解析性能の詳細な評価を行う。実験の結果,中国語の意味解析の難易度は,主に副詞が原因であることが示唆された。
論文参考訳（メタデータ） (2023-06-16T09:47:45Z)
The Best of Both Worlds: Combining Human and Machine Translations for Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文参考訳（メタデータ） (2023-05-22T05:57:47Z)
An evaluation of Google Translate for Sanskrit to English translation via sentiment and semantic analysis [0.31317409221921144]
2022年、サンスクリット語はGoogle翻訳エンジンに追加された。本研究では,Bhagavad Gitaを用いて,サンスクリット語のGoogle翻訳を評価するフレームワークを提案する。
論文参考訳（メタデータ） (2023-02-28T04:24:55Z)
Machine Translation for Accessible Multi-Language Text Analysis [1.5484595752241124]
英語への翻訳後に計算した英語学習尺度の精度が十分であることを示す。これは、感情分析、トピック分析、単語の埋め込みという3つの主要な分析で、16以上の言語で示します。
論文参考訳（メタデータ） (2023-01-20T04:11:38Z)
ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文参考訳（メタデータ） (2021-07-30T17:58:54Z)
Improving Sentiment Analysis over non-English Tweets using Multilingual Transformers and Automatic Translation for Data-Augmentation [77.69102711230248]
我々は、英語のつぶやきを事前学習し、自動翻訳を用いてデータ拡張を適用して非英語の言語に適応する多言語トランスフォーマーモデルを提案する。我々のフランス語、スペイン語、ドイツ語、イタリア語での実験は、この手法が非英語のツイートの小さなコーパスよりも、トランスフォーマーの結果を改善する効果的な方法であることを示唆している。
論文参考訳（メタデータ） (2020-10-07T15:44:55Z)
Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文参考訳（メタデータ） (2020-04-09T17:54:30Z)
A Set of Recommendations for Assessing Human-Machine Parity in Language Translation [87.72302201375847]
我々は、ハサンらの中国語から英語への翻訳調査を再評価する。専門家による翻訳では誤りが著しく少なかった。
論文参考訳（メタデータ） (2020-04-03T17:49:56Z)
A Corpus of Adpositional Supersenses for Mandarin Chinese [15.757892250956715]
マンダリン中国語ですべての表記が意味論的に注釈付けされたコーパスについて述べる。提案手法は, 言語に依存しない意味的基準に従って, 超感覚の一般的な集合を定義する枠組みに適応する。このスーパーセンスカテゴリーは、英語と構文的差異があるにもかかわらず、中国語の表記に適していることがわかった。
論文参考訳（メタデータ） (2020-03-18T18:59:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。