論文の概要: An evaluation of Google Translate for Sanskrit to English translation
via sentiment and semantic analysis
- arxiv url: http://arxiv.org/abs/2303.07201v1
- Date: Tue, 28 Feb 2023 04:24:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-19 11:48:07.118089
- Title: An evaluation of Google Translate for Sanskrit to English translation
via sentiment and semantic analysis
- Title(参考訳): 感情分析と意味分析によるサンスクリット語から英訳へのgoogle翻訳の評価
- Authors: Akshat Shukla, Chaarvi Bansal, Sushrut Badhe, Mukul Ranjan, Rohitash
Chandra
- Abstract要約: 2022年、サンスクリット語はGoogle翻訳エンジンに追加された。
本研究では,Bhagavad Gitaを用いて,サンスクリット語のGoogle翻訳を評価するフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.31317409221921144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Google Translate has been prominent for language translation; however,
limited work has been done in evaluating the quality of translation when
compared to human experts. Sanskrit one of the oldest written languages in the
world. In 2022, the Sanskrit language was added to the Google Translate engine.
Sanskrit is known as the mother of languages such as Hindi and an ancient
source of the Indo-European group of languages. Sanskrit is the original
language for sacred Hindu texts such as the Bhagavad Gita. In this study, we
present a framework that evaluates the Google Translate for Sanskrit using the
Bhagavad Gita. We first publish a translation of the Bhagavad Gita in Sanskrit
using Google Translate. Our framework then compares Google Translate version of
Bhagavad Gita with expert translations using sentiment and semantic analysis
via BERT-based language models. Our results indicate that in terms of sentiment
and semantic analysis, there is low level of similarity in selected verses of
Google Translate when compared to expert translations. In the qualitative
evaluation, we find that Google translate is unsuitable for translation of
certain Sanskrit words and phrases due to its poetic nature, contextual
significance, metaphor and imagery. The mistranslations are not surprising
since the Bhagavad Gita is known as a difficult text not only to translate, but
also to interpret since it relies on contextual, philosophical and historical
information. Our framework lays the foundation for automatic evaluation of
other languages by Google Translate
- Abstract(参考訳): google翻訳は言語翻訳で際立っているが、人間の専門家と比較して翻訳の質を評価する作業は限られている。
サンスクリット語は世界で最も古い言語の一つである。
2022年、サンスクリット語はGoogle翻訳エンジンに追加された。
サンスクリットはヒンディー語などの言語の母として知られ、インド・ヨーロッパ諸語群の古代の情報源である。
サンスクリット語はバガヴァド・トゥガのようなヒンドゥー教のテキストの原語である。
本研究では,Bhagavad Gitaを用いて,サンスクリット語のGoogle翻訳を評価するフレームワークを提案する。
私たちはまず、Google Translateを使ってサンスクリットのBhagavad Gitaの翻訳を公開しました。
我々のフレームワークは、Bhagavad GitaのGoogle Translateバージョンと、BERTベースの言語モデルによる感情分析と意味分析を用いた専門家翻訳を比較した。
その結果, 感傷的・意味的分析の面では, 専門家翻訳と比較して, 選択した翻訳文の類似度は低いことがわかった。
質的な評価では,サンスクリット語の特定の単語やフレーズの翻訳には,その詩的性質,文脈的意義,比喩,イメージが適していないことが分かる。
Bhagavad Gitaは翻訳が難しいことだけでなく、文脈、哲学、歴史的情報に依存しているため解釈が難しいことで知られるため、この誤訳は驚くべきことではない。
われわれのフレームワークは、google translateによる他言語の自動評価の基礎を築いている
関連論文リスト
- Evaluation of Google Translate for Mandarin Chinese translation using sentiment and semantic analysis [1.3999481573773074]
大規模言語モデル(LLM)を用いた機械翻訳は,世界規模で大きな影響を与えている。
中国語は、中国の政府やメディアによる通信に用いられる公用語である。
本研究では、感情分析と意味分析を用いて、人間の専門家によるGoogle翻訳の翻訳品質の自動評価を行う。
論文 参考訳(メタデータ) (2024-09-08T04:03:55Z) - Crossing the Threshold: Idiomatic Machine Translation through Retrieval
Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。
我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。
自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文 参考訳(メタデータ) (2023-10-10T23:47:25Z) - Multilingual Tourist Assistance using ChatGPT: Comparing Capabilities in
Hindi, Telugu, and Kannada [1.5762281194023464]
本研究では,OpenAIによるAI言語モデルChatGPTによるヒンディー語,テルグ語,カナダ語への翻訳の有効性を検討した。
翻訳の質を測定するため,一般知識,食品,旅行など多種多様な分野から50の質問を抽出した。
人間の評価者は翻訳の正確さと流布度の両方を評価し、言語モデルの性能について包括的な視点を提供した。
論文 参考訳(メタデータ) (2023-07-28T07:52:26Z) - Sāmayik: A Benchmark and Dataset for English-Sanskrit Translation [30.315293326789828]
S=amayikは、現代の散文で書かれた53,000の英サンスクリット文からなるデータセットである。
S=amayikは、言語教材、テキスト教育教育、オンラインチュートリアルなど、さまざまな分野からキュレーションされている。
論文 参考訳(メタデータ) (2023-05-23T12:32:24Z) - Is ChatGPT A Good Translator? Yes With GPT-4 As The Engine [97.8609714773255]
機械翻訳におけるChatGPTの評価には,翻訳プロンプト,多言語翻訳,翻訳堅牢性などが含まれる。
ChatGPTは商用翻訳製品と競合するが、低リソースや遠方の言語では遅れている。
GPT-4エンジンの打ち上げにより、ChatGPTの翻訳性能は大幅に向上した。
論文 参考訳(メタデータ) (2023-01-20T08:51:36Z) - Translating Hanja Historical Documents to Contemporary Korean and
English [52.625998002213585]
李氏朝鮮のアナルスには、朝鮮の近代国家に先立つ500年の王国である李氏朝鮮の日記がある。
アナル文字はもともとは古代朝鮮の文体「ハンジャ」で書かれ、1968年から1993年にかけて朝鮮語に翻訳された。
以後、10年間に1人の王の記録が完成した。
本稿では,ハンハの歴史的文書を韓国語や英語に翻訳するニューラルネットワーク翻訳モデルH2KEを提案する。
論文 参考訳(メタデータ) (2022-05-20T08:25:11Z) - Semantic and sentiment analysis of selected Bhagavad Gita translations
using BERT-based language framework [0.4125187280299248]
バガヴァド・ギーガ(Bhagavad Gita)は、サンスクリットで書かれた古代ヒンドゥー教の哲学書で、マハーバーラタ戦争の前にクリシュナ卿とアルジュナの会話を描いている。
本稿では,Bhagavad Gitaから選択された翻訳文(主にサンスクリット語から英語)を,意味分析と感情分析を用いて比較する。
論文 参考訳(メタデータ) (2022-01-09T23:59:11Z) - Challenge Dataset of Cognates and False Friend Pairs from Indian
Languages [54.6340870873525]
コニャートは異なる言語で同じテキストの複数の変種に存在する。
本稿では,12言語を対象とした2つのコグネートデータセットの作成について述べる。
論文 参考訳(メタデータ) (2021-12-17T14:23:43Z) - Harnessing Cross-lingual Features to Improve Cognate Detection for
Low-resource Languages [50.82410844837726]
言語間単語埋め込みを用いた14言語間のコニャートの検出を実証する。
インドの12言語からなる挑戦的データセットを用いて,コニャート検出手法の評価を行った。
我々は,コグネート検出のためのFスコアで最大18%の改善点を観察した。
論文 参考訳(メタデータ) (2021-12-16T11:17:58Z) - Itihasa: A large-scale corpus for Sanskrit to English translation [9.566221218224637]
イティハサ (Itihasa) は、サンスクリット語の93,000対のスロカとその英訳を含む大規模な翻訳データセットである。
まず、このようなデータセットのキュレーションの背後にあるモチベーションを説明し、そのニュアンスを引き出すための経験的分析を続行する。
論文 参考訳(メタデータ) (2021-06-06T22:58:13Z) - A Multilingual Neural Machine Translation Model for Biomedical Data [84.17747489525794]
生物医学領域におけるテキストの翻訳に使用できる多言語ニューラルマシン翻訳モデルをリリースする。
このモデルは5つの言語(フランス語、ドイツ語、イタリア語、韓国語、スペイン語)から英語に翻訳できる。
ドメインタグを使用して、大量のジェネリックおよびバイオメディカルデータをトレーニングする。
論文 参考訳(メタデータ) (2020-08-06T21:26:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。