論文の概要: Semantic and sentiment analysis of selected Bhagavad Gita translations
using BERT-based language framework
- arxiv url: http://arxiv.org/abs/2201.03115v1
- Date: Sun, 9 Jan 2022 23:59:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-12 00:44:10.592593
- Title: Semantic and sentiment analysis of selected Bhagavad Gita translations
using BERT-based language framework
- Title(参考訳): BERTに基づく言語フレームワークを用いたBhagavad Gita翻訳のセマンティックおよび感情分析
- Authors: Rohitash Chandra, Venkatesh Kulkarni
- Abstract要約: バガヴァド・ギーガ(Bhagavad Gita)は、サンスクリットで書かれた古代ヒンドゥー教の哲学書で、マハーバーラタ戦争の前にクリシュナ卿とアルジュナの会話を描いている。
本稿では,Bhagavad Gitaから選択された翻訳文(主にサンスクリット語から英語)を,意味分析と感情分析を用いて比較する。
- 参考スコア(独自算出の注目度): 0.4125187280299248
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: It is well known that translations of songs and poems not only breaks rhythm
and rhyming patterns, but also results in loss of semantic information. The
Bhagavad Gita is an ancient Hindu philosophical text originally written in
Sanskrit that features a conversation between Lord Krishna and Arjuna prior to
the Mahabharata war. The Bhagavad Gita is also one of the key sacred texts in
Hinduism and known as the forefront of the Vedic corpus of Hinduism. In the
last two centuries, there has been a lot of interest in Hindu philosophy by
western scholars and hence the Bhagavad Gita has been translated in a number of
languages. However, there is not much work that validates the quality of the
English translations. Recent progress of language models powered by deep
learning has enabled not only translations but better understanding of language
and texts with semantic and sentiment analysis. Our work is motivated by the
recent progress of language models powered by deep learning methods. In this
paper, we compare selected translations (mostly from Sanskrit to English) of
the Bhagavad Gita using semantic and sentiment analyses. We use hand-labelled
sentiment dataset for tuning state-of-art deep learning-based language model
known as \textit{bidirectional encoder representations from transformers}
(BERT). We use novel sentence embedding models to provide semantic analysis for
selected chapters and verses across translations. Finally, we use the
aforementioned models for sentiment and semantic analyses and provide
visualisation of results. Our results show that although the style and
vocabulary in the respective Bhagavad Gita translations vary widely, the
sentiment analysis and semantic similarity shows that the message conveyed are
mostly similar across the translations.
- Abstract(参考訳): 歌や詩の翻訳がリズムや韻律のパターンを損なうだけでなく、意味的な情報を失うことも知られている。
バガヴァド・ギタ(bhagavad gita)は、元々サンスクリットで書かれた古代ヒンドゥー教の哲学書で、マハバラータ戦争以前のクリシュナとアルジュナの会話を特徴としている。
Bhagavad Gitaはヒンドゥー教における重要な聖典の1つであり、ヒンドゥー教のヴェーディック・コーパスの最前線として知られている。
この2世紀、西洋の学者はヒンドゥー教哲学に多くの関心を寄せており、したがってバガヴァド・ギタは多くの言語に翻訳されている。
しかし、英語の翻訳の質を評価する研究はあまりない。
ディープラーニングを利用した言語モデルの最近の進歩は、翻訳だけでなく、意味や感情分析による言語やテキストの理解を深めている。
我々の研究は、ディープラーニングによる言語モデルの最近の進歩に動機づけられている。
本稿では,Bhagavad Gitaから選択された翻訳(主にサンスクリット語から英語)を,意味分析と感情分析を用いて比較する。
我々は,textit{bidirectional encoder representations from transformers} (bert)として知られる,最先端のディープラーニングに基づく言語モデルのチューニングに手ラベル付き感情データセットを使用する。
我々は,新しい文埋め込みモデルを用いて,選択された章や句の意味分析を行う。
最後に,上述のモデルを用いて感情分析と意味分析を行い,結果の可視化を行う。
以上の結果から,各Bhagavad Gita翻訳の文体や語彙は様々であるが,感情分析や意味的類似性は,伝達されたメッセージが翻訳全体でほぼ類似していることを示している。
関連論文リスト
- The First Swahili Language Scene Text Detection and Recognition Dataset [55.83178123785643]
低リソース言語、特にスワヒリ語には大きなギャップがある。
スワヒリ語は東アフリカ諸国で広く話されているが、依然としてシーンテキスト認識において未発見言語である。
本研究では,スワヒリシーンのテキスト画像の包括的データセットを提案し,異なるシーンのテキスト検出および認識モデルに基づくデータセットの評価を行う。
論文 参考訳(メタデータ) (2024-05-19T03:55:02Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - Large language model for Bible sentiment analysis: Sermon on the Mount [1.8804426519412474]
我々は、聖書の選択された章を研究するために感情分析を利用する。
これらの章は山のサーモンとして知られている。
私たちは、イエスがメッセージを伝えるために使った各章で、ユーモア、楽観主義、共感の異なるレベルを検知します。
論文 参考訳(メタデータ) (2024-01-01T07:35:29Z) - An evaluation of Google Translate for Sanskrit to English translation
via sentiment and semantic analysis [0.31317409221921144]
2022年、サンスクリット語はGoogle翻訳エンジンに追加された。
本研究では,Bhagavad Gitaを用いて,サンスクリット語のGoogle翻訳を評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-28T04:24:55Z) - CLSE: Corpus of Linguistically Significant Entities [58.29901964387952]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - Artificial intelligence for topic modelling in Hindu philosophy: mapping
themes between the Upanishads and the Bhagavad Gita [0.4125187280299248]
BERTのような先進的な言語を使用して、UpanishadとBhagavad Gitaの重要なテキストのトピックモデリングを提供します。
その結果,2つのテキストのトピック間の類似度は非常に高く,平均コサイン類似度は73%であった。
私たちの最高のパフォーマンスモデルは、Bhagavad Gitaで73%、The Upanishadsで69%のコヒーレンススコアを与えています。
論文 参考訳(メタデータ) (2022-05-23T03:39:00Z) - Translating Hanja Historical Documents to Contemporary Korean and
English [52.625998002213585]
李氏朝鮮のアナルスには、朝鮮の近代国家に先立つ500年の王国である李氏朝鮮の日記がある。
アナル文字はもともとは古代朝鮮の文体「ハンジャ」で書かれ、1968年から1993年にかけて朝鮮語に翻訳された。
以後、10年間に1人の王の記録が完成した。
本稿では,ハンハの歴史的文書を韓国語や英語に翻訳するニューラルネットワーク翻訳モデルH2KEを提案する。
論文 参考訳(メタデータ) (2022-05-20T08:25:11Z) - Extract, Integrate, Compete: Towards Verification Style Reading
Comprehension [66.2551168928688]
本稿では,ガオカオの中国語テストから,VGaokaoと命名された新しい検証スタイル読解データセットを提案する。
VGaokaoの課題に対処するため,我々は新しい抽出・抽出・計算手法を提案する。
論文 参考訳(メタデータ) (2021-09-11T01:34:59Z) - Itihasa: A large-scale corpus for Sanskrit to English translation [9.566221218224637]
イティハサ (Itihasa) は、サンスクリット語の93,000対のスロカとその英訳を含む大規模な翻訳データセットである。
まず、このようなデータセットのキュレーションの背後にあるモチベーションを説明し、そのニュアンスを引き出すための経験的分析を続行する。
論文 参考訳(メタデータ) (2021-06-06T22:58:13Z) - It's not Greek to mBERT: Inducing Word-Level Translations from
Multilingual BERT [54.84185432755821]
mBERT (multilingual BERT) は、言語間での移動を可能にするリッチな言語間表現を学習する。
我々はmBERTに埋め込まれた単語レベルの翻訳情報について検討し、微調整なしで優れた翻訳能力を示す2つの簡単な方法を提案する。
論文 参考訳(メタデータ) (2020-10-16T09:49:32Z) - Anubhuti -- An annotated dataset for emotional analysis of Bengali short
stories [2.3424047967193826]
アヌブティはベンガルの短編小説の著者が表現した感情を分析するための最初の、そして最大のテキストコーパスである。
本稿では,データ収集手法,手作業によるアノテーション処理,そして結果として生じるハイアノテータ間の合意について説明する。
我々は、ベースライン機械学習と感情分類のためのディープラーニングモデルを用いて、データセットの性能を検証した。
論文 参考訳(メタデータ) (2020-10-06T22:33:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。