論文の概要: A novel approach to sentiment analysis in Persian using discourse and
external semantic information
- arxiv url: http://arxiv.org/abs/2007.09495v1
- Date: Sat, 18 Jul 2020 18:40:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 05:35:12.980847
- Title: A novel approach to sentiment analysis in Persian using discourse and
external semantic information
- Title(参考訳): 談話と外部意味情報を用いたペルシアにおける感情分析の新しいアプローチ
- Authors: Rahim Dehkharghani, Hojjat Emami
- Abstract要約: 自然言語で書かれた文書から個人の感情を抽出するための多くのアプローチが提案されている。
これらのアプローチの大半は英語に重点を置いているが、ペルシア語のような資源中心の言語は研究作業や言語資源の欠如に悩まされている。
ペルシア語におけるこのギャップのため、現在の研究はペルシア語に適用される感情分析の新しい手法を導入することを目的としている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sentiment analysis attempts to identify, extract and quantify affective
states and subjective information from various types of data such as text,
audio, and video. Many approaches have been proposed to extract the sentiment
of individuals from documents written in natural languages in recent years. The
majority of these approaches have focused on English, while resource-lean
languages such as Persian suffer from the lack of research work and language
resources. Due to this gap in Persian, the current work is accomplished to
introduce new methods for sentiment analysis which have been applied on
Persian. The proposed approach in this paper is two-fold: The first one is
based on classifier combination, and the second one is based on deep neural
networks which benefits from word embedding vectors. Both approaches takes
advantage of local discourse information and external knowledge bases, and also
cover several language issues such as negation and intensification,
andaddresses different granularity levels, namely word, aspect, sentence,
phrase and document-levels. To evaluate the performance of the proposed
approach, a Persian dataset is collected from Persian hotel reviews referred as
hotel reviews. The proposed approach has been compared to counterpart methods
based on the benchmark dataset. The experimental results approve the
effectiveness of the proposed approach when compared to related works.
- Abstract(参考訳): 感性分析は、テキスト、オーディオ、ビデオなどの様々な種類のデータから感情状態と主観的情報を特定し、抽出し、定量化する。
近年,自然言語で書かれた文書から個人の感情を抽出する手法が提案されている。
これらのアプローチの大部分は英語に焦点を当てているが、ペルシア語のようなリソース指向言語は研究作業や言語資源の欠如に苦しんでいる。
ペルシア語におけるこのギャップのため、現在の研究はペルシア語に適用される感情分析の新しい方法を導入するために行われている。
この論文で提案されたアプローチは2つある: 1つは分類器の組み合わせ、もう1つは単語埋め込みベクトルの恩恵を受けるディープニューラルネットワークに基づいている。
どちらのアプローチも、局所的な談話情報と外部の知識ベースを活用し、否定や強化といったいくつかの言語問題を取り上げ、異なる粒度レベル、すなわち単語、アスペクト、文、句、文書レベルに対処する。
提案手法の性能を評価するため,ホテルレビューと呼ばれるペルシャのホテルレビューからペルシャのデータセットを収集した。
提案手法はベンチマークデータセットに基づく対応する手法と比較されてきた。
実験結果は,提案手法の有効性を関連研究と比較して評価した。
関連論文リスト
- Persian Homograph Disambiguation: Leveraging ParsBERT for Enhanced Sentence Understanding with a Novel Word Disambiguation Dataset [0.0]
ペルシャのホモグラフの曖昧化に適した新しいデータセットを提案する。
本研究は,コサイン類似性法による各種埋没物の徹底的な探索を含む。
我々は、精度、リコール、F1スコアの観点からモデルの性能を精査する。
論文 参考訳(メタデータ) (2024-05-24T14:56:36Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Persian topic detection based on Human Word association and graph
embedding [3.8137985834223507]
本稿では,Human Word Associationに基づくソーシャルメディアのトピック検出フレームワークを提案する。
この地域での作業のほとんどは英語で行われているが、ペルシア語で行われている。
論文 参考訳(メタデータ) (2023-02-20T05:46:47Z) - Beyond Contrastive Learning: A Variational Generative Model for
Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。
我々のモデルは、$N$言語で並列データを操作する。
本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-12-21T02:41:40Z) - Sentiment Analysis of Persian Language: Review of Algorithms, Approaches
and Datasets [0.0]
感情分析を解くのに使われるほとんどの方法は、機械学習とディープラーニングである。
LSTMやBi-LSTMのようなBERTとRNNニューラルネットワークは感情分析において高い精度を実現している。
論文 参考訳(メタデータ) (2022-11-09T13:08:46Z) - A Multilingual Perspective Towards the Evaluation of Attribution Methods
in Natural Language Inference [28.949004915740776]
本稿では,自然言語推論(NLI)タスクに対する帰属的手法を評価するための多言語的手法を提案する。
まず,単語アライメントに基づいて忠実度を測定するための新たな言語間戦略を導入する。
次に、異なる出力機構と集約手法を考慮し、帰属手法の包括的な評価を行う。
論文 参考訳(メタデータ) (2022-04-11T22:11:05Z) - Leveraging Pre-trained Language Model for Speech Sentiment Analysis [58.78839114092951]
本研究では、事前学習された言語モデルを用いて、文章の感情情報を学習し、音声の感情分析を行う。
本稿では,言語モデルを用いた擬似ラベルに基づく半教師付き訓練戦略を提案する。
論文 参考訳(メタデータ) (2021-06-11T20:15:21Z) - The Challenges of Persian User-generated Textual Content: A Machine
Learning-Based Approach [0.0]
この研究は、ペルシャのユーザー生成テキストコンテンツがもたらすハードルに対処するために機械学習ベースのアプローチを適用します。
提示されたアプローチは、ペルシア語の感情分析を行うために機械翻訳データセットを使用する。
実験の結果は、これまでの試みとは対照的に、有望な最先端のパフォーマンスを示しています。
論文 参考訳(メタデータ) (2021-01-20T11:57:59Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。