Fugu-MT 論文翻訳(概要): BAN-ABSA: An Aspect-Based Sentiment Analysis dataset for Bengali and it's baseline evaluation

論文の概要: BAN-ABSA: An Aspect-Based Sentiment Analysis dataset for Bengali and it's baseline evaluation

arxiv url: http://arxiv.org/abs/2012.00288v1
Date: Tue, 1 Dec 2020 06:09:44 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-01 06:17:14.725068
Title: BAN-ABSA: An Aspect-Based Sentiment Analysis dataset for Bengali and it's baseline evaluation
Title（参考訳）: BAN-ABSA:ベンガル語に対するアスペクトベース感性分析データセットとそのベースライン評価
Authors: Mahfuz Ahmed Masum, Sheikh Junayed Ahmed, Ayesha Tasnim, Md Saiful Islam
Abstract要約: 本稿では,高品質なベンガル語データセットであるBAN-ABSAについて述べる。データセットは、ベンガルの有名なニュースポータルから収集された9,009のユニークなコメントから、2,619のポジティブ、4,721のネガティブ、1,669の中立データサンプルで構成されている。
参考スコア（独自算出の注目度）: 0.8793721044482612
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Due to the breathtaking growth of social media or newspaper user comments, online product reviews comments, sentiment analysis (SA) has captured substantial interest from the researchers. With the fast increase of domain, SA work aims not only to predict the sentiment of a sentence or document but also to give the necessary detail on different aspects of the sentence or document (i.e. aspect-based sentiment analysis). A considerable number of datasets for SA and aspect-based sentiment analysis (ABSA) have been made available for English and other well-known European languages. In this paper, we present a manually annotated Bengali dataset of high quality, BAN-ABSA, which is annotated with aspect and its associated sentiment by 3 native Bengali speakers. The dataset consists of 2,619 positive, 4,721 negative and 1,669 neutral data samples from 9,009 unique comments gathered from some famous Bengali news portals. In addition, we conducted a baseline evaluation with a focus on deep learning model, achieved an accuracy of 78.75% for aspect term extraction and accuracy of 71.08% for sentiment classification. Experiments on the BAN-ABSA dataset show that the CNN model is better in terms of accuracy though Bi-LSTM significantly outperforms CNN model in terms of average F1-score.
Abstract（参考訳）: ソーシャルメディアや新聞のユーザーコメントの増加により、オンライン製品レビューのコメント、感情分析(SA)が研究者からかなりの関心を集めている。ドメインの急速な増加により、SA作業は、文や文書の感情を予測するだけでなく、文や文書の様々な側面(すなわち、文書)について必要な詳細を提供することを目的としている。アスペクトベースの感情分析)。 SAとアスペクトベースの感情分析(ABSA)のためのかなりの数のデータセットが、英語や他の有名なヨーロッパの言語で利用可能になっている。本稿では,高品質なベンガル語データセットであるBAN-ABSAについて述べる。データセットは、ベンガルの有名なニュースポータルから収集された9,009のユニークなコメントから、2,619のポジティブ、4,721のネガティブ、1,669の中立データサンプルで構成されている。さらに、ディープラーニングモデルに着目したベースライン評価を行い、アスペクト項抽出の精度78.75%、感情分類の精度71.08%を実現した。 BAN-ABSAデータセットの実験では、平均F1スコアでCNNモデルよりも精度が良いが、Bi-LSTMはCNNモデルよりも優れていた。

関連論文リスト

DimABSA: Building Multilingual and Multidomain Datasets for Dimensional Aspect-Based Sentiment Analysis [57.70022214686838]
DimABSAは、従来のABSA要素とVAスコアの両方に注釈を付けた最初の多言語次元ABSAリソースである。このリソースには、42,590の文にわたる76,958のアスペクトインスタンスが含まれており、6つの言語と4つのドメインにまたがっている。
論文参考訳（メタデータ） (2026-01-30T14:30:35Z)
BengaliSent140: A Large-Scale Bengali Binary Sentiment Dataset for Hate and Non-Hate Speech Classification [0.1784233255402269]
既存の7つのベンガルテキストデータセットを統一コーパスに統合して構築した大規模なバイナリ感情データセットであるBengaliSent140を紹介する。結果として得られたデータセットは、68,548のヘイトと71,244のNot-hateインスタンスを含む、139,792のユニークなテキストサンプルで構成されている。複数のソースやドメインからのデータを統合することで、BengaliSent140はより広範な言語的および文脈的カバレッジを提供する。
論文参考訳（メタデータ） (2026-01-27T23:47:46Z)
LLM Based Sentiment Classification From Bangladesh E-Commerce Reviews [0.0]
本稿では,バングラデシュのeコマースレビューの感情分析にトランスフォーマーを用いたBERTモデルの有効性について検討する。バングラのオリジナルデータセットから4000サンプルのサブセットと、イングランドの顧客レビューを使用してモデルを微調整した。微調整のLlama-3.1-8Bモデルは、全体的な精度、精度、リコール、F1スコア95.5%、93%、88%、90%で他の微調整モデルより優れていた。
論文参考訳（メタデータ） (2025-09-30T16:46:09Z)
Enhancing Sentiment Analysis in Bengali Texts: A Hybrid Approach Using Lexicon-Based Algorithm and Pretrained Language Model Bangla-BERT [1.5020330976600738]
我々はルールベースのアルゴリズムと事前学習された言語モデルを統合する新しいアプローチを開発する。そこで我々は,Bangla Sentiment Polarity Score (BSPS) という新しいアルゴリズムを開発した。分析の結果,BSPS+BanglaBERTハイブリッドアプローチは,BanglaBERTモデルよりも高い精度,精度,ニュアンス分類が得られた。
論文参考訳（メタデータ） (2024-11-29T09:57:11Z)
Into the LAIONs Den: Investigating Hate in Multimodal Datasets [67.21783778038645]
本稿では、LAION-400MとLAION-2Bの2つのデータセットの比較監査を通して、ヘイトフルコンテンツに対するデータセットのスケーリングの効果について検討する。その結果、データセットのスケールによってヘイトコンテンツは12%近く増加し、質的にも定量的にも測定された。また、画像のみに基づいて算出されたNot Safe For Work(NSFW)値に基づくデータセットの内容のフィルタリングは、アルトテキストにおける有害なコンテンツをすべて排除するものではないことがわかった。
論文参考訳（メタデータ） (2023-11-06T19:00:05Z)
SOUL: Towards Sentiment and Opinion Understanding of Language [96.74878032417054]
我々は、言語感覚とオピニオン理解(SOUL)と呼ばれる新しいタスクを提案する。 SOULは2つのサブタスクを通して感情理解を評価することを目的としている:レビュー(RC)と正当化生成(JG)。
論文参考訳（メタデータ） (2023-10-27T06:48:48Z)
Arabic Sentiment Analysis with Noisy Deep Explainable Model [48.22321420680046]
本稿では,アラビア語の感情分類フレームワークを提案する。提案フレームワークは,局所的な代理説明可能なモデルをトレーニングすることで,特定の予測を説明することができる。アラビアサデータセットの公開ベンチマーク実験を行った。
論文参考訳（メタデータ） (2023-09-24T19:26:53Z)
BanglaBook: A Large-scale Bangla Dataset for Sentiment Analysis from Book Reviews [1.869097450593631]
本稿では,バングラ書評の大規模データセットについて,肯定,否定,中立の3つのカテゴリに分類される158,065のサンプルからなる。我々は、SVM、LSTM、Bangla-BERTなどのベースラインを確立するために、さまざまな機械学習モデルを使用します。この結果から,手作業で作成する機能に依存したモデルよりも,事前訓練したモデルに対して,かなりの性能上の利点が示された。
論文参考訳（メタデータ） (2023-05-11T06:27:38Z)
Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文参考訳（メタデータ） (2022-04-10T21:46:52Z)
Arabic aspect based sentiment analysis using BERT [0.0]
本稿では、BERTのような事前訓練された言語モデルからのコンテキスト埋め込みのモデリング機能について述べる。我々は、このタスクに対処するために、シンプルだが効果的なBERTベースの神経ベースラインを構築しています。実験結果によると, 単純な線形分類層を持つBERTアーキテクチャは, 最先端の成果を上回った。
論文参考訳（メタデータ） (2021-07-28T11:34:00Z)
Fine-tuning Pretrained Multilingual BERT Model for Indonesian Aspect-based Sentiment Analysis [0.0]
CNNとXGBoostを用いて,ホテルドメインにおけるインドネシアのレビューに対するAspect-based Sentiment Analysis (ABSA) に関する研究を行った。本稿では,インドネシアのレビューデータセットにおいて,最も先進的な言語表現モデルであるBERTをABSAに組み込むことを目的としている。
論文参考訳（メタデータ） (2021-03-05T15:05:51Z)
Sentiment analysis in Bengali via transfer learning using multi-lingual BERT [0.9883261192383611]
本稿では,ベンガルで手動でタグ付けされた2クラスと3クラスのSAデータセットを提示する。また、関連する拡張を伴う多言語BERTモデルが、転送学習のアプローチによって訓練可能であることも実証した。この深層学習モデルは,現在最先端の68%と比較して,2階級の感情分類において71%の精度を達成している。
論文参考訳（メタデータ） (2020-12-03T10:21:11Z)
Exploiting BERT to improve aspect-based sentiment analysis performance on Persian language [0.0]
本研究では,事前学習したBERTモデルを用いて,ABSAタスクにおける文ペア入力を活用する可能性を示す。その結果,Pars-BERT事前学習モデルと自然言語推論助文(NLI-M)を用いることで,ABSAタスクの精度が91%向上することが示唆された。
論文参考訳（メタデータ） (2020-12-02T16:47:20Z)
Understanding Pre-trained BERT for Aspect-based Sentiment Analysis [71.40586258509394]
本稿では、アスペクトベース感情分析(ABSA)におけるタスクに対するBERTのレビューから得られた事前学習された隠れ表現について分析する。アスペクトや意見のアノテーションなしでラベル付けされていないコーパスでトレーニングされた(マスクされた)言語モデルの一般的なプロキシタスクが、ABSAの下流タスクにどのように重要な機能を提供するかは明らかではない。
論文参考訳（メタデータ） (2020-10-31T02:21:43Z)
Tasty Burgers, Soggy Fries: Probing Aspect Robustness in Aspect-Based Sentiment Analysis [71.40390724765903]
アスペクトベースの感情分析(ABSA)は、テキストの特定の側面に対する感情を予測することを目的としている。既存のABSAテストセットは、モデルが対象のアスペクトの感情を非ターゲットのアスペクトと区別できるかどうかを調査するために使用できない。我々は、対象の側面の感情から、対象でない側面の相反する感情を解き放つための新しい例を生成する。
論文参考訳（メタデータ） (2020-09-16T22:38:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。