論文の概要: BAKSA at SemEval-2020 Task 9: Bolstering CNN with Self-Attention for
Sentiment Analysis of Code Mixed Text
- arxiv url: http://arxiv.org/abs/2007.10819v1
- Date: Tue, 21 Jul 2020 14:05:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 04:04:49.033889
- Title: BAKSA at SemEval-2020 Task 9: Bolstering CNN with Self-Attention for
Sentiment Analysis of Code Mixed Text
- Title(参考訳): BAKSA at SemEval-2020 Task 9:Bolstering CNN with Self-Attention for Sentiment Analysis of Code Mixed Text (英語)
- Authors: Ayush Kumar, Harsh Agarwal, Keshav Bansal, Ashutosh Modi
- Abstract要約: 本稿では,畳み込みニューラルネット(CNN)と自己注意に基づくLSTMのアンサンブルアーキテクチャを提案する。
我々はヒンディー語(ヒングリッシュ)とスペイン語(スパングリッシュ)のデータセットでそれぞれ0.707と0.725のスコアを得た。
- 参考スコア(独自算出の注目度): 4.456122555367167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sentiment Analysis of code-mixed text has diversified applications in opinion
mining ranging from tagging user reviews to identifying social or political
sentiments of a sub-population. In this paper, we present an ensemble
architecture of convolutional neural net (CNN) and self-attention based LSTM
for sentiment analysis of code-mixed tweets. While the CNN component helps in
the classification of positive and negative tweets, the self-attention based
LSTM, helps in the classification of neutral tweets, because of its ability to
identify correct sentiment among multiple sentiment bearing units. We achieved
F1 scores of 0.707 (ranked 5th) and 0.725 (ranked 13th) on Hindi-English
(Hinglish) and Spanish-English (Spanglish) datasets, respectively. The
submissions for Hinglish and Spanglish tasks were made under the usernames
ayushk and harsh_6 respectively.
- Abstract(参考訳): コード混合テキストの感性分析は、ユーザレビューのタグ付けからサブ人口の社会的・政治的感情の特定まで、意見マイニングにおける応用を多様化させた。
本稿では,畳み込みニューラルネット(CNN)と自己注意に基づくLSTMのアンサンブルアーキテクチャを,コードミックスツイートの感情分析のために提案する。
CNNコンポーネントは、ポジティブなツイートとネガティブなツイートの分類に役立つが、自己注意に基づくLSTMは、複数の感情を持つユニット間で正しい感情を識別できるため、中立的なツイートの分類に役立つ。
我々はヒンディー語(ヒングリッシュ)とスペイン語(スパングリッシュ)のデータセットでそれぞれ0.707(5位)と0.725(13位)のスコアを得た。
hinglish と spanglish のタスクはユーザ名 ayushk と severe_6 でそれぞれ提出された。
関連論文リスト
- You Shall Know a Tool by the Traces it Leaves: The Predictability of Sentiment Analysis Tools [74.98850427240464]
感情分析ツールが同じデータセットで一致しないことを示す。
感傷的アノテーションに使用される感情ツールは,その結果から予測できることを示す。
論文 参考訳(メタデータ) (2024-10-18T17:27:38Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - Sentiment-Aware Word and Sentence Level Pre-training for Sentiment
Analysis [64.70116276295609]
SentiWSPは、WordレベルとSentenceレベルの事前トレーニングタスクを組み合わせた、Sentiment対応の事前トレーニング言語モデルである。
SentiWSPは、様々な文レベルおよびアスペクトレベルの感情分類ベンチマーク上で、最先端のパフォーマンスを新たに達成する。
論文 参考訳(メタデータ) (2022-10-18T12:25:29Z) - Overview of Abusive and Threatening Language Detection in Urdu at FIRE
2021 [50.591267188664666]
我々は、ウルドゥー語に対する虐待と脅しの2つの共通タスクを提示する。
本研究では, (i) 乱用と非乱用というラベル付きツイートを含む手動注釈付きデータセットと, (ii) 脅威と非脅威の2つを提示する。
両方のサブタスクに対して、m-Bertベースのトランスモデルは最高の性能を示した。
論文 参考訳(メタデータ) (2022-07-14T07:38:13Z) - Exploiting BERT For Multimodal Target SentimentClassification Through
Input Space Translation [75.82110684355979]
オブジェクト認識変換器を用いて入力空間内の画像を変換する2ストリームモデルを提案する。
次に、翻訳を利用して、言語モデルに多モーダル情報を提供する補助文を構築する。
2つのマルチモーダルTwitterデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-08-03T18:02:38Z) - JUNLP@Dravidian-CodeMix-FIRE2020: Sentiment Classification of Code-Mixed
Tweets using Bi-Directional RNN and Language Tags [14.588109573710431]
本稿では、双方向LSTMと言語タグ付けを用いて、ソーシャルメディアから抽出したコードミキシングタミルテキストの感情タグ付けを容易にする。
提案アルゴリズムは精度、リコール、F1スコアはそれぞれ0.59点、0.66点、0.58点である。
論文 参考訳(メタデータ) (2020-10-20T08:10:29Z) - NLP-CIC at SemEval-2020 Task 9: Analysing sentiment in code-switching
language using a simple deep-learning classifier [63.137661897716555]
コードスイッチングは、2つ以上の言語が同じメッセージで使用される現象である。
標準的な畳み込みニューラルネットワークモデルを用いて、スペイン語と英語の混在するツイートの感情を予測する。
論文 参考訳(メタデータ) (2020-09-07T19:57:09Z) - LIMSI_UPV at SemEval-2020 Task 9: Recurrent Convolutional Neural Network
for Code-mixed Sentiment Analysis [8.8561720398658]
本稿では,SemEval-2020 Task 9: Sentiment Analysis for Code-Mixed Social Media TextにおけるLIMSI UPVチームの参加について述べる。
提案手法はSentiMix Hindi- English subtaskで競合し、Hindi- English code-mixedTweetの感情を予測する問題に対処した。
本稿では,リカレントニューラルネットワークと畳み込みニューラルネットワークを併用して,テキストのセマンティクスをよりよく捉えたリカレント畳み込みニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-30T13:52:24Z) - C1 at SemEval-2020 Task 9: SentiMix: Sentiment Analysis for Code-Mixed
Social Media Text using Feature Engineering [0.9646922337783134]
本稿では,SemEval-2020 Task 9: SentiMixのコード混合ソーシャルメディアテキストにおける感情分析における特徴工学的アプローチについて述べる。
重み付きF1スコアは、"Hinglish"タスクが0.65、"Spanglish"タスクが0.63となる。
論文 参考訳(メタデータ) (2020-08-09T00:46:26Z) - IUST at SemEval-2020 Task 9: Sentiment Analysis for Code-Mixed Social
Media Text using Deep Neural Networks and Linear Baselines [6.866104126509981]
我々は、与えられたコードミックスツイートの感情を予測するシステムを開発した。
我々の最高の演奏法は、スペイン語のサブタスクに対して0.751得点、ヒンディー語のサブタスクに対して0.706スコアを得る。
論文 参考訳(メタデータ) (2020-07-24T18:48:37Z) - NITS-Hinglish-SentiMix at SemEval-2020 Task 9: Sentiment Analysis For
Code-Mixed Social Media Text Using an Ensemble Model [1.1265248232450553]
本研究では,コードミキシングされたHinglishテキストの感情分析を活発に完了するシステムNITS-Hinglish-SentiMixを提案する。
提案したフレームワークはテストデータに対して0.617のFスコアを記録している。
論文 参考訳(メタデータ) (2020-07-23T15:45:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。