論文の概要: C1 at SemEval-2020 Task 9: SentiMix: Sentiment Analysis for Code-Mixed
Social Media Text using Feature Engineering
- arxiv url: http://arxiv.org/abs/2008.13549v1
- Date: Sun, 9 Aug 2020 00:46:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 03:58:53.078546
- Title: C1 at SemEval-2020 Task 9: SentiMix: Sentiment Analysis for Code-Mixed
Social Media Text using Feature Engineering
- Title(参考訳): C1 at SemEval-2020 Task 9: SentiMix: Sentiment Analysis for Code-Mixed Social Media Text using Feature Engineering (英語)
- Authors: Laksh Advani and Clement Lu and Suraj Maharjan
- Abstract要約: 本稿では,SemEval-2020 Task 9: SentiMixのコード混合ソーシャルメディアテキストにおける感情分析における特徴工学的アプローチについて述べる。
重み付きF1スコアは、"Hinglish"タスクが0.65、"Spanglish"タスクが0.63となる。
- 参考スコア(独自算出の注目度): 0.9646922337783134
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In today's interconnected and multilingual world, code-mixing of languages on
social media is a common occurrence. While many Natural Language Processing
(NLP) tasks like sentiment analysis are mature and well designed for
monolingual text, techniques to apply these tasks to code-mixed text still
warrant exploration. This paper describes our feature engineering approach to
sentiment analysis in code-mixed social media text for SemEval-2020 Task 9:
SentiMix. We tackle this problem by leveraging a set of hand-engineered
lexical, sentiment, and metadata features to design a classifier that can
disambiguate between "positive", "negative" and "neutral" sentiment. With this
model, we are able to obtain a weighted F1 score of 0.65 for the "Hinglish"
task and 0.63 for the "Spanglish" tasks
- Abstract(参考訳): 今日の相互接続された多言語の世界では、ソーシャルメディア上での言語コード混合が一般的である。
感情分析のような多くの自然言語処理(nlp)タスクは成熟しており、モノリンガルテキスト用によく設計されているが、これらのタスクをコード混合テキストに適用するための技術はまだ探索を必要とする。
本稿では,SemEval-2020 Task 9: SentiMixのコード混合ソーシャルメディアテキストにおける感情分析における特徴工学的アプローチについて述べる。
我々は,「肯定的」「否定的」感情と「中立的」感情の曖昧さを解消できる分類器を設計するために,手書きの語彙的,感情的,メタデータ的特徴を駆使してこの問題に取り組む。
このモデルでは, "hinglish" タスクで 0.65 の重み付き f1 スコアと "spanglish" タスクで 0.63 のスコアを得ることができた。
関連論文リスト
- A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching [60.51839859852572]
我々は,テキストを多言語セマンティックマッチングのためのマルチコンセプトに分解し,NERモデルに依存するモデルからモデルを解放することを提案する。
英語データセットのQQPとMRPC、中国語データセットのMedical-SMについて包括的な実験を行った。
論文 参考訳(メタデータ) (2024-03-05T13:55:16Z) - SemEval 2024 -- Task 10: Emotion Discovery and Reasoning its Flip in
Conversation (EDiReF) [61.49972925493912]
SemEval-2024 Task 10は、コードミキシングされた対話における感情の識別に焦点を当てた共有タスクである。
このタスクは3つの異なるサブタスクから構成される - コードミックス対話のための会話における感情認識、コードミックス対話のための感情フリップ推論、および英語対話のための感情フリップ推論である。
このタスクには84人の参加者が参加し、各サブタスクのF1スコアは0.70、0.79、0.76に達した。
論文 参考訳(メタデータ) (2024-02-29T08:20:06Z) - SESCORE2: Learning Text Generation Evaluation via Synthesizing Realistic
Mistakes [93.19166902594168]
テキスト生成評価のためのモデルベースメトリックを学習するための自己教師型アプローチSESCORE2を提案する。
鍵となる概念は、コーパスから取得した文を摂動することで、現実的なモデルミスを合成することである。
3言語にわたる4つのテキスト生成タスクにおいて,SESCORE2とそれ以前の手法を評価する。
論文 参考訳(メタデータ) (2022-12-19T09:02:16Z) - Transformer-based Model for Word Level Language Identification in
Code-mixed Kannada-English Texts [55.41644538483948]
コードミキシングしたカンナダ英語テキストにおける単語レベル言語識別のためのトランスフォーマーベースモデルを提案する。
The proposed model on the CoLI-Kenglish dataset achieves a weighted F1-score of 0.84 and a macro F1-score of 0.61。
論文 参考訳(メタデータ) (2022-11-26T02:39:19Z) - JUNLP@Dravidian-CodeMix-FIRE2020: Sentiment Classification of Code-Mixed
Tweets using Bi-Directional RNN and Language Tags [14.588109573710431]
本稿では、双方向LSTMと言語タグ付けを用いて、ソーシャルメディアから抽出したコードミキシングタミルテキストの感情タグ付けを容易にする。
提案アルゴリズムは精度、リコール、F1スコアはそれぞれ0.59点、0.66点、0.58点である。
論文 参考訳(メタデータ) (2020-10-20T08:10:29Z) - NLP-CIC at SemEval-2020 Task 9: Analysing sentiment in code-switching
language using a simple deep-learning classifier [63.137661897716555]
コードスイッチングは、2つ以上の言語が同じメッセージで使用される現象である。
標準的な畳み込みニューラルネットワークモデルを用いて、スペイン語と英語の混在するツイートの感情を予測する。
論文 参考訳(メタデータ) (2020-09-07T19:57:09Z) - SemEval-2020 Task 10: Emphasis Selection for Written Text in Visual
Media [50.29389719723529]
本稿では,SemEval-2020 Task 10, Emphasis Selection for Written Text in Visual Media の主な成果とその結果を比較した。
この共有タスクの目的は、強調選択のための自動メソッドを設計することである。
タスクに送信されたシステムの解析は、BERTとRoBERTaが、トレーニング済みモデルの最も一般的な選択であることを示している。
論文 参考訳(メタデータ) (2020-08-07T17:24:53Z) - IUST at SemEval-2020 Task 9: Sentiment Analysis for Code-Mixed Social
Media Text using Deep Neural Networks and Linear Baselines [6.866104126509981]
我々は、与えられたコードミックスツイートの感情を予測するシステムを開発した。
我々の最高の演奏法は、スペイン語のサブタスクに対して0.751得点、ヒンディー語のサブタスクに対して0.706スコアを得る。
論文 参考訳(メタデータ) (2020-07-24T18:48:37Z) - JUNLP@SemEval-2020 Task 9:Sentiment Analysis of Hindi-English code mixed
data using Grid Search Cross Validation [3.5169472410785367]
私たちは、Code-Mixed Sentiment Analysisのドメインに対する、もっとも有効なソリューションの開発に重点を置いています。
この作業はSemEval-2020 Sentimix Taskへの参加として行われた。
論文 参考訳(メタデータ) (2020-07-24T15:06:48Z) - NITS-Hinglish-SentiMix at SemEval-2020 Task 9: Sentiment Analysis For
Code-Mixed Social Media Text Using an Ensemble Model [1.1265248232450553]
本研究では,コードミキシングされたHinglishテキストの感情分析を活発に完了するシステムNITS-Hinglish-SentiMixを提案する。
提案したフレームワークはテストデータに対して0.617のFスコアを記録している。
論文 参考訳(メタデータ) (2020-07-23T15:45:12Z) - HCMS at SemEval-2020 Task 9: A Neural Approach to Sentiment Analysis for
Code-Mixed Texts [0.0]
本稿では,コードミックステキストの感情分類を含むSentimix Hindi-Englishタスクについて述べる。
F1のスコア67.1%で、単純な畳み込みと注意が合理的な結果をもたらすことを示した。
論文 参考訳(メタデータ) (2020-07-23T15:39:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。