論文の概要: Decision Tree J48 at SemEval-2020 Task 9: Sentiment Analysis for
Code-Mixed Social Media Text (Hinglish)
- arxiv url: http://arxiv.org/abs/2008.11398v1
- Date: Wed, 26 Aug 2020 06:30:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 21:28:06.361239
- Title: Decision Tree J48 at SemEval-2020 Task 9: Sentiment Analysis for
Code-Mixed Social Media Text (Hinglish)
- Title(参考訳): decision tree j48 at semeval-2020 task 9: sentiment analysis for code-mixed social media text (hinglish)
- Authors: Gaurav Singh
- Abstract要約: このシステムは、ツイートの分類のための分類器を提供するツールとして、Wekaを使用している。
pythonは提供されたファイルからデータをロードし、クリーニングするために使われる。
システム性能は,公式競技評価基準F1スコアを用いて評価した。
- 参考スコア(独自算出の注目度): 3.007778295477907
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper discusses the design of the system used for providing a solution
for the problem given at SemEval-2020 Task 9 where sentiment analysis of
code-mixed language Hindi and English needed to be performed. This system uses
Weka as a tool for providing the classifier for the classification of tweets
and python is used for loading the data from the files provided and cleaning
it. Only part of the training data was provided to the system for classifying
the tweets in the test data set on which evaluation of the system was done. The
system performance was assessed using the official competition evaluation
metric F1-score. Classifier was trained on two sets of training data which
resulted in F1 scores of 0.4972 and 0.5316.
- Abstract(参考訳): 本稿では,コード混在言語Hindiと英語の感情分析が必要なSemEval-2020 Task 9における課題に対する解決策を提供するために使用されるシステムの設計について論じる。
このシステムは、ツイートの分類のための分類器を提供するツールとしてWekaを使用し、提供されたファイルからデータをロードしてクリーニングするためにpythonを使用する。
システム評価を行ったテストデータセット内のツイートを分類するためのシステムには,トレーニングデータの一部のみが提供された。
システム性能は,公式競技評価基準F1スコアを用いて評価した。
分類器は2つの訓練データに基づいて訓練され、その結果F1スコアは0.4972と0.5316となった。
関連論文リスト
- SEAHORSE: A Multilingual, Multifaceted Dataset for Summarization
Evaluation [52.186343500576214]
本稿では,多言語・多面的要約評価のためのデータセットSEAHORSEを紹介する。
SEAHORSEは、テキスト品質の6次元に沿って人間格付けされた96Kの要約で構成されている。
本稿では,SEAHORSEでトレーニングしたメトリクスが,ドメイン外メタ評価ベンチマークTRUEとmFACEで高い性能を示すことを示す。
論文 参考訳(メタデータ) (2023-05-22T16:25:07Z) - Using Rater and System Metadata to Explain Variance in the VoiceMOS
Challenge 2022 Dataset [71.93633698146002]
VoiceMOS 2022チャレンジでは、合成音声変換と主観的なラベル付き音声音声合成サンプルのデータセットが提供された。
本研究では,メタデータからの音声品質の主観評価とデータセットの分布不均衡から説明できる分散量について検討する。
論文 参考訳(メタデータ) (2022-09-14T00:45:49Z) - UrduFake@FIRE2020: Shared Track on Fake News Identification in Urdu [62.6928395368204]
本稿では、ウルドゥー語における偽ニュース検出に関するFIRE 2020における最初の共有タスクの概要について述べる。
目標は、900の注釈付きニュース記事と400のニュース記事からなるデータセットを使って偽ニュースを特定することである。
データセットには、 (i) Health、 (ii) Sports、 (iii) Showbiz、 (iv) Technology、 (v) Businessの5つのドメインのニュースが含まれている。
論文 参考訳(メタデータ) (2022-07-25T03:46:51Z) - Segment-level Metric Learning for Few-shot Bioacoustic Event Detection [56.59107110017436]
本稿では,モデル最適化時の肯定的事象と否定的事象の両方を利用するセグメントレベルの数ショット学習フレームワークを提案する。
本システムでは,DCASE2022チャレンジタスク5(DCASE2022-T5)のF値62.73の検証を行い,ベースラインプロトタイプネットワーク34.02の性能を大きなマージンで向上させる。
論文 参考訳(メタデータ) (2022-07-15T22:41:30Z) - Detecting Handwritten Mathematical Terms with Sensor Based Data [71.84852429039881]
本稿では,手書きの数学的用語を自動分類する,スタビロによるUbiComp 2021チャレンジの解を提案する。
入力データセットには異なるライターのデータが含まれており、ラベル文字列は合計15の異なる文字から構成されている。
論文 参考訳(メタデータ) (2021-09-12T19:33:34Z) - Sentiment Analysis of Code-Mixed Social Media Text (Hinglish) [4.081440927534578]
感情分析のさまざまな段階は、データ統合、データクリーニング、データ変換、モデリングであった。
モデルは、SVM、KNN、Decision Trees、Random Forests、Naive Bayes、Logistic Regression、およびアンサンブル投票分類器など、さまざまな機械学習アルゴリズムを使用して作成された。
論文 参考訳(メタデータ) (2021-02-24T09:15:34Z) - KBCNMUJAL@HASOC-Dravidian-CodeMix-FIRE2020: Using Machine Learning for
Detection of Hate Speech and Offensive Code-Mixed Social Media text [1.0499611180329804]
本論文では,欧州言語におけるHate Speech と Offensive Content Identification の共有タスク 2 タスクについて,KBCNMUJAL チームから提出されたシステムについて述べる。
2つのドラヴィディアン言語Vizのデータセット。
サイズ4000のマラヤラムとタミルは、それぞれHASOC主催者によって共有されました。
両言語で開発された最も優れた分類モデルは、テストデータセットに適用される。
論文 参考訳(メタデータ) (2021-02-19T11:08:02Z) - WESSA at SemEval-2020 Task 9: Code-Mixed Sentiment Analysis using
Transformers [0.0]
本稿では,SemEval 2020 Task 9, Code-Mixed Social Media Text の感性分析を行う。
我々の最高の演奏システムは「XLM-RoBERTa」を微調整したトランスファーラーニングベースモデルである
その後の提出では、CodaLabのユーザネーム"ahmed0sultan"を使ってテストセットの平均F1スコアを75.9%達成することに成功した。
論文 参考訳(メタデータ) (2020-09-21T13:59:24Z) - NAYEL at SemEval-2020 Task 12: TF/IDF-Based Approach for Automatic
Offensive Language Detection in Arabic Tweets [0.0]
提案システムは,アラビア語のつぶやきにおける攻撃的言語を自動的に識別することを目的としている。
機械学習に基づくアプローチがシステムの設計に使われてきた。
最上位のシステムと最終ランクのシステムは、それぞれテストセットで90.17%と44.51%のf1スコアを報告した。
論文 参考訳(メタデータ) (2020-07-27T07:44:00Z) - Voice@SRIB at SemEval-2020 Task 9 and 12: Stacked Ensembling method for
Sentiment and Offensiveness detection in Social Media [2.9008108937701333]
埋め込み、Sentimixのアンサンブルメソッド、OffensEvalタスクをトレーニングします。
我々は、マクロF1スコア、精度、精度、およびデータセットのリコールについて、我々のモデルを評価する。
論文 参考訳(メタデータ) (2020-07-20T11:54:43Z) - Overview of the TREC 2019 Fair Ranking Track [65.15263872493799]
TREC Fair Ranking トラックの目標は、異なるコンテンツプロバイダに対する公正性の観点から、検索システムを評価するベンチマークを開発することであった。
本稿では,タスク定義やデータ記述,アノテーションプロセスなどを含むトラックの概要について述べる。
論文 参考訳(メタデータ) (2020-03-25T21:34:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。