論文の概要: Reed at SemEval-2020 Task 9: Fine-Tuning and Bag-of-Words Approaches to
Code-Mixed Sentiment Analysis
- arxiv url: http://arxiv.org/abs/2007.13061v2
- Date: Tue, 4 Aug 2020 05:13:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 19:52:49.119938
- Title: Reed at SemEval-2020 Task 9: Fine-Tuning and Bag-of-Words Approaches to
Code-Mixed Sentiment Analysis
- Title(参考訳): SemEval-2020 Task 9: Fine-Tuning and Bag-of-Words Approachs to Code-Mixed Sentiment Analysis
- Authors: Vinay Gopalan, Mark Hopkins
- Abstract要約: 本研究では,SemEval-2020 大会第9タスク(SentiMix タスク)の参加者として,Hinglish (code-mixed Hindi- English) ツイートに対する感情分析の課題について検討する。
提案手法は,(1)事前学習したBERTモデルの微調整によるトランスファーラーニングの適用,2)単語のバッグ・オブ・ワード表現に基づくフィードフォワードニューラルネットワークのトレーニング,の2つであった。
コンペの結果,Fスコアは71.3%,ベストモデルでは62項目中4位にランクインした。
- 参考スコア(独自算出の注目度): 1.2147145617662432
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We explore the task of sentiment analysis on Hinglish (code-mixed
Hindi-English) tweets as participants of Task 9 of the SemEval-2020
competition, known as the SentiMix task. We had two main approaches: 1)
applying transfer learning by fine-tuning pre-trained BERT models and 2)
training feedforward neural networks on bag-of-words representations. During
the evaluation phase of the competition, we obtained an F-score of 71.3% with
our best model, which placed $4^{th}$ out of 62 entries in the official system
rankings.
- Abstract(参考訳): 本研究では,SemEval-2020 大会第9タスク(SentiMix タスク)の参加者として,Hinglish ツイートに対する感情分析の課題を検討する。
主なアプローチは2つあります
1)微調整による伝達学習の適用とBERTモデル
2) 単語の袋表現に基づくフィードフォワードニューラルネットワークの訓練
評価段階では,f-scoreが71.3%,ベストモデルが62項目中4^{th}$であった。
関連論文リスト
- SmurfCat at SemEval-2024 Task 6: Leveraging Synthetic Data for Hallucination Detection [51.99159169107426]
本稿では,SemEval-2024幻覚検出タスクのための新しいシステムを提案する。
我々の調査は、モデル予測と基準基準を比較するための様々な戦略にまたがっている。
強力なパフォーマンス指標を示す3つの異なる方法を紹介します。
論文 参考訳(メタデータ) (2024-04-09T09:03:44Z) - BJTU-WeChat's Systems for the WMT22 Chat Translation Task [66.81525961469494]
本稿では,WMT'22チャット翻訳タスクに対して,北京地東大学とWeChat AIを共同で提案する。
Transformerに基づいて、いくつかの有効な変種を適用します。
本システムでは,0.810と0.946のCOMETスコアを達成している。
論文 参考訳(メタデータ) (2022-11-28T02:35:04Z) - UrduFake@FIRE2020: Shared Track on Fake News Identification in Urdu [62.6928395368204]
本稿では、ウルドゥー語における偽ニュース検出に関するFIRE 2020における最初の共有タスクの概要について述べる。
目標は、900の注釈付きニュース記事と400のニュース記事からなるデータセットを使って偽ニュースを特定することである。
データセットには、 (i) Health、 (ii) Sports、 (iii) Showbiz、 (iv) Technology、 (v) Businessの5つのドメインのニュースが含まれている。
論文 参考訳(メタデータ) (2022-07-25T03:46:51Z) - Overview of the Shared Task on Fake News Detection in Urdu at FIRE 2020 [62.6928395368204]
タスクはバイナリ分類タスクとして設定され、ゴールはリアルニュースとフェイクニュースを区別することである。
トレーニング用に900の注釈付きニュース記事とテスト用に400のニュース記事のデータセットを作成した。
6カ国(インド、中国、エジプト、ドイツ、パキスタン、イギリス)の42チームが登録された。
論文 参考訳(メタデータ) (2022-07-25T03:41:32Z) - RuArg-2022: Argument Mining Evaluation [69.87149207721035]
本稿は、ロシア語テキストを扱う議論分析システムの最初のコンペティションの主催者の報告である。
新型コロナウイルスの感染拡大に伴う3つの話題について、9,550文(ソーシャルメディア投稿記事)のコーパスを用意した。
両タスクで第一位を獲得したシステムは、BERTアーキテクチャのNLI(Natural Language Inference)変種を使用した。
論文 参考訳(メタデータ) (2022-06-18T17:13:37Z) - Palomino-Ochoa at SemEval-2020 Task 9: Robust System based on
Transformer for Code-Mixed Sentiment Classification [1.6244541005112747]
本稿では、スペイン語と英語の混合感情分類タスクを実行するための移動学習システムを提案する。
提案手法では,最先端の言語モデルBERTを使用し,UMMFiT転送学習パイプラインに組み込む。
論文 参考訳(メタデータ) (2020-11-18T18:25:58Z) - LT3 at SemEval-2020 Task 9: Cross-lingual Embeddings for Sentiment
Analysis of Hinglish Social Media Text [1.0152838128195465]
ヒングリッシュ感情分析の課題を解決するための2つの方法を検討する。
最初のアプローチは、Hinglishと事前訓練された英語のFastText単語の埋め込みを投影した言語間埋め込みを使用する。
第2のアプローチは、Hinglishの一連のツイートで漸進的に再訓練される、事前訓練された英語の埋め込みだ。
論文 参考訳(メタデータ) (2020-10-21T14:03:16Z) - WESSA at SemEval-2020 Task 9: Code-Mixed Sentiment Analysis using
Transformers [0.0]
本稿では,SemEval 2020 Task 9, Code-Mixed Social Media Text の感性分析を行う。
我々の最高の演奏システムは「XLM-RoBERTa」を微調整したトランスファーラーニングベースモデルである
その後の提出では、CodaLabのユーザネーム"ahmed0sultan"を使ってテストセットの平均F1スコアを75.9%達成することに成功した。
論文 参考訳(メタデータ) (2020-09-21T13:59:24Z) - SemEval-2020 Task 9: Overview of Sentiment Analysis of Code-Mixed Tweets [29.74702868712367]
SemEval-2020 Task 9 on Sentiment Analysis of Code-Mixed Tweets (SentiMix 2020) の結果について述べる。
我々は、単語レベルの言語識別と文レベルの感情ラベルを付加したHinglish(ヒンディー語)とSpanglish(スペイン語)のコーパスをリリースし、記述する。
論文 参考訳(メタデータ) (2020-08-10T17:17:52Z) - Deep Learning Brasil -- NLP at SemEval-2020 Task 9: Overview of
Sentiment Analysis of Code-Mixed Tweets [0.2294014185517203]
本稿では、コード混在のつぶやき(ヒンズー・イングリッシュ)における感情を予測する手法について述べる。
CodaLabのVerissimo.manoelというチームが、4つのモデルのアンサンブルに基づいたアプローチを開発しました。
最終分類アルゴリズムは、これらの4つのモデルから得られる全てのソフトマックス値のいくつかの予測の集合である。
論文 参考訳(メタデータ) (2020-07-28T16:42:41Z) - Emotion Recognition for In-the-wild Videos [92.01434273996097]
本稿では, IEEE International Conference on Automatic Face and Gesture Recognition (FG) 2020と共同で開催されているAffective Behavior Analysis in-the-wild competitionの7つの基本的表現分類トラックについて紹介する。
提案手法は,Deep Residual Network (ResNet) とBidirectional Long Short-Term Memory Network (BLSTM) を組み合わせることで,64.3%の精度と43.4%のファイナルメトリックスを実現する。
論文 参考訳(メタデータ) (2020-02-13T11:29:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。