論文の概要: ULD@NUIG at SemEval-2020 Task 9: Generative Morphemes with an Attention
Model for Sentiment Analysis in Code-Mixed Text
- arxiv url: http://arxiv.org/abs/2008.01545v1
- Date: Mon, 27 Jul 2020 23:58:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 08:38:46.701757
- Title: ULD@NUIG at SemEval-2020 Task 9: Generative Morphemes with an Attention
Model for Sentiment Analysis in Code-Mixed Text
- Title(参考訳): ULD@NUIG at SemEval-2020 Task 9: Generative Morphemes with an Attention Model for Sentiment Analysis in Code-Mixed Text (英語)
- Authors: Koustava Goswami, Priya Rani, Bharathi Raja Chakravarthi, Theodorus
Fransen, and John P. McCrae
- Abstract要約: 本稿では,SemEval 2020 Task 9 SentiMixに寄与したGenMAモデル感情分析システムについて述べる。
このシステムは、単語レベルの言語タグを使わずに、与えられた英語とヒンディー語を混合したツイートの感情を予測することを目的としている。
- 参考スコア(独自算出の注目度): 1.4926515182392508
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Code mixing is a common phenomena in multilingual societies where people
switch from one language to another for various reasons. Recent advances in
public communication over different social media sites have led to an increase
in the frequency of code-mixed usage in written language. In this paper, we
present the Generative Morphemes with Attention (GenMA) Model sentiment
analysis system contributed to SemEval 2020 Task 9 SentiMix. The system aims to
predict the sentiments of the given English-Hindi code-mixed tweets without
using word-level language tags instead inferring this automatically using a
morphological model. The system is based on a novel deep neural network (DNN)
architecture, which has outperformed the baseline F1-score on the test data-set
as well as the validation data-set. Our results can be found under the user
name "koustava" on the "Sentimix Hindi English" page
- Abstract(参考訳): コードミキシングは多言語社会でよくある現象であり、人々は様々な理由である言語から別の言語に切り替える。
様々なソーシャルメディアサイトでのパブリックコミュニケーションの進歩は、文字言語によるコード混合利用の頻度を増加させた。
本稿では,semeval 2020タスク9センティミックスに寄与する注意(genma)モデル感情分析システムについて述べる。
本システムは,英語とヒンディー語を混合したツイートの感情を,単語レベルの言語タグを使わずに予測することを目的としている。
このシステムは、新しいディープニューラルネットワーク(dnn)アーキテクチャに基づいており、テストデータセットのベースラインであるf1-scoreや検証データセットよりも優れています。
我々の結果は "Sentimix Hindi English" ページのユーザ名 "koustava" で確認できます。
関連論文リスト
- Generative Spoken Language Model based on continuous word-sized audio
tokens [52.081868603603844]
本稿では,単語サイズ連続評価音声埋め込みに基づく生成音声言語モデルを提案する。
結果として得られるモデルは、単語サイズの連続埋め込みに基づく最初の生成言語モデルである。
論文 参考訳(メタデータ) (2023-10-08T16:46:14Z) - Transformer-based Model for Word Level Language Identification in
Code-mixed Kannada-English Texts [55.41644538483948]
コードミキシングしたカンナダ英語テキストにおける単語レベル言語識別のためのトランスフォーマーベースモデルを提案する。
The proposed model on the CoLI-Kenglish dataset achieves a weighted F1-score of 0.84 and a macro F1-score of 0.61。
論文 参考訳(メタデータ) (2022-11-26T02:39:19Z) - Towards Zero-shot Language Modeling [90.80124496312274]
人間の言語学習に誘導的に偏りを持つニューラルモデルを構築した。
類型的に多様な訓練言語のサンプルからこの分布を推測する。
我々は、保留言語に対する遠隔監視として、追加の言語固有の側情報を利用する。
論文 参考訳(メタデータ) (2021-08-06T23:49:18Z) - Paraphrastic Representations at Scale [134.41025103489224]
私たちは、英語、アラビア語、ドイツ語、フランス語、スペイン語、ロシア語、トルコ語、中国語の訓練されたモデルをリリースします。
我々はこれらのモデルを大量のデータでトレーニングし、元の論文から大幅に性能を向上した。
論文 参考訳(メタデータ) (2021-04-30T16:55:28Z) - Sentiment Analysis of Persian-English Code-mixed Texts [0.0]
ソーシャルメディアデータの構造化されていない性質から,多言語テキストやコード混合テキストの例が増えている。
本研究では,ペルシャ語と英語の混成ツイートのデータセットを収集,ラベル付けし,作成する。
本稿では,BERTプレトレーニング済み埋め込みと翻訳モデルを用いて,これらのツイートの極性スコアを自動的に学習するモデルを提案する。
論文 参考訳(メタデータ) (2021-02-25T06:05:59Z) - gundapusunil at SemEval-2020 Task 9: Syntactic Semantic LSTM
Architecture for SENTIment Analysis of Code-MIXed Data [7.538482310185133]
我々はSemEval 2020: Task 9 on Sentiment Analysis for Code-Mixed Social Media Textを開発した。
本システムはまず,ソーシャルメディアテキストの埋め込みを2種類生成する。
論文 参考訳(メタデータ) (2020-10-09T07:07:04Z) - kk2018 at SemEval-2020 Task 9: Adversarial Training for Code-Mixing
Sentiment Classification [18.41476971318978]
コードスイッチング(英: Code switch)とは、話者が複数の言語を共有する多言語環境において発生する言語現象である。
本研究では、コードミキシングデータセット上で、最先端のユニ言語モデルERNIEからのドメイン転送学習をテストする。
多言語モデルによる対戦訓練は、セムヴァル2020タスク9ヒンディー語の感情分類競技の第1位を達成するために使用される。
論文 参考訳(メタデータ) (2020-09-08T12:20:04Z) - NLP-CIC at SemEval-2020 Task 9: Analysing sentiment in code-switching
language using a simple deep-learning classifier [63.137661897716555]
コードスイッチングは、2つ以上の言語が同じメッセージで使用される現象である。
標準的な畳み込みニューラルネットワークモデルを用いて、スペイン語と英語の混在するツイートの感情を予測する。
論文 参考訳(メタデータ) (2020-09-07T19:57:09Z) - JUNLP@SemEval-2020 Task 9:Sentiment Analysis of Hindi-English code mixed
data using Grid Search Cross Validation [3.5169472410785367]
私たちは、Code-Mixed Sentiment Analysisのドメインに対する、もっとも有効なソリューションの開発に重点を置いています。
この作業はSemEval-2020 Sentimix Taskへの参加として行われた。
論文 参考訳(メタデータ) (2020-07-24T15:06:48Z) - IIT Gandhinagar at SemEval-2020 Task 9: Code-Mixed Sentiment
Classification Using Candidate Sentence Generation and Selection [1.2301855531996841]
コードミキシングは、非標準の書き込みスタイルのためにテキストの感情を分析することの難しさを増す。
本稿では,Bi-LSTMに基づくニューラル分類器上での文生成と選択に基づく提案手法を提案する。
提案手法は,Bi-LSTMに基づくニューラル分類器と比較して,システム性能の向上を示す。
論文 参考訳(メタデータ) (2020-06-25T14:59:47Z) - Rnn-transducer with language bias for end-to-end Mandarin-English
code-switching speech recognition [58.105818353866354]
本稿では,言語バイアスを考慮したリカレントニューラルネットワークトランスデューサ(RNN-T)モデルを提案する。
我々は、CSの点を予測するためにモデルにバイアスを与えるために、言語アイデンティティを使用する。
これにより、言語識別情報を転写から直接学習するモデルが促進され、追加のLIDモデルが不要になる。
論文 参考訳(メタデータ) (2020-02-19T12:01:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。