論文の概要: HPCC-YNU at SemEval-2020 Task 9: A Bilingual Vector Gating Mechanism for
Sentiment Analysis of Code-Mixed Text
- arxiv url: http://arxiv.org/abs/2010.04935v1
- Date: Sat, 10 Oct 2020 08:02:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 22:27:12.353903
- Title: HPCC-YNU at SemEval-2020 Task 9: A Bilingual Vector Gating Mechanism for
Sentiment Analysis of Code-Mixed Text
- Title(参考訳): HPCC-YNU at SemEval-2020 Task 9: A Bilingual Vector Gating Mechanism for Sentiment Analysis of Code-Mixed Text (英語)
- Authors: Jun Kong, Jin Wang and Xuejie Zhang
- Abstract要約: 本稿では,バイリンガルなベクトルゲーティング機構をバイリンガルなリソースに利用してタスクを完了させるシステムを提案する。
私たちはパングリッシュで5位、ヒングリッシュで19位を獲得しました。
- 参考スコア(独自算出の注目度): 10.057804086733576
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is fairly common to use code-mixing on a social media platform to express
opinions and emotions in multilingual societies. The purpose of this task is to
detect the sentiment of code-mixed social media text. Code-mixed text poses a
great challenge for the traditional NLP system, which currently uses
monolingual resources to deal with the problem of multilingual mixing. This
task has been solved in the past using lexicon lookup in respective sentiment
dictionaries and using a long short-term memory (LSTM) neural network for
monolingual resources. In this paper, we (my codalab username is kongjun)
present a system that uses a bilingual vector gating mechanism for bilingual
resources to complete the task. The model consists of two main parts: the
vector gating mechanism, which combines the character and word levels, and the
attention mechanism, which extracts the important emotional parts of the text.
The results show that the proposed system outperforms the baseline algorithm.
We achieved fifth place in Spanglish and 19th place in Hinglish.The code of
this paper is availabled at : https://github.com/JunKong5/Semveal2020-task9
- Abstract(参考訳): ソーシャルメディアプラットフォーム上で、多言語社会における意見や感情を表現するためにコードミキシングを使うのが一般的である。
このタスクの目的は、コード混合ソーシャルメディアテキストの感情を検出することである。
コード混合テキストは従来のNLPシステムにとって大きな課題であり、現在、多言語混合の問題に対処するためにモノリンガルリソースを使用している。
この課題は、感情辞書の辞書検索や、モノリンガルリソースのための長期記憶(LSTM)ニューラルネットワークを用いて過去に解決されてきた。
本稿では,2言語間ベクトルゲーティング機構を用いてタスクを完了させるシステムを提案する。
このモデルは、文字と単語のレベルを組み合わせたベクターゲーティング機構と、テキストの重要な感情的な部分を抽出するアテンションメカニズムの2つの主要部分から構成されている。
その結果,提案システムはベースラインアルゴリズムよりも優れていた。
この論文のコードは、https://github.com/junkong5/semveal2020-task9で利用可能である。
関連論文リスト
- A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching [60.51839859852572]
我々は,テキストを多言語セマンティックマッチングのためのマルチコンセプトに分解し,NERモデルに依存するモデルからモデルを解放することを提案する。
英語データセットのQQPとMRPC、中国語データセットのMedical-SMについて包括的な実験を行った。
論文 参考訳(メタデータ) (2024-03-05T13:55:16Z) - DAMO-NLP at SemEval-2023 Task 2: A Unified Retrieval-augmented System
for Multilingual Named Entity Recognition [94.90258603217008]
MultiCoNER RNum2共有タスクは、細粒度でノイズの多いシナリオにおいて、多言語の名前付きエンティティ認識(NER)に取り組むことを目的としている。
MultiCoNER RNum1の以前のトップシステムは、ナレッジベースまたはガゼッタを組み込んでいる。
細粒度多言語NERのための統一検索拡張システム(U-RaNER)を提案する。
論文 参考訳(メタデータ) (2023-05-05T16:59:26Z) - Transformer-based Model for Word Level Language Identification in
Code-mixed Kannada-English Texts [55.41644538483948]
コードミキシングしたカンナダ英語テキストにおける単語レベル言語識別のためのトランスフォーマーベースモデルを提案する。
The proposed model on the CoLI-Kenglish dataset achieves a weighted F1-score of 0.84 and a macro F1-score of 0.61。
論文 参考訳(メタデータ) (2022-11-26T02:39:19Z) - Evaluating Input Representation for Language Identification in
Hindi-English Code Mixed Text [4.4904382374090765]
コードミックステキストは複数の言語で書かれたテキストからなる。
人は自然に現地の言語と英語のようなグローバルな言語を組み合わせる傾向がある。
本研究では,ヒンディー語と英語の混成テキストのコード混成文における言語識別に着目した。
論文 参考訳(メタデータ) (2020-11-23T08:08:09Z) - gundapusunil at SemEval-2020 Task 9: Syntactic Semantic LSTM
Architecture for SENTIment Analysis of Code-MIXed Data [7.538482310185133]
我々はSemEval 2020: Task 9 on Sentiment Analysis for Code-Mixed Social Media Textを開発した。
本システムはまず,ソーシャルメディアテキストの埋め込みを2種類生成する。
論文 参考訳(メタデータ) (2020-10-09T07:07:04Z) - FILTER: An Enhanced Fusion Method for Cross-lingual Language
Understanding [85.29270319872597]
我々は,XLMファインタニングの入力として言語間データを利用する拡張融合法を提案する。
推論中は、ターゲット言語で入力されたテキストとソース言語の翻訳に基づいて予測を行う。
この問題に対処するため,対象言語における翻訳テキストのための自動生成ソフト擬似ラベルに基づくモデル学習のためのKL分割自己学習損失を提案する。
論文 参考訳(メタデータ) (2020-09-10T22:42:15Z) - NLP-CIC at SemEval-2020 Task 9: Analysing sentiment in code-switching
language using a simple deep-learning classifier [63.137661897716555]
コードスイッチングは、2つ以上の言語が同じメッセージで使用される現象である。
標準的な畳み込みニューラルネットワークモデルを用いて、スペイン語と英語の混在するツイートの感情を予測する。
論文 参考訳(メタデータ) (2020-09-07T19:57:09Z) - ULD@NUIG at SemEval-2020 Task 9: Generative Morphemes with an Attention
Model for Sentiment Analysis in Code-Mixed Text [1.4926515182392508]
本稿では,SemEval 2020 Task 9 SentiMixに寄与したGenMAモデル感情分析システムについて述べる。
このシステムは、単語レベルの言語タグを使わずに、与えられた英語とヒンディー語を混合したツイートの感情を予測することを目的としている。
論文 参考訳(メタデータ) (2020-07-27T23:58:54Z) - JUNLP@SemEval-2020 Task 9:Sentiment Analysis of Hindi-English code mixed
data using Grid Search Cross Validation [3.5169472410785367]
私たちは、Code-Mixed Sentiment Analysisのドメインに対する、もっとも有効なソリューションの開発に重点を置いています。
この作業はSemEval-2020 Sentimix Taskへの参加として行われた。
論文 参考訳(メタデータ) (2020-07-24T15:06:48Z) - IIT Gandhinagar at SemEval-2020 Task 9: Code-Mixed Sentiment
Classification Using Candidate Sentence Generation and Selection [1.2301855531996841]
コードミキシングは、非標準の書き込みスタイルのためにテキストの感情を分析することの難しさを増す。
本稿では,Bi-LSTMに基づくニューラル分類器上での文生成と選択に基づく提案手法を提案する。
提案手法は,Bi-LSTMに基づくニューラル分類器と比較して,システム性能の向上を示す。
論文 参考訳(メタデータ) (2020-06-25T14:59:47Z) - A Multi-Perspective Architecture for Semantic Code Search [58.73778219645548]
テキストマッチングのための新しい多言語間ニューラルネットワークを提案する。
CoNaLaデータセットを用いた実験により,提案したモデルでは,従来の手法よりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2020-05-06T04:46:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。