論文の概要: IIT Gandhinagar at SemEval-2020 Task 9: Code-Mixed Sentiment
Classification Using Candidate Sentence Generation and Selection
- arxiv url: http://arxiv.org/abs/2006.14465v3
- Date: Thu, 23 Jul 2020 05:03:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 04:07:09.664969
- Title: IIT Gandhinagar at SemEval-2020 Task 9: Code-Mixed Sentiment
Classification Using Candidate Sentence Generation and Selection
- Title(参考訳): SemEval-2020 Task 9 における IIT Gandhinagar: 候補文生成と選択を用いたコード混合知覚分類
- Authors: Vivek Srivastava, Mayank Singh
- Abstract要約: コードミキシングは、非標準の書き込みスタイルのためにテキストの感情を分析することの難しさを増す。
本稿では,Bi-LSTMに基づくニューラル分類器上での文生成と選択に基づく提案手法を提案する。
提案手法は,Bi-LSTMに基づくニューラル分類器と比較して,システム性能の向上を示す。
- 参考スコア(独自算出の注目度): 1.2301855531996841
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Code-mixing is the phenomenon of using multiple languages in the same
utterance of a text or speech. It is a frequently used pattern of communication
on various platforms such as social media sites, online gaming, product
reviews, etc. Sentiment analysis of the monolingual text is a well-studied
task. Code-mixing adds to the challenge of analyzing the sentiment of the text
due to the non-standard writing style. We present a candidate sentence
generation and selection based approach on top of the Bi-LSTM based neural
classifier to classify the Hinglish code-mixed text into one of the three
sentiment classes positive, negative, or neutral. The proposed approach shows
an improvement in the system performance as compared to the Bi-LSTM based
neural classifier. The results present an opportunity to understand various
other nuances of code-mixing in the textual data, such as humor-detection,
intent classification, etc.
- Abstract(参考訳): コードミキシングは、テキストや音声と同じ発話で複数の言語を使用する現象である。
ソーシャルメディアサイトやオンラインゲーム,製品レビューなど,さまざまなプラットフォーム上で頻繁に使用されるコミュニケーションパターンである。
単言語文の感性分析はよく研究された課題である。
コードミキシングは、非標準の書き込みスタイルのためにテキストの感情を分析することの難しさを増す。
本稿では,bi-lstmに基づくニューラル分類器上での候補文生成と選択に基づくアプローチを提案し,hinglish符号混合テキストを肯定的,否定的,中立的3つの感情クラスに分類する。
提案手法は,Bi-LSTMに基づくニューラル分類器と比較して,システム性能の向上を示す。
その結果、ユーモア検出や意図分類など、テキストデータにおけるコード混合の様々なニュアンスを理解する機会が得られた。
関連論文リスト
- Code-Mixed Text to Speech Synthesis under Low-Resource Constraints [6.544954579068865]
本稿では,eコマースアプリケーション向けに構築されたHindi-English TTSシステムについて述べる。
本稿では,個々の言語におけるモノリンガルデータセットを利用したデータ指向手法を提案する。
純粋なコード混在テストセットでは、コード混在のない単一のスクリプトバイランガルトレーニングが有効であることを示す。
論文 参考訳(メタデータ) (2023-12-02T10:40:38Z) - Like a Good Nearest Neighbor: Practical Content Moderation and Text
Classification [66.02091763340094]
LaGoNN(Good Nearest Neighbor)は、学習可能なパラメータを導入することなく、隣人の情報で入力テキストを変更するSetFitの変更である。
LaGoNNは望ましくないコンテンツやテキスト分類のフラグ付けに有効であり、SetFitのパフォーマンスを改善する。
論文 参考訳(メタデータ) (2023-02-17T15:43:29Z) - A Vector Quantized Approach for Text to Speech Synthesis on Real-World
Spontaneous Speech [94.64927912924087]
我々は、YouTubeやポッドキャストから現実の音声を使ってTSシステムを訓練する。
最近のText-to-Speechアーキテクチャは、複数のコード生成とモノトニックアライメントのために設計されている。
近年のテキスト・トゥ・スペーチ・アーキテクチャは,いくつかの客観的・主観的尺度において,既存のTSシステムより優れていることを示す。
論文 参考訳(メタデータ) (2023-02-08T17:34:32Z) - SpeechLM: Enhanced Speech Pre-Training with Unpaired Textual Data [100.46303484627045]
本稿では,事前定義した統一表現と音声とテキストの事前学習を協調させるクロスモーダル音声言語モデル(SpeechLM)を提案する。
具体的には、音声とテキストのモダリティをブリッジするために、2つの別の離散トークン化器を導入する。
音声認識, 音声翻訳, ユニバーサル表現評価フレームワーク SUPERB など, 様々な音声言語処理タスクにおける音声LM の評価を行った。
論文 参考訳(メタデータ) (2022-09-30T09:12:10Z) - Spoken Style Learning with Multi-modal Hierarchical Context Encoding for
Conversational Text-to-Speech Synthesis [59.27994987902646]
歴史的会話から話し言葉のスタイルを学習する研究は、まだ初期段階にある。
歴史的会話の書き起こしのみが考慮され、歴史的スピーチの話し方を無視している。
マルチモーダル階層型コンテキスト符号化を用いた音声スタイル学習手法を提案する。
論文 参考訳(メタデータ) (2021-06-11T08:33:52Z) - JUNLP@Dravidian-CodeMix-FIRE2020: Sentiment Classification of Code-Mixed
Tweets using Bi-Directional RNN and Language Tags [14.588109573710431]
本稿では、双方向LSTMと言語タグ付けを用いて、ソーシャルメディアから抽出したコードミキシングタミルテキストの感情タグ付けを容易にする。
提案アルゴリズムは精度、リコール、F1スコアはそれぞれ0.59点、0.66点、0.58点である。
論文 参考訳(メタデータ) (2020-10-20T08:10:29Z) - HPCC-YNU at SemEval-2020 Task 9: A Bilingual Vector Gating Mechanism for
Sentiment Analysis of Code-Mixed Text [10.057804086733576]
本稿では,バイリンガルなベクトルゲーティング機構をバイリンガルなリソースに利用してタスクを完了させるシステムを提案する。
私たちはパングリッシュで5位、ヒングリッシュで19位を獲得しました。
論文 参考訳(メタデータ) (2020-10-10T08:02:15Z) - gundapusunil at SemEval-2020 Task 9: Syntactic Semantic LSTM
Architecture for SENTIment Analysis of Code-MIXed Data [7.538482310185133]
我々はSemEval 2020: Task 9 on Sentiment Analysis for Code-Mixed Social Media Textを開発した。
本システムはまず,ソーシャルメディアテキストの埋め込みを2種類生成する。
論文 参考訳(メタデータ) (2020-10-09T07:07:04Z) - NLP-CIC at SemEval-2020 Task 9: Analysing sentiment in code-switching
language using a simple deep-learning classifier [63.137661897716555]
コードスイッチングは、2つ以上の言語が同じメッセージで使用される現象である。
標準的な畳み込みニューラルネットワークモデルを用いて、スペイン語と英語の混在するツイートの感情を予測する。
論文 参考訳(メタデータ) (2020-09-07T19:57:09Z) - ULD@NUIG at SemEval-2020 Task 9: Generative Morphemes with an Attention
Model for Sentiment Analysis in Code-Mixed Text [1.4926515182392508]
本稿では,SemEval 2020 Task 9 SentiMixに寄与したGenMAモデル感情分析システムについて述べる。
このシステムは、単語レベルの言語タグを使わずに、与えられた英語とヒンディー語を混合したツイートの感情を予測することを目的としている。
論文 参考訳(メタデータ) (2020-07-27T23:58:54Z) - Unsupervised Cross-Modal Audio Representation Learning from Unstructured
Multilingual Text [69.55642178336953]
教師なし音声表現学習へのアプローチを提案する。
3重項ニューラルネットワークアーキテクチャに基づいて、意味論的に関連付けられたクロスモーダル情報を用いて、音声トラック関連性を推定する。
我々のアプローチは、様々なアノテーションスタイルと、このコレクションの異なる言語に不変であることを示す。
論文 参考訳(メタデータ) (2020-03-27T07:37:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。