論文の概要: Towards Emotion Recognition in Hindi-English Code-Mixed Data: A
Transformer Based Approach
- arxiv url: http://arxiv.org/abs/2102.09943v1
- Date: Fri, 19 Feb 2021 14:07:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-22 23:03:39.472045
- Title: Towards Emotion Recognition in Hindi-English Code-Mixed Data: A
Transformer Based Approach
- Title(参考訳): ヒンディー語符号混合データにおける感情認識に向けて:トランスフォーマーに基づくアプローチ
- Authors: Anshul Wadhawan, Akshita Aggarwal
- Abstract要約: 感情検出のためのラベル付きhinglishデータセットを提案する。
ヒンディー語と英語の混成ツイートの感情を検出するための深層学習に基づくアプローチに注目した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the last few years, emotion detection in social-media text has become a
popular problem due to its wide ranging application in better understanding the
consumers, in psychology, in aiding human interaction with computers, designing
smart systems etc. Because of the availability of huge amounts of data from
social-media, which is regularly used for expressing sentiments and opinions,
this problem has garnered great attention. In this paper, we present a Hinglish
dataset labelled for emotion detection. We highlight a deep learning based
approach for detecting emotions in Hindi-English code mixed tweets, using
bilingual word embeddings derived from FastText and Word2Vec approaches, as
well as transformer based models. We experiment with various deep learning
models, including CNNs, LSTMs, Bi-directional LSTMs (with and without
attention), along with transformers like BERT, RoBERTa, and ALBERT. The
transformer based BERT model outperforms all other models giving the best
performance with an accuracy of 71.43%.
- Abstract(参考訳): 近年,社会・メディアテキストにおける感情検出は,消費者の理解,心理学,コンピュータとのヒューマンインタラクションの支援,スマートシステムの設計などの幅広い応用により,一般的な問題となっている。
感情や意見を表現するために定期的に使用されるソーシャルメディアからの膨大なデータが利用可能であるため、この問題は大きな注目を集めている。
本稿では,感情検出のためのラベル付きhinglishデータセットを提案する。
我々は、ヒンズー語と英語の混成ツイートにおける感情検出のための深層学習に基づくアプローチに注目し、fasttext と word2vec のアプローチから派生したバイリンガルな単語埋め込みとトランスフォーマーベースのモデルを用いている。
CNN、LSTM、双方向LSTM(注意を払わずに)、BERT、RoBERTa、ALBERTなどのトランスなど、さまざまなディープラーニングモデルを実験しています。
変換器ベースのBERTモデルは、71.43%の精度で最高の性能を発揮する他のモデルよりも優れている。
関連論文リスト
- Comparative Study of Pre-Trained BERT Models for Code-Mixed
Hindi-English Data [0.7874708385247353]
コードミックス(Code Mixed)とは、複数の言語を同一のテキストで使用すること。
本研究では、低リソースのヒンディー語-英語のコード混合言語に焦点を当てる。
我々は,HingBERTに基づくモデルを用いて,各データセットの最先端結果について報告する。
論文 参考訳(メタデータ) (2023-05-25T05:10:28Z) - Hate Speech and Offensive Language Detection using an Emotion-aware
Shared Encoder [1.8734449181723825]
ヘイトスピーチと攻撃的言語検出に関する既存の研究は、事前学習されたトランスフォーマーモデルに基づいて有望な結果をもたらす。
本稿では,他コーパスから抽出した外的感情特徴を組み合わせたマルチタスク共同学習手法を提案する。
以上の結果から,感情的な知識が,データセット間のヘイトスピーチや攻撃的言語をより確実に識別する上で有効であることが示唆された。
論文 参考訳(メタデータ) (2023-02-17T09:31:06Z) - Improving the Generalizability of Text-Based Emotion Detection by
Leveraging Transformers with Psycholinguistic Features [27.799032561722893]
本稿では,両方向長短期記憶(BiLSTM)ネットワークと変換器モデル(BERT,RoBERTa)を併用したテキストベースの感情検出手法を提案する。
提案したハイブリッドモデルでは,標準的なトランスフォーマーベースアプローチと比較して,分布外データへの一般化能力の向上が期待できる。
論文 参考訳(メタデータ) (2022-12-19T13:58:48Z) - XDBERT: Distilling Visual Information to BERT from Cross-Modal Systems
to Improve Language Understanding [73.24847320536813]
本研究では,事前学習したマルチモーダル変換器から事前学習した言語エンコーダへの視覚情報の蒸留について検討する。
我々のフレームワークは,NLUの言語重み特性に適応するために学習目標を変更する一方で,視覚言語タスクにおけるクロスモーダルエンコーダの成功にインスパイアされている。
論文 参考訳(メタデータ) (2022-04-15T03:44:00Z) - BERTuit: Understanding Spanish language in Twitter through a native
transformer [70.77033762320572]
bfBERTuitは、これまでスペイン語のために提案された大きなトランスフォーマーで、2億3000万のスペイン語ツイートの膨大なデータセットで事前トレーニングされている。
私たちのモチベーションは、スペイン語のTwitterをよりよく理解し、このソーシャルネットワークにフォーカスしたアプリケーションに利用するための強力なリソースを提供することです。
論文 参考訳(メタデータ) (2022-04-07T14:28:51Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - Multimodal Emotion Recognition using Transfer Learning from Speaker
Recognition and BERT-based models [53.31917090073727]
本稿では,音声とテキストのモダリティから,伝達学習モデルと微調整モデルとを融合したニューラルネットワークによる感情認識フレームワークを提案する。
本稿では,対話型感情的モーションキャプチャー・データセットにおけるマルチモーダル・アプローチの有効性を評価する。
論文 参考訳(メタデータ) (2022-02-16T00:23:42Z) - Multimodal Emotion Recognition with High-level Speech and Text Features [8.141157362639182]
本稿では,wav2vec 2.0音声特徴量に対する感情認識を実現するために,新しいクロス表現音声モデルを提案する。
また、Transformerベースのモデルを用いて抽出したテキスト特徴から感情を認識するために、CNNベースのモデルをトレーニングする。
本手法は,4クラス分類問題においてIEMOCAPデータセットを用いて評価する。
論文 参考訳(メタデータ) (2021-09-29T07:08:40Z) - FBERT: A Neural Transformer for Identifying Offensive Content [67.12838911384024]
fBERTは、SOLIDで再訓練されたBERTモデルである。
複数の英文データセット上での攻撃的内容の同定におけるfBERTの性能を評価し、SOLIDからインスタンスを選択するためのしきい値をテストする。
fBERTモデルは、コミュニティで自由に利用できるようになる。
論文 参考訳(メタデータ) (2021-09-10T19:19:26Z) - Offensive Language and Hate Speech Detection with Deep Learning and
Transfer Learning [1.77356577919977]
我々は、ツイートを自動的に3つのクラスに分類するアプローチを提案する。
我々は、テキスト分類、感情チェック、テキストデータ拡張を含む主要な機能を含むクラスモジュールを作成する。
論文 参考訳(メタデータ) (2021-08-06T20:59:47Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。