論文の概要: Emoji Prediction: Extensions and Benchmarking
- arxiv url: http://arxiv.org/abs/2007.07389v1
- Date: Tue, 14 Jul 2020 22:41:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 14:33:58.223774
- Title: Emoji Prediction: Extensions and Benchmarking
- Title(参考訳): 絵文字予測:拡張とベンチマーク
- Authors: Weicheng Ma, Ruibo Liu, Lili Wang, Soroush Vosoughi
- Abstract要約: 絵文字予測タスクは、テキストに関連付けられた適切な絵文字セットを予測することを目的としている。
我々は、絵文字予測タスクの既存の設定を拡張し、よりリッチな絵文字セットを含め、複数ラベルの分類を可能にする。
トランスフォーマーネットワークに基づくマルチクラス・マルチラベル絵文字予測のための新しいモデルを提案する。
- 参考スコア(独自算出の注目度): 30.642840676899734
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emojis are a succinct form of language which can express concrete meanings,
emotions, and intentions. Emojis also carry signals that can be used to better
understand communicative intent. They have become a ubiquitous part of our
daily lives, making them an important part of understanding user-generated
content. The emoji prediction task aims at predicting the proper set of emojis
associated with a piece of text. Through emoji prediction, models can learn
rich representations of the communicative intent of the written text. While
existing research on the emoji prediction task focus on a small subset of emoji
types closely related to certain emotions, this setting oversimplifies the task
and wastes the expressive power of emojis. In this paper, we extend the
existing setting of the emoji prediction task to include a richer set of emojis
and to allow multi-label classification on the task. We propose novel models
for multi-class and multi-label emoji prediction based on Transformer networks.
We also construct multiple emoji prediction datasets from Twitter using
heuristics. The BERT models achieve state-of-the-art performances on all our
datasets under all the settings, with relative improvements of 27.21% to
236.36% in accuracy, 2.01% to 88.28% in top-5 accuracy and 65.19% to 346.79% in
F-1 score, compared to the prior state-of-the-art. Our results demonstrate the
efficacy of deep Transformer-based models on the emoji prediction task. We also
release our datasets at
https://github.com/hikari-NYU/Emoji_Prediction_Datasets_MMS for future
researchers.
- Abstract(参考訳): 絵文字は、具体的な意味、感情、意図を表現できる簡潔な言語である。
絵文字には、コミュニケーションの意図をより理解するために使用できるシグナルも備わっている。
それらは私たちの日常生活のユビキタスな部分となり、ユーザー生成コンテンツを理解する重要な部分となっている。
絵文字予測タスクは、テキストに関連付けられた適切な絵文字セットを予測することを目的としている。
絵文字予測により、モデルは書かれたテキストのコミュニケーション意図の豊かな表現を学ぶことができる。
絵文字予測タスクに関する既存の研究は、特定の感情と密接に関連する絵文字の少数のサブセットに焦点を当てているが、この設定はタスクを単純化し、絵文字の表現力を無駄にする。
本稿では,絵文字予測タスクの既存の設定を,よりリッチな絵文字セットを含むように拡張し,タスクのマルチラベル分類を可能にする。
トランスフォーマーネットワークに基づくマルチクラス・マルチラベル絵文字予測のための新しいモデルを提案する。
また、ヒューリスティックスを用いてTwitterから複数の絵文字予測データセットを構築する。
BERTモデルは、すべてのデータセットに対して、すべての設定下で最先端のパフォーマンスを達成し、相対的な改善は27.21%から236.36%、トップ5の精度は2.01%から88.28%、F-1のスコアは65.19%から346.79%である。
本研究は,絵文字予測タスクにおける深いトランスフォーマーモデルの有効性を示す。
また、将来の研究者のために、https://github.com/hikari-NYU/Emoji_Prediction_Datasets_MMSでデータセットをリリースしています。
関連論文リスト
- On-Device Emoji Classifier Trained with GPT-based Data Augmentation for a Mobile Keyboard [2.6624014064407717]
本稿では,SwiftKey用のMobileBertに基づくオンデバイス絵文字分類器を提案する。
データ不均衡を考慮するために、広く使われているGPTを使用して、各絵文字クラスに1つ以上のタグを生成する。
各絵文字と対応するタグに対して、元のセットにGPT生成文をマージし、この絵文字でラベル付けします。
推論時には、絵文字の出力とユーザ履歴を補間し、より良い絵文字分類を行う。
論文 参考訳(メタデータ) (2024-11-06T09:52:29Z) - Semantics Preserving Emoji Recommendation with Large Language Models [47.94761630160614]
既存の絵文字レコメンデーションメソッドは、ユーザーが元のテキストで選択した正確な絵文字にマッチする能力に基づいて、主に評価される。
本稿では,ユーザのテキストとのセマンティックな整合性を維持する絵文字を推薦するモデルの能力を計測する,絵文字推薦のための新しいセマンティックス保存フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-16T22:27:46Z) - EmojiLM: Modeling the New Emoji Language [44.23076273155259]
我々は,大規模言語モデルからテキスト絵文字並列コーパスであるText2Emojiを開発した。
並列コーパスに基づいて,テキスト・絵文字双方向翻訳に特化したシーケンス・ツー・シーケンス・モデルである絵文字LMを蒸留する。
提案モデルでは,強いベースラインを上回り,平行コーパスは絵文字関連下流タスクに有効である。
論文 参考訳(メタデータ) (2023-11-03T07:06:51Z) - Emoji Prediction in Tweets using BERT [0.0]
本稿では,広く使われている事前学習型言語モデルであるBERTを用いた絵文字予測のためのトランスフォーマーに基づく手法を提案する。
我々はBERTをテキストと絵文字の両方を含む大量のテキスト(つぶやき)のコーパスで微調整し、与えられたテキストに対して最も適切な絵文字を予測する。
実験の結果,提案手法は,75%以上の精度で絵文字の予測において,最先端のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-07-05T06:38:52Z) - Emojich -- zero-shot emoji generation using Russian language: a
technical report [52.77024349608834]
エモジッチ(Emojich)は、ロシア語の字幕を条件として絵文字を生成するテキスト・画像ニューラルネットワークである。
我々は,事前訓練された大型モデルruDALL-E Malevich(XL) 1.3Bパラメータの微調整段階における一般化能力を維持することを目的としている。
論文 参考訳(メタデータ) (2021-12-04T23:37:32Z) - Emoji-aware Co-attention Network with EmoGraph2vec Model for Sentiment
Anaylsis [9.447106020795292]
我々はEmoGraph2vecと呼ばれる絵文字表現を学習し、絵文字対応のコアテンションネットワークを設計する手法を提案する。
我々のモデルは、テキストと絵文字を組み込むコアテンション機構を設計し、圧縮と励起ブロックを畳み込みニューラルネットワークに統合する。
実験結果から,提案モデルは,ベンチマークデータセットの感情分析において,いくつかのベースラインを上回り得ることが示された。
論文 参考訳(メタデータ) (2021-10-27T08:01:10Z) - Semantic Journeys: Quantifying Change in Emoji Meaning from 2012-2018 [66.28665205489845]
絵文字のセマンティクスが時間とともにどのように変化するかに関する最初の縦断的研究を行い、計算言語学から6年間のtwitterデータに適用した。
絵文字のセマンティックな発達において5つのパターンを識別し、抽象的な絵文字がより少ないほど意味的変化を起こす可能性が高くなることを示す。
絵文字とセマンティクスに関する今後の作業を支援するために、私たちは、絵文字のセマンティックな変化を調べるために誰でも使用できるウェブベースのインターフェイスとともに、データを公開します。
論文 参考訳(メタデータ) (2021-05-03T13:35:10Z) - A `Sourceful' Twist: Emoji Prediction Based on Sentiment, Hashtags and
Application Source [1.6818451361240172]
モデルが関係する感情を理解し、テキストに最適な絵文字を予測するのを助けるためにTwitterの機能を使用することの重要性を紹介します。
データ分析とニューラルネットワークモデルのパフォーマンス評価は、ハッシュタグとアプリケーションソースを特徴として使用することで、異なる情報をエンコードすることができ、絵文字の予測に有効であることを示している。
論文 参考訳(メタデータ) (2021-03-14T03:05:04Z) - Are Emojis Emotional? A Study to Understand the Association between
Emojis and Emotions [37.86739837901986]
絵文字と感情の関連性について,人間同士の関連付けによる新たなデータセットを用いて検討する。
また,類似の関連がより大きな絵文字集合に対して予測できるような,既存のデータからそのような関連がどの程度推測できるかを評価する実験も行なっている。
論文 参考訳(メタデータ) (2020-05-02T04:04:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。