論文の概要: Creating emoji lexica from unsupervised sentiment analysis of their descriptions
- arxiv url: http://arxiv.org/abs/2404.01439v1
- Date: Mon, 1 Apr 2024 19:22:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-03 20:37:09.865664
- Title: Creating emoji lexica from unsupervised sentiment analysis of their descriptions
- Title(参考訳): 教師なし感情分析による絵文字レキシカの作成
- Authors: Milagros Fernández-Gavilanes, Jonathan Juncal-Martínez, Silvia García-Méndez, Enrique Costa-Montenegro, Francisco Javier González-Castaño,
- Abstract要約: ツイートなどのオンラインテキストメッセージに絵文字で表される感情を予測するための新しいアプローチを提案する。
エモジペディアの絵文字作成者による定義に基づいて、教師なし感情分析システムを用いて、新しい絵文字感情辞書を自動構築した。
- 参考スコア(独自算出の注目度): 7.280598594783675
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Online media, such as blogs and social networking sites, generate massive volumes of unstructured data of great interest to analyze the opinions and sentiments of individuals and organizations. Novel approaches beyond Natural Language Processing are necessary to quantify these opinions with polarity metrics. So far, the sentiment expressed by emojis has received little attention. The use of symbols, however, has boomed in the past four years. About twenty billion are typed in Twitter nowadays, and new emojis keep appearing in each new Unicode version, making them increasingly relevant to sentiment analysis tasks. This has motivated us to propose a novel approach to predict the sentiments expressed by emojis in online textual messages, such as tweets, that does not require human effort to manually annotate data and saves valuable time for other analysis tasks. For this purpose, we automatically constructed a novel emoji sentiment lexicon using an unsupervised sentiment analysis system based on the definitions given by emoji creators in Emojipedia. Additionally, we automatically created lexicon variants by also considering the sentiment distribution of the informal texts accompanying emojis. All these lexica are evaluated and compared regarding the improvement obtained by including them in sentiment analysis of the annotated datasets provided by Kralj Novak et al. (2015). The results confirm the competitiveness of our approach.
- Abstract(参考訳): ブログやソーシャルネットワークサイトのようなオンラインメディアは、個人や組織の意見や感情を分析するために、膨大な量の構造化されていないデータを生成する。
自然言語処理以外の新しいアプローチは、これらの意見を極性メトリクスで定量化するために必要である。
これまでのところ、絵文字で表される感情はほとんど注目されていない。
しかし、シンボルの使用は過去4年間に急増している。
Twitterでは、現在約200億の絵文字がタイプされており、新しいUnicodeバージョンに新しい絵文字が登場し続けており、感情分析タスクに関連性が高まっている。
これは、手動でアノテートし、他の分析タスクに貴重な時間を節約する人的労力を必要としない、ツイートのようなオンラインテキストメッセージの絵文字によって表現される感情を予測する新しいアプローチを提案する動機となった。
そこで我々は,絵文字作成者によるエモジペディアの定義に基づいて,教師なし感情分析システムを用いて,新しい絵文字感情辞書を自動構築した。
さらに,絵文字に付随する非公式テキストの感情分布を考慮し,辞書の変種を自動的に生成した。
これらのレキシカは、Kralj Novak et al (2015)が提供する注釈付きデータセットの感情分析に含めることで得られる改善について評価され、比較される。
その結果、我々のアプローチの競争力が確認された。
関連論文リスト
- Semantics Preserving Emoji Recommendation with Large Language Models [47.94761630160614]
既存の絵文字レコメンデーションメソッドは、ユーザーが元のテキストで選択した正確な絵文字にマッチする能力に基づいて、主に評価される。
本稿では,ユーザのテキストとのセマンティックな整合性を維持する絵文字を推薦するモデルの能力を計測する,絵文字推薦のための新しいセマンティックス保存フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-16T22:27:46Z) - From Adoption to Adaption: Tracing the Diffusion of New Emojis on
Twitter [4.232633963142152]
新たにリリースされた絵文字がいかに勢いを増し、意味を進化させるかを検討する。
アーリーアダプターと絵文字のセマンティクスのコミュニティサイズは、彼らの人気を決定する上で不可欠である。
本稿では,言語モデルを用いて単語を抽出し,意味的に類似した文脈で既存の絵文字を抽出する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-22T00:24:44Z) - EmojiLM: Modeling the New Emoji Language [44.23076273155259]
我々は,大規模言語モデルからテキスト絵文字並列コーパスであるText2Emojiを開発した。
並列コーパスに基づいて,テキスト・絵文字双方向翻訳に特化したシーケンス・ツー・シーケンス・モデルである絵文字LMを蒸留する。
提案モデルでは,強いベースラインを上回り,平行コーパスは絵文字関連下流タスクに有効である。
論文 参考訳(メタデータ) (2023-11-03T07:06:51Z) - Emoji Prediction in Tweets using BERT [0.0]
本稿では,広く使われている事前学習型言語モデルであるBERTを用いた絵文字予測のためのトランスフォーマーに基づく手法を提案する。
我々はBERTをテキストと絵文字の両方を含む大量のテキスト(つぶやき)のコーパスで微調整し、与えられたテキストに対して最も適切な絵文字を予測する。
実験の結果,提案手法は,75%以上の精度で絵文字の予測において,最先端のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-07-05T06:38:52Z) - Depression detection in social media posts using affective and social
norm features [84.12658971655253]
ソーシャルメディア投稿からの抑うつ検出のための奥深いアーキテクチャを提案する。
我々は、後期融合方式を用いて、ポストとワードの敬称と道徳的特徴をアーキテクチャに組み込んだ。
提案された機能を含めると、両方の設定で最先端の結果が得られます。
論文 参考訳(メタデータ) (2023-03-24T21:26:27Z) - Emojich -- zero-shot emoji generation using Russian language: a
technical report [52.77024349608834]
エモジッチ(Emojich)は、ロシア語の字幕を条件として絵文字を生成するテキスト・画像ニューラルネットワークである。
我々は,事前訓練された大型モデルruDALL-E Malevich(XL) 1.3Bパラメータの微調整段階における一般化能力を維持することを目的としている。
論文 参考訳(メタデータ) (2021-12-04T23:37:32Z) - Emoji-aware Co-attention Network with EmoGraph2vec Model for Sentiment
Anaylsis [9.447106020795292]
我々はEmoGraph2vecと呼ばれる絵文字表現を学習し、絵文字対応のコアテンションネットワークを設計する手法を提案する。
我々のモデルは、テキストと絵文字を組み込むコアテンション機構を設計し、圧縮と励起ブロックを畳み込みニューラルネットワークに統合する。
実験結果から,提案モデルは,ベンチマークデータセットの感情分析において,いくつかのベースラインを上回り得ることが示された。
論文 参考訳(メタデータ) (2021-10-27T08:01:10Z) - Emoji-based Co-attention Network for Microblog Sentiment Analysis [10.135289472491655]
マイクロブログ上でのテキストと絵文字間の相互感情的意味を学習する絵文字に基づくコアテンションネットワークを提案する。
本モデルは、テキストと絵文字を組み込んだ双方向の長期記憶に基づくコアテンション機構を採用し、畳み込みニューラルネットワークにシャープ・アンド・エキサイティングブロックを統合し、感情的な意味的特徴に対する感度を高める。
論文 参考訳(メタデータ) (2021-10-27T07:23:18Z) - Black or White but never neutral: How readers perceive identity from
yellow or skin-toned emoji [90.14874935843544]
近年の研究は、ソーシャルメディア上でのアイデンティティ表現と絵文字利用の関係を確立した。
この研究は、言語と同様に、読者がそのような自己表現の行為に敏感かどうかを問うもので、著者のアイデンティティを理解するために使用する。
論文 参考訳(メタデータ) (2021-05-12T18:23:51Z) - Semantic Journeys: Quantifying Change in Emoji Meaning from 2012-2018 [66.28665205489845]
絵文字のセマンティクスが時間とともにどのように変化するかに関する最初の縦断的研究を行い、計算言語学から6年間のtwitterデータに適用した。
絵文字のセマンティックな発達において5つのパターンを識別し、抽象的な絵文字がより少ないほど意味的変化を起こす可能性が高くなることを示す。
絵文字とセマンティクスに関する今後の作業を支援するために、私たちは、絵文字のセマンティックな変化を調べるために誰でも使用できるウェブベースのインターフェイスとともに、データを公開します。
論文 参考訳(メタデータ) (2021-05-03T13:35:10Z) - Assessing Emoji Use in Modern Text Processing Tools [35.79765461713127]
絵文字は視覚的魅力と人間の感情を鮮明に伝える能力から、デジタルコミュニケーションにおいてユビキタスになりつつある。
ソーシャルメディアや他のインスタントメッセージングにおける絵文字の普及は、絵文字を含むテキストを操作するシステムやツールの必要性も高まっている。
本研究では,絵文字を用いたツイートのテストセットを検討することで,このサポートを評価する。そこでは,著名なnlpおよびテキスト処理ツールが適切に処理できるかどうかについて,一連の実験を行う。
論文 参考訳(メタデータ) (2021-01-02T11:38:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。