論文の概要: EmojiLM: Modeling the New Emoji Language
- arxiv url: http://arxiv.org/abs/2311.01751v1
- Date: Fri, 3 Nov 2023 07:06:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-06 15:00:39.835315
- Title: EmojiLM: Modeling the New Emoji Language
- Title(参考訳): EmojiLM: 新しい絵文字言語をモデリングする
- Authors: Letian Peng, Zilong Wang, Hang Liu, Zihan Wang, Jingbo Shang
- Abstract要約: 我々は,大規模言語モデルからテキスト絵文字並列コーパスであるText2Emojiを開発した。
並列コーパスに基づいて,テキスト・絵文字双方向翻訳に特化したシーケンス・ツー・シーケンス・モデルである絵文字LMを蒸留する。
提案モデルでは,強いベースラインを上回り,平行コーパスは絵文字関連下流タスクに有効である。
- 参考スコア(独自算出の注目度): 44.23076273155259
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rapid development of the internet, online social media welcomes
people with different backgrounds through its diverse content. The increasing
usage of emoji becomes a noticeable trend thanks to emoji's rich information
beyond cultural or linguistic borders. However, the current study on emojis is
limited to single emoji prediction and there are limited data resources
available for further study of the interesting linguistic phenomenon. To this
end, we synthesize a large text-emoji parallel corpus, Text2Emoji, from a large
language model. Based on the parallel corpus, we distill a sequence-to-sequence
model, EmojiLM, which is specialized in the text-emoji bidirectional
translation. Extensive experiments on public benchmarks and human evaluation
demonstrate that our proposed model outperforms strong baselines and the
parallel corpus benefits emoji-related downstream tasks.
- Abstract(参考訳): インターネットの急速な発展に伴い、オンラインソーシャルメディアは多様なコンテンツを通じて異なる背景を持つ人々を歓迎している。
絵文字の利用が増える傾向は、文化境界や言語境界を超えた絵文字の豊富な情報のおかげで顕著な傾向にある。
しかし、絵文字に関する現在の研究は単一の絵文字予測に限定されており、興味深い言語現象をさらに研究するためのデータ資源は限られている。
そこで本研究では,大規模言語モデルからテキスト絵文字並列コーパスであるText2Emojiを合成する。
並列コーパスに基づいて,テキスト・エモジ双方向翻訳を専門とするシーケンシャル・ツー・シーケンスモデルであるemojilmを蒸留する。
公開ベンチマークと人間評価に関する広範囲な実験により,提案モデルが強いベースラインを上回り,並列コーパスが絵文字に関連した下流タスクに有利であることを実証した。
関連論文リスト
- Semantics Preserving Emoji Recommendation with Large Language Models [47.94761630160614]
既存の絵文字レコメンデーションメソッドは、ユーザーが元のテキストで選択した正確な絵文字にマッチする能力に基づいて、主に評価される。
本稿では,ユーザのテキストとのセマンティックな整合性を維持する絵文字を推薦するモデルの能力を計測する,絵文字推薦のための新しいセマンティックス保存フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-16T22:27:46Z) - From Adoption to Adaption: Tracing the Diffusion of New Emojis on
Twitter [4.232633963142152]
新たにリリースされた絵文字がいかに勢いを増し、意味を進化させるかを検討する。
アーリーアダプターと絵文字のセマンティクスのコミュニティサイズは、彼らの人気を決定する上で不可欠である。
本稿では,言語モデルを用いて単語を抽出し,意味的に類似した文脈で既存の絵文字を抽出する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-22T00:24:44Z) - Emoji Prediction in Tweets using BERT [0.0]
本稿では,広く使われている事前学習型言語モデルであるBERTを用いた絵文字予測のためのトランスフォーマーに基づく手法を提案する。
我々はBERTをテキストと絵文字の両方を含む大量のテキスト(つぶやき)のコーパスで微調整し、与えられたテキストに対して最も適切な絵文字を予測する。
実験の結果,提案手法は,75%以上の精度で絵文字の予測において,最先端のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-07-05T06:38:52Z) - Emojich -- zero-shot emoji generation using Russian language: a
technical report [52.77024349608834]
エモジッチ(Emojich)は、ロシア語の字幕を条件として絵文字を生成するテキスト・画像ニューラルネットワークである。
我々は,事前訓練された大型モデルruDALL-E Malevich(XL) 1.3Bパラメータの微調整段階における一般化能力を維持することを目的としている。
論文 参考訳(メタデータ) (2021-12-04T23:37:32Z) - Emoji-aware Co-attention Network with EmoGraph2vec Model for Sentiment
Anaylsis [9.447106020795292]
我々はEmoGraph2vecと呼ばれる絵文字表現を学習し、絵文字対応のコアテンションネットワークを設計する手法を提案する。
我々のモデルは、テキストと絵文字を組み込むコアテンション機構を設計し、圧縮と励起ブロックを畳み込みニューラルネットワークに統合する。
実験結果から,提案モデルは,ベンチマークデータセットの感情分析において,いくつかのベースラインを上回り得ることが示された。
論文 参考訳(メタデータ) (2021-10-27T08:01:10Z) - Black or White but never neutral: How readers perceive identity from
yellow or skin-toned emoji [90.14874935843544]
近年の研究は、ソーシャルメディア上でのアイデンティティ表現と絵文字利用の関係を確立した。
この研究は、言語と同様に、読者がそのような自己表現の行為に敏感かどうかを問うもので、著者のアイデンティティを理解するために使用する。
論文 参考訳(メタデータ) (2021-05-12T18:23:51Z) - Semantic Journeys: Quantifying Change in Emoji Meaning from 2012-2018 [66.28665205489845]
絵文字のセマンティクスが時間とともにどのように変化するかに関する最初の縦断的研究を行い、計算言語学から6年間のtwitterデータに適用した。
絵文字のセマンティックな発達において5つのパターンを識別し、抽象的な絵文字がより少ないほど意味的変化を起こす可能性が高くなることを示す。
絵文字とセマンティクスに関する今後の作業を支援するために、私たちは、絵文字のセマンティックな変化を調べるために誰でも使用できるウェブベースのインターフェイスとともに、データを公開します。
論文 参考訳(メタデータ) (2021-05-03T13:35:10Z) - Emoji Prediction: Extensions and Benchmarking [30.642840676899734]
絵文字予測タスクは、テキストに関連付けられた適切な絵文字セットを予測することを目的としている。
我々は、絵文字予測タスクの既存の設定を拡張し、よりリッチな絵文字セットを含め、複数ラベルの分類を可能にする。
トランスフォーマーネットワークに基づくマルチクラス・マルチラベル絵文字予測のための新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-07-14T22:41:20Z) - Are Emojis Emotional? A Study to Understand the Association between
Emojis and Emotions [37.86739837901986]
絵文字と感情の関連性について,人間同士の関連付けによる新たなデータセットを用いて検討する。
また,類似の関連がより大きな絵文字集合に対して予測できるような,既存のデータからそのような関連がどの程度推測できるかを評価する実験も行なっている。
論文 参考訳(メタデータ) (2020-05-02T04:04:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。