論文の概要: On the Context-Free Ambiguity of Emoji: A Data-Driven Study of 1,289
Emojis
- arxiv url: http://arxiv.org/abs/2201.06302v1
- Date: Mon, 17 Jan 2022 09:33:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-21 04:54:44.414306
- Title: On the Context-Free Ambiguity of Emoji: A Data-Driven Study of 1,289
Emojis
- Title(参考訳): 絵文字の文脈自由曖昧性について:1,289個の絵文字のデータ駆動研究
- Authors: Justyna Czestochowska, Kristina Gligoric, Maxime Peyrard, Yann Mentha,
Michal Bien, Andrea Grutter, Anita Auer, Aris Xanthos, Robert West
- Abstract要約: 我々は、周囲のテキストのない参加者に1,289の絵文字を提示する1ワードの絵文字記述のクラウドソーシングデータセットを収集した。
絵文字ごとに30のアノテーションがあり、16の絵文字は完全に曖昧であるのに対して、55の絵文字は曖昧であり、ランダムに選択された記述と区別できない。
- 参考スコア(独自算出の注目度): 28.04805745702487
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Emojis come with prepacked semantics making them great candidates to create
new forms of more accessible communications. Yet, little is known about how
much of this emojis semantic is agreed upon by humans, outside of textual
contexts. Thus, we collected a crowdsourced dataset of one-word emoji
descriptions for 1,289 emojis presented to participants with no surrounding
text. The emojis and their interpretations were then examined for ambiguity. We
find that with 30 annotations per emoji, 16 emojis (1.2%) are completely
unambiguous, whereas 55 emojis (4.3%) are so ambiguous that their descriptions
are indistinguishable from randomly chosen descriptions. Most of studied emojis
are spread out between the two extremes. Furthermore, investigating the
ambiguity of different types of emojis, we find that an important factor is the
extent to which an emoji has an embedded symbolical meaning drawn from an
established code-book of symbols. We conclude by discussing design
implications.
- Abstract(参考訳): 絵文字にはセマンティクスが備わっているので、よりアクセスしやすいコミュニケーションの新たな形式を作るのに最適な候補となる。
しかし、この絵文字のセマンティクスがいかに人間によって合意されているかは、テキストの文脈以外ではほとんど分かっていない。
そこで我々は,周囲のテキストを持たない参加者に提示された1,289の絵文字について,ワンワードの絵文字記述のクラウドソーシングデータセットを収集した。
絵文字とその解釈は曖昧さのために検査された。
30のアノテーションで、16の絵文字(1.2%)は完全に曖昧であるのに対し、55の絵文字(4.3%)は曖昧で、ランダムに選択された記述と区別できない。
研究対象の絵文字のほとんどは両極端に散在している。
さらに,異なる絵文字のあいまいさについて検討した結果,絵文字が確立された記号コードブックから導かれる記号的意味が組み込まれている程度が重要な要因であることが判明した。
デザインの意味を議論することで締めくくります。
関連論文リスト
- Semantics Preserving Emoji Recommendation with Large Language Models [47.94761630160614]
既存の絵文字レコメンデーションメソッドは、ユーザーが元のテキストで選択した正確な絵文字にマッチする能力に基づいて、主に評価される。
本稿では,ユーザのテキストとのセマンティックな整合性を維持する絵文字を推薦するモデルの能力を計測する,絵文字推薦のための新しいセマンティックス保存フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-16T22:27:46Z) - Emojinize: Enriching Any Text with Emoji Translations [10.674155943520729]
エモジンライズ(英: Emojinize)とは、人間の入力を必要とせず、任意のテキストフレーズを1つ以上の絵文字のシーケンスに変換する方法である。
大規模な言語モデルのパワーを活用することで、Emojinizeは文脈に基づいて曖昧にすることで適切な絵文字を選択することができる。
エモジニゼの翻訳では、マスクされた単語の人間の推測可能性が55%向上する一方、人間の絵文字の翻訳ではわずか29%向上した。
論文 参考訳(メタデータ) (2024-03-06T17:06:17Z) - EmojiLM: Modeling the New Emoji Language [44.23076273155259]
我々は,大規模言語モデルからテキスト絵文字並列コーパスであるText2Emojiを開発した。
並列コーパスに基づいて,テキスト・絵文字双方向翻訳に特化したシーケンス・ツー・シーケンス・モデルである絵文字LMを蒸留する。
提案モデルでは,強いベースラインを上回り,平行コーパスは絵文字関連下流タスクに有効である。
論文 参考訳(メタデータ) (2023-11-03T07:06:51Z) - Emojich -- zero-shot emoji generation using Russian language: a
technical report [52.77024349608834]
エモジッチ(Emojich)は、ロシア語の字幕を条件として絵文字を生成するテキスト・画像ニューラルネットワークである。
我々は,事前訓練された大型モデルruDALL-E Malevich(XL) 1.3Bパラメータの微調整段階における一般化能力を維持することを目的としている。
論文 参考訳(メタデータ) (2021-12-04T23:37:32Z) - How to Do Things without Words: Modeling Semantic Drift of Emoji [0.2538209532048866]
我々は、絵文字の意味的ドリフトをモデル化し、分析し、ドリフトに寄与する可能性のある特徴について議論する。
この進化はセマンティックドリフトの枠組みによって対処できる。
論文 参考訳(メタデータ) (2021-10-08T12:45:26Z) - Black or White but never neutral: How readers perceive identity from
yellow or skin-toned emoji [90.14874935843544]
近年の研究は、ソーシャルメディア上でのアイデンティティ表現と絵文字利用の関係を確立した。
この研究は、言語と同様に、読者がそのような自己表現の行為に敏感かどうかを問うもので、著者のアイデンティティを理解するために使用する。
論文 参考訳(メタデータ) (2021-05-12T18:23:51Z) - Semantic Journeys: Quantifying Change in Emoji Meaning from 2012-2018 [66.28665205489845]
絵文字のセマンティクスが時間とともにどのように変化するかに関する最初の縦断的研究を行い、計算言語学から6年間のtwitterデータに適用した。
絵文字のセマンティックな発達において5つのパターンを識別し、抽象的な絵文字がより少ないほど意味的変化を起こす可能性が高くなることを示す。
絵文字とセマンティクスに関する今後の作業を支援するために、私たちは、絵文字のセマンティックな変化を調べるために誰でも使用できるウェブベースのインターフェイスとともに、データを公開します。
論文 参考訳(メタデータ) (2021-05-03T13:35:10Z) - Emoji Prediction: Extensions and Benchmarking [30.642840676899734]
絵文字予測タスクは、テキストに関連付けられた適切な絵文字セットを予測することを目的としている。
我々は、絵文字予測タスクの既存の設定を拡張し、よりリッチな絵文字セットを含め、複数ラベルの分類を可能にする。
トランスフォーマーネットワークに基づくマルチクラス・マルチラベル絵文字予測のための新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-07-14T22:41:20Z) - Word-Emoji Embeddings from large scale Messaging Data reflect real-world
Semantic Associations of Expressive Icons [7.032245866317618]
オンラインソーシャルネットワークJodelから得られた大規模メッセージングデータに単語絵文字の埋め込みを訓練する。
私たちのデータセットには4000万以上の文が含まれており、そのうち1100万の文がUnicode 13.0標準絵文字リストのサブセットで注釈付けされています。
論文 参考訳(メタデータ) (2020-05-19T19:55:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。