論文の概要: sarcasm detection and quantification in arabic tweets
- arxiv url: http://arxiv.org/abs/2108.01425v1
- Date: Tue, 3 Aug 2021 11:48:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-04 14:09:42.014203
- Title: sarcasm detection and quantification in arabic tweets
- Title(参考訳): アラビア語ツイートにおける皮肉の検出と定量化
- Authors: Bashar Talafha, Muhy Eddin Za'ter, Samer Suleiman, Mahmoud Al-Ayyoub,
Mohammed N. Al-Kabi
- Abstract要約: 本論文は,ツイートから収集したサルカズム検出のための,人為的注釈付きアラビア語コーパスを作成することを目的としている。
提案手法は、分類ではなく回帰問題としてこの問題に取り組む。
- 参考スコア(独自算出の注目度): 7.173484352846755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The role of predicting sarcasm in the text is known as automatic sarcasm
detection. Given the prevalence and challenges of sarcasm in sentiment-bearing
text, this is a critical phase in most sentiment analysis tasks. With the
increasing popularity and usage of different social media platforms among users
around the world, people are using sarcasm more and more in their day-to-day
conversations, social media posts and tweets, and it is considered as a way for
people to express their sentiment about some certain topics or issues. As a
result of the increasing popularity, researchers started to focus their
research endeavors on detecting sarcasm from a text in different languages
especially the English language. However, the task of sarcasm detection is a
challenging task due to the nature of sarcastic texts; which can be relative
and significantly differs from one person to another depending on the topic,
region, the user's mentality and other factors. In addition to these
challenges, sarcasm detection in the Arabic language has its own challenges due
to the complexity of the Arabic language, such as being morphologically rich,
with many dialects that significantly vary between each other, while also being
lowly resourced. In recent years, only few research attempts started tackling
the task of sarcasm detection in Arabic, including creating and collecting
corpora, organizing workshops and establishing baseline models. This paper
intends to create a new humanly annotated Arabic corpus for sarcasm detection
collected from tweets, and implementing a new approach for sarcasm detection
and quantification in Arabic tweets. The annotation technique followed in this
paper is unique in sarcasm detection and the proposed approach tackles the
problem as a regression problem instead of classification; i.e., the model
attempts to predict the level of sarcasm instead of binary classification.
- Abstract(参考訳): テキスト中のサーカズムを予測する役割は、自動サーカズム検出(automatic sarcasm detection)として知られている。
感傷的テキストにおけるサルカズムの有病率と課題を考えると、ほとんどの感情分析タスクにおいてこれは重要な段階である。
世界中のユーザーの間で、さまざまなソーシャルメディアプラットフォームの人気と利用が高まり、人々は日々の会話やソーシャルメディアの投稿、ツイートでますます皮肉を使い続けており、特定の話題や問題に対する感情を表現する手段として考えられている。
人気が高まった結果、研究者は様々な言語、特に英語のテキストからサルカズムを検出する研究に焦点を合わせ始めた。
しかし, サルカシックテキストの性質から, サルカシム検出の課題は難しい課題であり, 話題, 地域, ユーザの精神性, その他の要因によって, 相対的に, 他者とは大きく異なる場合がある。
これらの課題に加えて、アラビア語におけるサルカズム検出は、形態学的に豊かであるなど、アラビア語の複雑さによって独自の課題を抱えており、多くの方言は互いに大きく異なるが、低資源である。
近年では、コーパスの作成と収集、ワークショップの編成、ベースラインモデルの確立など、アラビア語におけるサルカム検出の課題に取り組む研究の試みはごくわずかである。
本稿は,ツイートから収集したサーカズム検出のための新しい人文注釈付きアラビア語コーパスの作成と,アラビア語ツイートにおけるサーカズム検出と定量化のための新しいアプローチの実現を目的としている。
提案手法は,分類ではなく回帰問題としてこの問題に取り組み,二項分類の代わりにサルカズムのレベルを予測しようとする。
関連論文リスト
- Impact of emoji exclusion on the performance of Arabic sarcasm detection models [0.0]
本稿では,基本前処理成分が音素音声検出に与える影響について検討する。
我々はAraBERTプリトレーニングを用いて特定のモデルを改良し、絵文字の除去が皮肉検出の精度を大幅に向上させることを示した。
本研究では、アラビア語の自然言語処理における新しいベンチマークを確立し、ソーシャルメディアプラットフォームに価値ある洞察を与える。
論文 参考訳(メタデータ) (2024-05-03T15:51:02Z) - Sentiment-enhanced Graph-based Sarcasm Explanation in Dialogue [67.09698638709065]
本稿では,SEntiment-enhanceD Graph を用いたマルチモーダルサルカズム記述フレームワーク EDGE を提案する。
特に,まずレキシコン誘導型発話感情推論モジュールを提案し,そこでは発話感情改善戦略を考案する。
次に,マルチモーダル感情分析モデル JCA を拡張し,映像音声クリップ毎に共同感情ラベルを導出することにより,JCA-SI (Joint Cross Attention-based Sentiment Inference) というモジュールを開発する。
論文 参考訳(メタデータ) (2024-02-06T03:14:46Z) - Sarcasm Detection in a Disaster Context [103.93691731605163]
HurricaneSARCは,意図した皮肉に注釈を付けた15,000ツイートのデータセットである。
私たちの最高のモデルは、データセットで最大0.70F1を得ることができます。
論文 参考訳(メタデータ) (2023-08-16T05:58:12Z) - Researchers eye-view of sarcasm detection in social media textual
content [0.0]
ソーシャルメディアにおけるあらゆる形態のコミュニケーションにおける皮肉文の使用は、ターゲットユーザに対する生理的効果をもたらす。
本稿では,様々なサルカズム検出手法について論じ,いくつかのアプローチ,および最適な特徴を持つ関連するデータセットを結論づける。
論文 参考訳(メタデータ) (2023-04-17T19:45:10Z) - Interpretable Bangla Sarcasm Detection using BERT and Explainable AI [0.3914676152740142]
BERTベースのシステムは99.60%を達成できるが、従来の機械学習アルゴリズムは89.93%しか達成できない。
このデータセットはsarcasticとnon-sarcasticのコメントの新記録で構成されており、その大部分はFacebookとYouTubeのコメントセクションから取得されている。
論文 参考訳(メタデータ) (2023-03-22T17:35:35Z) - Sarcasm Detection Framework Using Emotion and Sentiment Features [62.997667081978825]
本研究では,感情と感情の特徴を取り入れたモデルを提案する。
我々のアプローチは、ソーシャルネットワークプラットフォームとオンラインメディアの4つのデータセットに対して、最先端の結果を得た。
論文 参考訳(メタデータ) (2022-11-23T15:14:44Z) - How to Describe Images in a More Funny Way? Towards a Modular Approach
to Cross-Modal Sarcasm Generation [62.89586083449108]
本稿では,CMSG(Cross-modal sarcasm Generation)の新たな問題,すなわち,与えられた画像に対してサーカシックな記述を生成することについて検討する。
CMSGは、異なるモード間の相関だけでなく、サルカズムの特性をモデルが満たさなければならないため、困難である。
クロスモデルサルカズム生成のための抽出・生成・生成に基づくモジュール法(EGRM)を提案する。
論文 参考訳(メタデータ) (2022-11-20T14:38:24Z) - Computational Sarcasm Analysis on Social Media: A Systematic Review [0.23488056916440855]
サルカズムは、人を侮辱したり、いらいらさせたり、楽しませたりするために、本当に表現したいことの反対を言ったり、書いたりするものとして定義することができる。
テキストデータにおけるサルカズムの曖昧な性質から,その検出は困難であり,感情分析研究コミュニティに大きな関心を寄せている。
論文 参考訳(メタデータ) (2022-09-13T17:20:19Z) - Parallel Deep Learning-Driven Sarcasm Detection from Pop Culture Text
and English Humor Literature [0.76146285961466]
ベンチマークポップカルチャー Sarcasm corpus のサーカシックな単語分布特徴を手作業で抽出する。
このような単語から重み付きベクトルからなる入力シーケンスを生成する。
提案するサルカズム検出モデルは,提案したデータセットを用いてトレーニングした場合,98.95%のトレーニング精度をピークとする。
論文 参考訳(メタデータ) (2021-06-10T14:01:07Z) - $R^3$: Reverse, Retrieve, and Rank for Sarcasm Generation with
Commonsense Knowledge [51.70688120849654]
非皮肉な入力文に基づくサルカズム生成のための教師なしアプローチを提案する。
本手法では,サルカズムの2つの主要な特徴をインスタンス化するために,検索・編集の枠組みを用いる。
論文 参考訳(メタデータ) (2020-04-28T02:30:09Z) - Forensic Authorship Analysis of Microblogging Texts Using N-Grams and
Stylometric Features [63.48764893706088]
この研究は、280文字に制限されたツイートメッセージの作者を特定することを目的としている。
弊社の実験では、40名のユーザによる、ユーザ毎120から200のつぶやきを自己キャプチャしたデータベースを使っています。
この小さなセットを使った結果は有望であり、異なる特徴は92%から98.5%の分類精度を提供する。
論文 参考訳(メタデータ) (2020-03-24T19:32:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。