論文の概要: BanglaSarc: A Dataset for Sarcasm Detection
- arxiv url: http://arxiv.org/abs/2209.13461v1
- Date: Tue, 27 Sep 2022 15:28:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 14:31:23.150180
- Title: BanglaSarc: A Dataset for Sarcasm Detection
- Title(参考訳): BanglaSarc: サルカスム検出のためのデータセット
- Authors: Tasnim Sakib Apon, Ramisa Anan, Elizabeth Antora Modhu, Arjun Suter,
Ifrit Jamal Sneha, MD. Golam Rabiul Alam
- Abstract要約: Sarcasmは、今日のソーシャルメディアプラットフォームで広く採用されている、ネガティブな動機に基づく肯定的な発言や発言である。
過去数年間、英語におけるサルカズム検出は大幅に改善されてきたが、バングラのサルカズム検出に関する状況は変わっていない。
本稿では,Bangla Sarcを提案する。
- 参考スコア(独自算出の注目度): 0.3914676152740142
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Being one of the most widely spoken language in the world, the use of Bangla
has been increasing in the world of social media as well. Sarcasm is a positive
statement or remark with an underlying negative motivation that is extensively
employed in today's social media platforms. There has been a significant
improvement in sarcasm detection in English over the previous many years,
however the situation regarding Bangla sarcasm detection remains unchanged. As
a result, it is still difficult to identify sarcasm in bangla, and a lack of
high-quality data is a major contributing factor. This article proposes
BanglaSarc, a dataset constructed specifically for bangla textual data sarcasm
detection. This dataset contains of 5112 comments/status and contents collected
from various online social platforms such as Facebook, YouTube, along with a
few online blogs. Due to the limited amount of data collection of categorized
comments in Bengali, this dataset will aid in the of study identifying sarcasm,
recognizing people's emotion, detecting various types of Bengali expressions,
and other domains. The dataset is publicly available at
https://www.kaggle.com/datasets/sakibapon/banglasarc.
- Abstract(参考訳): バングラ語は世界で最も広く話されている言語の一つであり、ソーシャルメディアの世界でもバングラ語の使用が増えている。
Sarcasmは、今日のソーシャルメディアプラットフォームで広く採用されている、ネガティブな動機に基づく肯定的な発言や発言である。
過去数年間、英語におけるサーカズム検出は大幅に改善されてきたが、バングラサーカズム検出に関する状況は変わっていない。
その結果,バングラにおけるサルカズムの同定は依然として困難であり,高品質なデータの欠如が大きな寄与要因となっている。
本稿は,バングラ文字データサーカズム検出用に特別に構築されたデータセットであるbanglasarcを提案する。
このデータセットには5112のコメント/統計と、facebook、youtubeなどさまざまなオンラインソーシャルプラットフォームから収集されたコンテンツと、いくつかのオンラインブログが含まれている。
ベンガル語における分類されたコメントの収集量が限られているため、このデータセットは皮肉を識別し、人々の感情を認識し、さまざまな種類のベンガル表現を検知する研究に役立つだろう。
データセットはhttps://www.kaggle.com/datasets/sakibapon/banglasarcで公開されている。
関連論文リスト
- KoCoSa: Korean Context-aware Sarcasm Detection Dataset [3.369750569233713]
サルカズム(英: Sarcasm)は、言葉による皮肉の一種で、ある人、状況、あるいは考えを笑うために、誰かがその意味とは逆の言葉を言う。
本稿では,韓国のSarcasm検出タスクKoCoSaの新しいデータセットについて紹介する。
データセットは、1日12.8Kの韓国の対話と、最後のレスポンスでこのタスクのラベルで構成されている。
論文 参考訳(メタデータ) (2024-02-22T10:17:57Z) - Sarcasm Detection in a Disaster Context [103.93691731605163]
HurricaneSARCは,意図した皮肉に注釈を付けた15,000ツイートのデータセットである。
私たちの最高のモデルは、データセットで最大0.70F1を得ることができます。
論文 参考訳(メタデータ) (2023-08-16T05:58:12Z) - Researchers eye-view of sarcasm detection in social media textual
content [0.0]
ソーシャルメディアにおけるあらゆる形態のコミュニケーションにおける皮肉文の使用は、ターゲットユーザに対する生理的効果をもたらす。
本稿では,様々なサルカズム検出手法について論じ,いくつかのアプローチ,および最適な特徴を持つ関連するデータセットを結論づける。
論文 参考訳(メタデータ) (2023-04-17T19:45:10Z) - Interpretable Bangla Sarcasm Detection using BERT and Explainable AI [0.3914676152740142]
BERTベースのシステムは99.60%を達成できるが、従来の機械学習アルゴリズムは89.93%しか達成できない。
このデータセットはsarcasticとnon-sarcasticのコメントの新記録で構成されており、その大部分はFacebookとYouTubeのコメントセクションから取得されている。
論文 参考訳(メタデータ) (2023-03-22T17:35:35Z) - SODA: Million-scale Dialogue Distillation with Social Commonsense
Contextualization [129.1927527781751]
初となる,100万規模の社会対話データセットであるSODAを提示する。
知識グラフから社会的コモンセンス知識を文脈化することにより、社会的相互作用の非常に幅広いスペクトルを蒸留することができる。
人間による評価は、SODAにおける会話は、以前の人間によるデータセットよりも一貫性があり、特異であり、そして(当然のことながら)自然であることを示している。
論文 参考訳(メタデータ) (2022-12-20T17:38:47Z) - Sarcasm Detection Framework Using Emotion and Sentiment Features [62.997667081978825]
本研究では,感情と感情の特徴を取り入れたモデルを提案する。
我々のアプローチは、ソーシャルネットワークプラットフォームとオンラインメディアの4つのデータセットに対して、最先端の結果を得た。
論文 参考訳(メタデータ) (2022-11-23T15:14:44Z) - How to Describe Images in a More Funny Way? Towards a Modular Approach
to Cross-Modal Sarcasm Generation [62.89586083449108]
本稿では,CMSG(Cross-modal sarcasm Generation)の新たな問題,すなわち,与えられた画像に対してサーカシックな記述を生成することについて検討する。
CMSGは、異なるモード間の相関だけでなく、サルカズムの特性をモデルが満たさなければならないため、困難である。
クロスモデルサルカズム生成のための抽出・生成・生成に基づくモジュール法(EGRM)を提案する。
論文 参考訳(メタデータ) (2022-11-20T14:38:24Z) - sarcasm detection and quantification in arabic tweets [7.173484352846755]
本論文は,ツイートから収集したサルカズム検出のための,人為的注釈付きアラビア語コーパスを作成することを目的としている。
提案手法は、分類ではなく回帰問題としてこの問題に取り組む。
論文 参考訳(メタデータ) (2021-08-03T11:48:27Z) - Bangla Text Dataset and Exploratory Analysis for Online Harassment
Detection [0.0]
この記事でアクセス可能になったデータは、有名人、政府高官、そしてFacebook上のアスリートによる公開投稿の人々のコメントから収集され、マークされている。
データセットは、コメントがいじめの表現であるか否かを区別するマシンの開発を目的としてコンパイルされる。
論文 参考訳(メタデータ) (2021-02-04T08:35:18Z) - Trawling for Trolling: A Dataset [56.1778095945542]
攻撃的コンテンツのサブカテゴリとしてトロリングをモデル化するデータセットを提案する。
データセットには12,490のサンプルがあり、5つのクラスに分かれている。
論文 参考訳(メタデータ) (2020-08-02T17:23:55Z) - $R^3$: Reverse, Retrieve, and Rank for Sarcasm Generation with
Commonsense Knowledge [51.70688120849654]
非皮肉な入力文に基づくサルカズム生成のための教師なしアプローチを提案する。
本手法では,サルカズムの2つの主要な特徴をインスタンス化するために,検索・編集の枠組みを用いる。
論文 参考訳(メタデータ) (2020-04-28T02:30:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。