論文の概要: Interpretable Bangla Sarcasm Detection using BERT and Explainable AI
- arxiv url: http://arxiv.org/abs/2303.12772v1
- Date: Wed, 22 Mar 2023 17:35:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-23 13:20:16.248433
- Title: Interpretable Bangla Sarcasm Detection using BERT and Explainable AI
- Title(参考訳): BERTと説明可能なAIを用いた解釈可能なBangla Sarcasm検出
- Authors: Ramisa Anan, Tasnim Sakib Apon, Zeba Tahsin Hossain, Elizabeth Antora
Modhu, Sudipta Mondal, MD. Golam Rabiul Alam
- Abstract要約: BERTベースのシステムは99.60%を達成できるが、従来の機械学習アルゴリズムは89.93%しか達成できない。
このデータセットはsarcasticとnon-sarcasticのコメントの新記録で構成されており、その大部分はFacebookとYouTubeのコメントセクションから取得されている。
- 参考スコア(独自算出の注目度): 0.3914676152740142
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A positive phrase or a sentence with an underlying negative motive is usually
defined as sarcasm that is widely used in today's social media platforms such
as Facebook, Twitter, Reddit, etc. In recent times active users in social media
platforms are increasing dramatically which raises the need for an automated
NLP-based system that can be utilized in various tasks such as determining
market demand, sentiment analysis, threat detection, etc. However, since
sarcasm usually implies the opposite meaning and its detection is frequently a
challenging issue, data meaning extraction through an NLP-based model becomes
more complicated. As a result, there has been a lot of study on sarcasm
detection in English over the past several years, and there's been a noticeable
improvement and yet sarcasm detection in the Bangla language's state remains
the same. In this article, we present a BERT-based system that can achieve
99.60\% while the utilized traditional machine learning algorithms are only
capable of achieving 89.93\%. Additionally, we have employed Local
Interpretable Model-Agnostic Explanations that introduce explainability to our
system. Moreover, we have utilized a newly collected bangla sarcasm dataset,
BanglaSarc that was constructed specifically for the evaluation of this study.
This dataset consists of fresh records of sarcastic and non-sarcastic comments,
the majority of which are acquired from Facebook and YouTube comment sections.
- Abstract(参考訳): 肯定的なフレーズや否定的な動機を持つ文は、通常、Facebook、Twitter、Redditなどの今日のソーシャルメディアプラットフォームで広く使われている皮肉として定義される。
近年,ソーシャルメディアプラットフォームにおけるアクティブユーザの増加により,市場需要の判断や感情分析,脅威検出など,さまざまなタスクに活用可能な自動NLPベースのシステムの必要性が高まっている。
しかし、sarcasmは通常逆の意味であり、その検出は難しい問題であることが多いため、NLPモデルによるデータ抽出はより複雑になる。
その結果、過去数年間、英語における皮肉検出に関する多くの研究が行われており、バングラ語の状態における顕著な改善とにもかかわらず、皮肉検出は同じままである。
本稿では,従来の機械学習アルゴリズムが89.93\%しか達成できないのに対して,BERTに基づく99.60\%を達成するシステムを提案する。
さらに,本システムに説明可能性を導入するローカル解釈型モデル非依存記述を用いた。
また,本研究では,新たに収集したバングラ・サルカズムデータセットであるバンバラサークを用いて,本研究の評価を行った。
このデータセットはsarcasticとnon-sarcasticのコメントの新記録で構成されており、その大部分はFacebookとYouTubeのコメントセクションから取得されている。
関連論文リスト
- A Survey of Multimodal Sarcasm Detection [32.659528422756416]
サルカスム(Sarcasm)は、発音の文字通りの意味の反対を伝達するために用いられる修辞的な装置である。
これまでに,マルチモーダルサルカズム検出に関する総合的な調査が報告されている。
論文 参考訳(メタデータ) (2024-10-24T16:17:47Z) - Sarcasm Detection in a Disaster Context [103.93691731605163]
HurricaneSARCは,意図した皮肉に注釈を付けた15,000ツイートのデータセットである。
私たちの最高のモデルは、データセットで最大0.70F1を得ることができます。
論文 参考訳(メタデータ) (2023-08-16T05:58:12Z) - Sarcasm Detection Framework Using Emotion and Sentiment Features [62.997667081978825]
本研究では,感情と感情の特徴を取り入れたモデルを提案する。
我々のアプローチは、ソーシャルネットワークプラットフォームとオンラインメディアの4つのデータセットに対して、最先端の結果を得た。
論文 参考訳(メタデータ) (2022-11-23T15:14:44Z) - How to Describe Images in a More Funny Way? Towards a Modular Approach
to Cross-Modal Sarcasm Generation [62.89586083449108]
本稿では,CMSG(Cross-modal sarcasm Generation)の新たな問題,すなわち,与えられた画像に対してサーカシックな記述を生成することについて検討する。
CMSGは、異なるモード間の相関だけでなく、サルカズムの特性をモデルが満たさなければならないため、困難である。
クロスモデルサルカズム生成のための抽出・生成・生成に基づくモジュール法(EGRM)を提案する。
論文 参考訳(メタデータ) (2022-11-20T14:38:24Z) - BanglaSarc: A Dataset for Sarcasm Detection [0.3914676152740142]
Sarcasmは、今日のソーシャルメディアプラットフォームで広く採用されている、ネガティブな動機に基づく肯定的な発言や発言である。
過去数年間、英語におけるサルカズム検出は大幅に改善されてきたが、バングラのサルカズム検出に関する状況は変わっていない。
本稿では,Bangla Sarcを提案する。
論文 参考訳(メタデータ) (2022-09-27T15:28:21Z) - Computational Sarcasm Analysis on Social Media: A Systematic Review [0.23488056916440855]
サルカズムは、人を侮辱したり、いらいらさせたり、楽しませたりするために、本当に表現したいことの反対を言ったり、書いたりするものとして定義することができる。
テキストデータにおけるサルカズムの曖昧な性質から,その検出は困難であり,感情分析研究コミュニティに大きな関心を寄せている。
論文 参考訳(メタデータ) (2022-09-13T17:20:19Z) - A Survey on Automated Sarcasm Detection on Twitter [0.0]
短いテキストメッセージは、特にTwitterのようなソーシャルメディアプラットフォーム上でのコミュニケーションにますます利用されている。
これらのメッセージの統一された皮肉は、文の意味を逆転させ、混乱とコミュニケーションの失敗につながる。
本稿では,文脈による検出,投稿履歴,機械学習モデルなど,現在使われているさまざまな手法について述べる。
論文 参考訳(メタデータ) (2022-02-05T08:38:38Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - AES Systems Are Both Overstable And Oversensitive: Explaining Why And
Proposing Defenses [66.49753193098356]
スコアリングモデルの驚くべき逆方向の脆さの原因について検討する。
のモデルとして訓練されているにもかかわらず、単語の袋のように振る舞うことを示唆している。
高い精度で試料を発生させる過敏性と過敏性を検出できる検出ベース保護モデルを提案する。
論文 参考訳(メタデータ) (2021-09-24T03:49:38Z) - sarcasm detection and quantification in arabic tweets [7.173484352846755]
本論文は,ツイートから収集したサルカズム検出のための,人為的注釈付きアラビア語コーパスを作成することを目的としている。
提案手法は、分類ではなく回帰問題としてこの問題に取り組む。
論文 参考訳(メタデータ) (2021-08-03T11:48:27Z) - $R^3$: Reverse, Retrieve, and Rank for Sarcasm Generation with
Commonsense Knowledge [51.70688120849654]
非皮肉な入力文に基づくサルカズム生成のための教師なしアプローチを提案する。
本手法では,サルカズムの2つの主要な特徴をインスタンス化するために,検索・編集の枠組みを用いる。
論文 参考訳(メタデータ) (2020-04-28T02:30:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。