論文の概要: Leveraging Large Language Models for Sarcastic Speech Annotation in Sarcasm Detection
- arxiv url: http://arxiv.org/abs/2506.00955v1
- Date: Sun, 01 Jun 2025 11:00:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:33.807667
- Title: Leveraging Large Language Models for Sarcastic Speech Annotation in Sarcasm Detection
- Title(参考訳): サーカスム検出におけるサーカシック音声アノテーションのための大規模言語モデルの導入
- Authors: Zhu Li, Yuqing Zhang, Xiyuan Gao, Shekhar Nayak, Matt Coler,
- Abstract要約: サルカズムは基本的にトーンと文脈を通して意味を変化させるが、音声でそれを検出することはデータ不足による課題である。
本稿では,大規模言語モデル(LLM)を利用してサルカズムデータセットを生成するアノテーションパイプラインを提案する。
本研究では,アノテーションの品質と検出性能を比較して,提案手法の有効性を検証した。
最後に,このパイプラインを通じて作成した大規模サーカシック音声データセットであるPodSarcを紹介する。
- 参考スコア(独自算出の注目度): 16.35106164874197
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sarcasm fundamentally alters meaning through tone and context, yet detecting it in speech remains a challenge due to data scarcity. In addition, existing detection systems often rely on multimodal data, limiting their applicability in contexts where only speech is available. To address this, we propose an annotation pipeline that leverages large language models (LLMs) to generate a sarcasm dataset. Using a publicly available sarcasm-focused podcast, we employ GPT-4o and LLaMA 3 for initial sarcasm annotations, followed by human verification to resolve disagreements. We validate this approach by comparing annotation quality and detection performance on a publicly available sarcasm dataset using a collaborative gating architecture. Finally, we introduce PodSarc, a large-scale sarcastic speech dataset created through this pipeline. The detection model achieves a 73.63% F1 score, demonstrating the dataset's potential as a benchmark for sarcasm detection research.
- Abstract(参考訳): サルカズムは基本的にトーンと文脈を通して意味を変化させるが、音声でそれを検出することはデータ不足による課題である。
さらに、既存の検出システムは、しばしばマルチモーダルデータに依存しており、音声のみのコンテキストにおける適用性を制限している。
そこで本稿では,大規模言語モデル(LLM)を利用してサルカズムデータセットを生成するアノテーションパイプラインを提案する。
GPT-4o と LLaMA 3 を初回サルカズムアノテーションとして使用し,続いて人間による検証により不一致を解消した。
我々は,協調ゲーティングアーキテクチャを用いて,利用可能なサルカズムデータセットに対して,アノテーションの品質と検出性能を比較して,このアプローチを検証する。
最後に,このパイプラインを通じて作成した大規模サーカシック音声データセットであるPodSarcを紹介する。
検出モデルは73.63%のF1スコアを獲得し、皮肉検出研究のベンチマークとしてデータセットの可能性を示す。
関連論文リスト
- A Survey of Multimodal Sarcasm Detection [32.659528422756416]
サルカスム(Sarcasm)は、発音の文字通りの意味の反対を伝達するために用いられる修辞的な装置である。
これまでに,マルチモーダルサルカズム検出に関する総合的な調査が報告されている。
論文 参考訳(メタデータ) (2024-10-24T16:17:47Z) - KoCoSa: Korean Context-aware Sarcasm Detection Dataset [3.369750569233713]
サルカズム(英: Sarcasm)は、言葉による皮肉の一種で、ある人、状況、あるいは考えを笑うために、誰かがその意味とは逆の言葉を言う。
本稿では,韓国のSarcasm検出タスクKoCoSaの新しいデータセットについて紹介する。
データセットは、1日12.8Kの韓国の対話と、最後のレスポンスでこのタスクのラベルで構成されている。
論文 参考訳(メタデータ) (2024-02-22T10:17:57Z) - Sentiment-enhanced Graph-based Sarcasm Explanation in Dialogue [63.32199372362483]
本稿では,SEntiment-enhanceD Graph を用いたマルチモーダルサルカズム記述フレームワーク EDGE を提案する。
特に,まずレキシコン誘導型発話感情推論モジュールを提案し,そこでは発話感情改善戦略を考案する。
次に,マルチモーダル感情分析モデル JCA を拡張し,映像音声クリップ毎に共同感情ラベルを導出することにより,JCA-SI (Joint Cross Attention-based Sentiment Inference) というモジュールを開発する。
論文 参考訳(メタデータ) (2024-02-06T03:14:46Z) - An Evaluation of State-of-the-Art Large Language Models for Sarcasm
Detection [0.0]
サルカズム(英: Sarcasm)とは、彼が言いたいことの逆を意味する人による言葉の使用である。
NLPの最近の革新により、サルカズムを検出する可能性がさらに高まった。
論文 参考訳(メタデータ) (2023-10-07T14:45:43Z) - Sarcasm Detection Framework Using Emotion and Sentiment Features [62.997667081978825]
本研究では,感情と感情の特徴を取り入れたモデルを提案する。
我々のアプローチは、ソーシャルネットワークプラットフォームとオンラインメディアの4つのデータセットに対して、最先端の結果を得た。
論文 参考訳(メタデータ) (2022-11-23T15:14:44Z) - How to Describe Images in a More Funny Way? Towards a Modular Approach
to Cross-Modal Sarcasm Generation [62.89586083449108]
本稿では,CMSG(Cross-modal sarcasm Generation)の新たな問題,すなわち,与えられた画像に対してサーカシックな記述を生成することについて検討する。
CMSGは、異なるモード間の相関だけでなく、サルカズムの特性をモデルが満たさなければならないため、困難である。
クロスモデルサルカズム生成のための抽出・生成・生成に基づくモジュール法(EGRM)を提案する。
論文 参考訳(メタデータ) (2022-11-20T14:38:24Z) - Augmenting Data for Sarcasm Detection with Unlabeled Conversation
Context [55.898436183096614]
本稿では,会話コンテキストを利用して意味のあるサンプルを生成する新しいデータ拡張手法であるCRA(Contextual Response Augmentation)を提案する。
具体的には,提案手法を訓練し,FigLang2020の皮肉検出タスクに参加し,RedditとTwitterのデータセットで最高のパフォーマンスを実現した。
論文 参考訳(メタデータ) (2020-06-11T09:00:11Z) - Sarcasm Detection using Context Separators in Online Discourse [3.655021726150369]
サルカズム(Sarcasm)は、意味が暗黙的に伝えられる複雑な形態の言語である。
本研究では,RoBERTa_largeを用いて2つのデータセットの皮肉を検出する。
また,文脈単語埋め込みモデルの性能向上における文脈の重要性を主張する。
論文 参考訳(メタデータ) (2020-06-01T10:52:35Z) - $R^3$: Reverse, Retrieve, and Rank for Sarcasm Generation with
Commonsense Knowledge [51.70688120849654]
非皮肉な入力文に基づくサルカズム生成のための教師なしアプローチを提案する。
本手法では,サルカズムの2つの主要な特徴をインスタンス化するために,検索・編集の枠組みを用いる。
論文 参考訳(メタデータ) (2020-04-28T02:30:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。