Fugu-MT 論文翻訳(概要): Augmenting Data for Sarcasm Detection with Unlabeled Conversation Context

論文の概要: Augmenting Data for Sarcasm Detection with Unlabeled Conversation Context

arxiv url: http://arxiv.org/abs/2006.06259v1
Date: Thu, 11 Jun 2020 09:00:11 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-22 13:50:13.528988
Title: Augmenting Data for Sarcasm Detection with Unlabeled Conversation Context
Title（参考訳）: ラベルのない会話コンテキストによるサルカズム検出のためのデータ強化
Authors: Hankyol Lee, Youngjae Yu, Gunhee Kim
Abstract要約: 本稿では,会話コンテキストを利用して意味のあるサンプルを生成する新しいデータ拡張手法であるCRA(Contextual Response Augmentation)を提案する。具体的には,提案手法を訓練し,FigLang2020の皮肉検出タスクに参加し,RedditとTwitterのデータセットで最高のパフォーマンスを実現した。
参考スコア（独自算出の注目度）: 55.898436183096614
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present a novel data augmentation technique, CRA (Contextual Response Augmentation), which utilizes conversational context to generate meaningful samples for training. We also mitigate the issues regarding unbalanced context lengths by changing the input-output format of the model such that it can deal with varying context lengths effectively. Specifically, our proposed model, trained with the proposed data augmentation technique, participated in the sarcasm detection task of FigLang2020, have won and achieves the best performance in both Reddit and Twitter datasets.
Abstract（参考訳）: 本稿では,会話コンテキストを利用して意味のあるサンプルを生成する新しいデータ拡張手法であるCRA(Contextual Response Augmentation)を提案する。また,モデルの入出力形式を変更し,コンテキスト長の変動を効果的に扱えるようにすることで,不均衡なコンテキスト長に関する問題を緩和する。特に,提案手法で学習した提案モデルは,figlang2020のsarcasm検出タスクに参加し,redditとtwitterのデータセットで最高のパフォーマンスを達成している。

関連論文リスト

Leveraging Large Language Models for Sarcastic Speech Annotation in Sarcasm Detection [16.35106164874197]
サルカズムは基本的にトーンと文脈を通して意味を変化させるが、音声でそれを検出することはデータ不足による課題である。本稿では,大規模言語モデル(LLM)を利用してサルカズムデータセットを生成するアノテーションパイプラインを提案する。本研究では,アノテーションの品質と検出性能を比較して,提案手法の有効性を検証した。最後に,このパイプラインを通じて作成した大規模サーカシック音声データセットであるPodSarcを紹介する。
論文参考訳（メタデータ） (2025-06-01T11:00:18Z)
Generalizing From Short to Long: Effective Data Synthesis for Long-Context Instruction Tuning [103.65680870130839]
本研究では,長期事前学習モデルの学習後段階の指導データを設計する方法について検討する。制御された研究では、短い文脈で調整されたモデルが、より長いコンテキストに効果的に一般化できることが判明した。これらの知見に基づいて,新しいデータ合成フレームワークであるコンテキスト合成を提案する。
論文参考訳（メタデータ） (2025-02-21T17:02:40Z)
Effective Long-Context Scaling of Foundation Models [90.57254298730923]
最大32,768個のトークンの効率的なコンテキストウィンドウをサポートする長文LLMを提示する。我々のモデルは、ほとんどの通常のタスクにおいて一貫した改善を達成し、Llama 2よりも長いコンテキストタスクを大幅に改善します。
論文参考訳（メタデータ） (2023-09-27T21:41:49Z)
Learning towards Selective Data Augmentation for Dialogue Generation [52.540330534137794]
すべての事例が増補作業に有益である訳ではなく、増補に適した事例は以下の2つの属性に従うべきであると我々は主張する。応答生成タスクに対してSDA(Selective Data Augmentation framework)を提案する。
論文参考訳（メタデータ） (2023-03-17T01:26:39Z)
WADER at SemEval-2023 Task 9: A Weak-labelling framework for Data augmentation in tExt Regression Tasks [4.102007186133394]
本稿では、WADERと呼ばれるテキスト回帰タスクにおいて、データ拡張のための新しい弱ラベル方式を提案する。我々は、WADERを用いて、事前訓練された多言語言語モデルの性能をベンチマークし、データのバイアスを軽減するためにサンプリング技術を用いて分析する。
論文参考訳（メタデータ） (2023-03-05T19:45:42Z)
AugGPT: Leveraging ChatGPT for Text Data Augmentation [59.76140039943385]
本稿では,ChatGPT(AugGPT)に基づくテキストデータ拡張手法を提案する。 AugGPTはトレーニングサンプルの各文を、概念的には似ているが意味的に異なる複数のサンプルに言い換える。数ショットの学習テキスト分類タスクの実験結果は、提案したAugGPTアプローチの優れた性能を示している。
論文参考訳（メタデータ） (2023-02-25T06:58:16Z)
Sarcasm Detection in Twitter -- Performance Impact when using Data Augmentation: Word Embeddings [0.0]
サルカスム(Sarcasm)は、通常、誰かをモックしたり、困惑させたり、ユーモラスな目的のために使われる言葉である。本稿では,RoBERTaを用いたTwitterにおける皮肉識別のコンテキストモデルを提案する。サーカシックとラベル付けされたデータの20%を増やすために、データ拡張を使用する場合、iSarcasmデータセットで3.2%の性能向上を実現した。
論文参考訳（メタデータ） (2021-08-23T04:24:12Z)
Few-shot learning through contextual data augmentation [74.20290390065475]
機械翻訳モデルは、時間とともに性能を維持するために新しいデータに適応する必要がある。一つの例から5つの例への適応が可能であることを示す。本モデルでは,平均313個の並列例でトレーニングした基準システムよりも精度がよいことを示す。
論文参考訳（メタデータ） (2021-03-31T09:05:43Z)
Improving Commonsense Causal Reasoning by Adversarial Training and Data Augmentation [14.92157586545743]
本稿では,因果推論の領域において,モデルをより堅牢にするための多くの手法を提案する。少数の追加生成データポイントがなくても、パフォーマンスと両方のデータセットの統計的に有意な改善を示します。
論文参考訳（メタデータ） (2021-01-13T09:55:29Z)
Sarcasm Detection using Context Separators in Online Discourse [3.655021726150369]
サルカズム(Sarcasm)は、意味が暗黙的に伝えられる複雑な形態の言語である。本研究では,RoBERTa_largeを用いて2つのデータセットの皮肉を検出する。また,文脈単語埋め込みモデルの性能向上における文脈の重要性を主張する。
論文参考訳（メタデータ） (2020-06-01T10:52:35Z)
Improving Multi-Turn Response Selection Models with Complementary Last-Utterance Selection by Instance Weighting [84.9716460244444]
我々は、データリソース自体の根底にある相関を利用して、異なる種類の監視信号を導出することを検討する。 2つの公開データセットで広範な実験を行い、両方のデータセットで大幅に改善した。
論文参考訳（メタデータ） (2020-02-18T06:29:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。