論文の概要: Conditional Augmentation for Aspect Term Extraction via Masked
Sequence-to-Sequence Generation
- arxiv url: http://arxiv.org/abs/2004.14769v2
- Date: Fri, 1 May 2020 06:42:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 04:14:55.745245
- Title: Conditional Augmentation for Aspect Term Extraction via Masked
Sequence-to-Sequence Generation
- Title(参考訳): masked sequence-to-sequence generation によるアスペクト項抽出のための条件付き拡張
- Authors: Kun Li, Chengbo Chen, Xiaojun Quan, Qing Ling, and Yan Song
- Abstract要約: 条件生成タスクとしてデータ拡張を定式化する。
既存の拡張アプローチとは異なり、我々のアプローチは制御可能であり、より多様化された文を生成することができる。
また、アスペクト項抽出のためのいくつかの現行モデルの性能を効果的に向上させる。
- 参考スコア(独自算出の注目度): 45.93186620192369
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Aspect term extraction aims to extract aspect terms from review texts as
opinion targets for sentiment analysis. One of the big challenges with this
task is the lack of sufficient annotated data. While data augmentation is
potentially an effective technique to address the above issue, it is
uncontrollable as it may change aspect words and aspect labels unexpectedly. In
this paper, we formulate the data augmentation as a conditional generation
task: generating a new sentence while preserving the original opinion targets
and labels. We propose a masked sequence-to-sequence method for conditional
augmentation of aspect term extraction. Unlike existing augmentation
approaches, ours is controllable and allows us to generate more diversified
sentences. Experimental results confirm that our method alleviates the data
scarcity problem significantly. It also effectively boosts the performances of
several current models for aspect term extraction.
- Abstract(参考訳): アスペクト項抽出は、感情分析のための意見対象として、レビューテキストからアスペクト項を抽出することを目的としている。
このタスクの大きな課題のひとつは、十分な注釈付きデータがないことだ。
データ拡張は上記の問題に対処するための効果的な手法であるが、アスペクトワードやアスペクトラベルを予期せず変更する可能性があるため、制御不能である。
本稿では,データ拡張を条件付き生成タスクとして定式化し,元の意見目標とラベルを維持しながら新しい文を生成する。
本稿では,アスペクト項抽出の条件付き拡張のためのマスキングシーケンストシーケンス法を提案する。
既存の拡張アプローチとは異なり、我々は制御可能であり、より多様な文を生成することができる。
実験の結果,本手法はデータの不足を著しく軽減することを確認した。
また、アスペクト項抽出のためのいくつかの現行モデルの性能を効果的に向上させる。
関連論文リスト
- IDEAL: Influence-Driven Selective Annotations Empower In-Context
Learners in Large Language Models [66.32043210237768]
本稿では,影響駆動型選択的アノテーション手法を提案する。
アノテーションのコストを最小限に抑えつつ、コンテキスト内サンプルの品質を向上させることを目的としている。
様々なベンチマークで提案手法の優位性を確認する実験を行った。
論文 参考訳(メタデータ) (2023-10-16T22:53:54Z) - Divide & Bind Your Attention for Improved Generative Semantic Nursing [19.67265541441422]
複数のエンティティを含む複雑なプロンプトやシナリオによって生じる課題に対処するために、Divide & Bindを提案する。
我々のアプローチは、複雑なプロンプトからの属性アライメントを改善して、所望のオブジェクトを忠実に合成する能力において際立っている。
論文 参考訳(メタデータ) (2023-07-20T13:33:28Z) - Improving the Robustness of Summarization Systems with Dual Augmentation [68.53139002203118]
頑健な要約システムは、入力中の特定の単語の選択やノイズに関わらず、文書のギストをキャプチャできるべきである。
まず,単語レベルの同義語置換や雑音を含む摂動に対する要約モデルの頑健性について検討する。
SummAttackerを提案する。これは言語モデルに基づく対数サンプルを生成するための効率的な手法である。
論文 参考訳(メタデータ) (2023-06-01T19:04:17Z) - GDA: Generative Data Augmentation Techniques for Relation Extraction
Tasks [81.51314139202152]
本稿では,意味的一貫性と構文構造を両立させるために2つの相補的モジュールを用いるGDAという,関係テキスト専用の拡張手法を提案する。
低リソース環境下での3つのデータセットによる実験結果から,GDAはエム2.0%のF1改善をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-26T06:21:01Z) - DiffuSum: Generation Enhanced Extractive Summarization with Diffusion [14.930704950433324]
抽出要約は、ソース文書から直接文章を抽出することで要約を形成することを目的としている。
本稿では,抽出要約のための新しいパラダイムであるDiffuSumを提案する。
実験結果から, ROUGEスコアが44.83/22.56/40.56$のCNN/DailyMailにおけるDiffuSumの抽出結果が得られた。
論文 参考訳(メタデータ) (2023-05-02T19:09:16Z) - AugGPT: Leveraging ChatGPT for Text Data Augmentation [59.76140039943385]
本稿では,ChatGPT(AugGPT)に基づくテキストデータ拡張手法を提案する。
AugGPTはトレーニングサンプルの各文を、概念的には似ているが意味的に異なる複数のサンプルに言い換える。
数ショットの学習テキスト分類タスクの実験結果は、提案したAugGPTアプローチの優れた性能を示している。
論文 参考訳(メタデータ) (2023-02-25T06:58:16Z) - SDA: Simple Discrete Augmentation for Contrastive Sentence Representation Learning [14.028140579482688]
SimCSEは、報告されているように、トリミング、単語削除、同義語置換といった個別の増強を驚くほど支配している。
我々は,句読点挿入,モーダル動詞,二重否定の3つの簡易かつ効果的な離散文拡張手法を開発した。
その結果,提案手法の優越性は一貫して向上した。
論文 参考訳(メタデータ) (2022-10-08T08:07:47Z) - Exploiting Unlabeled Data for Target-Oriented Opinion Words Extraction [32.98121084823483]
本研究では,テストデータとトレーニングデータ間の分散シフトのリスクを低減するために,大量のラベルのないデータを活用することを提案する。
本稿では,無ラベルデータを利用する新しいMGCR法を提案し,TOWEに特化して2つのフィルタを設計し,異なる粒度でノイズデータをフィルタリングする。
論文 参考訳(メタデータ) (2022-08-17T13:19:26Z) - Can contrastive learning avoid shortcut solutions? [88.249082564465]
暗黙的特徴修正(IFM)は、より広い種類の予測的特徴を捉えるために、対照的なモデルを導くために、正と負のサンプルを変更する方法である。
IFMは特徴抑制を低減し、その結果、視覚および医用画像タスクのパフォーマンスが向上する。
論文 参考訳(メタデータ) (2021-06-21T16:22:43Z) - Unsupervised Data Augmentation with Naive Augmentation and without
Unlabeled Data [40.82826366059613]
Unsupervised Data Augmentation (UDA) は、モデルの予測の違いを解析するために一貫性損失を適用する半教師付き手法である。
本稿では,UDAを再検討し,その有効性を示す。
一貫性の喪失を適用することで、ラベルのないデータなしで有意義な利益が得られることが分かりました。
論文 参考訳(メタデータ) (2020-10-22T18:01:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。