論文の概要: Label-Consistent Data Generation for Aspect-Based Sentiment Analysis Using LLM Agents
- arxiv url: http://arxiv.org/abs/2602.16379v1
- Date: Wed, 18 Feb 2026 11:38:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.587333
- Title: Label-Consistent Data Generation for Aspect-Based Sentiment Analysis Using LLM Agents
- Title(参考訳): LLMエージェントを用いたアスペクトベース感性分析のためのラベル一貫性データ生成
- Authors: Mohammad H. A. Monfared, Lucie Flek, Akbar Karimi,
- Abstract要約: Aspect-Based Sentiment Analysis (ABSA) のためのエージェントデータ拡張手法を提案する。
エージェント構造の効果を分離するために,同じモデルと命令を用いて密接に一致したプロンプトベースラインを開発する。
どちらの手法も、3つのABSAサブタスク(Aspect Term extract (ATE), Aspect Sentiment Classification (ATSC), Aspect Sentiment Pair extract (ASPE))、4つのSemEvalデータセット、2つのエンコーダ・デコーダモデル(T5-BaseとTk-Instruct)で評価される。
- 参考スコア(独自算出の注目度): 11.478263835391433
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose an agentic data augmentation method for Aspect-Based Sentiment Analysis (ABSA) that uses iterative generation and verification to produce high quality synthetic training examples. To isolate the effect of agentic structure, we also develop a closely matched prompting-based baseline using the same model and instructions. Both methods are evaluated across three ABSA subtasks (Aspect Term Extraction (ATE), Aspect Sentiment Classification (ATSC), and Aspect Sentiment Pair Extraction (ASPE)), four SemEval datasets, and two encoder-decoder models: T5-Base and Tk-Instruct. Our results show that the agentic augmentation outperforms raw prompting in label preservation of the augmented data, especially when the tasks require aspect term generation. In addition, when combined with real data, agentic augmentation provides higher gains, consistently outperforming prompting-based generation. These benefits are most pronounced for T5-Base, while the more heavily pretrained Tk-Instruct exhibits smaller improvements. As a result, augmented data helps T5-Base achieve comparable performance with its counterpart.
- Abstract(参考訳): 本稿では、反復生成と検証を用いて高品質な合成トレーニング例を生成する、アスペクトベース感性分析(ABSA)のためのエージェントデータ拡張手法を提案する。
エージェント構造の効果を分離するために,同じモデルと命令を用いて密接に一致したプロンプトベースラインを開発する。
どちらの手法も、3つのABSAサブタスク(Aspect Term extract (ATE), Aspect Sentiment Classification (ATSC), Aspect Sentiment Pair extract (ASPE))、4つのSemEvalデータセット、2つのエンコーダ・デコーダモデル(T5-BaseとTk-Instruct)で評価される。
以上の結果から, エージェント拡張は, 特にアスペクト項の生成を必要とする場合, ラベル保存において, 生のプロンプトよりも優れていたことが示唆された。
さらに、実際のデータと組み合わせることで、エージェント拡張はより高いゲインを提供し、一貫してプロンプトベースの生成よりも優れています。
これらの利点はT5-Baseにとって最も顕著であるが、より事前訓練されたTk-Instructはより小さな改善を示している。
結果として、拡張データは、T5-Baseと同等のパフォーマンスを達成するのに役立ちます。
関連論文リスト
- Beyond Sample-Level Feedback: Using Reference-Level Feedback to Guide Data Synthesis [54.15152681093108]
参照レベルフィードバック(Reference-Level Feedback)は、厳選された参照サンプルから望ましい特徴を抽出し、高品質な命令応答対の合成を導くパラダイムである。
実験により、参照レベルフィードバックは従来のサンプルレベルのフィードバック手法を一貫して上回り、モデルアーキテクチャ全体にわたって一般化し、高品質で多様なデータを低コストで生成することを示した。
論文 参考訳(メタデータ) (2025-02-06T21:29:00Z) - Deep Content Understanding Toward Entity and Aspect Target Sentiment Analysis on Foundation Models [0.8602553195689513]
Entity-Aspect Sentiment Triplet extract (EASTE)は、Aspect-Based Sentiment Analysisタスクである。
本研究は,EASTEタスクにおける高性能化を目標とし,モデルサイズ,タイプ,適応技術がタスクパフォーマンスに与える影響について検討する。
最終的には、複雑な感情分析における詳細な洞察と最先端の成果を提供する。
論文 参考訳(メタデータ) (2024-07-04T16:48:14Z) - Iterative Data Generation with Large Language Models for Aspect-based Sentiment Analysis [39.57537769578304]
本稿では,ABSAの性能向上を図るために,IDGという系統的反復データ生成フレームワークを提案する。
IDGの中核は、LLMの強力な能力(命令追従、文脈内学習、自己回帰)を最大限に活用して、より流動的で多様な擬似ラベルデータを生成することである。
IDGは5つのベースラインABSAモデルの間で一貫した、重要なパフォーマンス向上をもたらす。
論文 参考訳(メタデータ) (2024-06-29T07:00:37Z) - Data Augmentation for Traffic Classification [54.92823760790628]
Data Augmentation (DA) はコンピュータビジョン(CV)と自然言語処理(NLP)に広く採用されている技術である。
DAはネットワークのコンテキスト、特にトラフィック分類(TC)タスクにおいて、牽引力を得るのに苦労しています。
論文 参考訳(メタデータ) (2024-01-19T15:25:09Z) - Feedback-guided Data Synthesis for Imbalanced Classification [10.836265321046561]
有用な合成サンプルを用いて静的データセットを拡張するためのフレームワークを提案する。
サンプルはタスクの実際のデータのサポートに近づき、十分に多様であることに気付きました。
ImageNet-LTでは、表現不足のクラスでは4%以上改善され、最先端の結果が得られます。
論文 参考訳(メタデータ) (2023-09-29T21:47:57Z) - RoPDA: Robust Prompt-based Data Augmentation for Low-Resource Named
Entity Recognition [10.03246698225533]
低リソースNERのためのロバストプロンプトベースデータ拡張(RoPDA)
継続的なプロンプトを持つ事前学習言語モデル(PLM)に基づいて、RoPDAはエンティティ拡張とコンテキスト拡張を実行する。
異なるドメインの3つのベンチマークの実験では、RoPDAは強いベースラインで大幅に改善されている。
論文 参考訳(メタデータ) (2023-07-11T14:44:14Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - DAGA: Data Augmentation with a Generation Approach for Low-resource
Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。
本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文 参考訳(メタデータ) (2020-11-03T07:49:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。