論文の概要: Data Augmentation in a Hybrid Approach for Aspect-Based Sentiment
Analysis
- arxiv url: http://arxiv.org/abs/2103.15912v1
- Date: Mon, 29 Mar 2021 19:43:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-31 15:04:10.016462
- Title: Data Augmentation in a Hybrid Approach for Aspect-Based Sentiment
Analysis
- Title(参考訳): Aspect-based Sentiment Analysisのためのハイブリッドアプローチにおけるデータ拡張
- Authors: Tomas Liesting, Flavius Frasincar, Maria Mihaela Trusca
- Abstract要約: アスペクトベース感情分析(HAABSA)のための最先端ハイブリッドアプローチにおけるデータ拡張の効果について検討する。
簡単なデータ拡張(EDA)、逆翻訳、単語混合の修正版を適用します。
最良の結果は、調整されたedaのバージョンで得られ、semeval 2016データセットでは0.5ポイント改善され、semeval 2015データセットでは1ポイント向上する。
- 参考スコア(独自算出の注目度): 1.469597968606607
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data augmentation is a way to increase the diversity of available data by
applying constrained transformations on the original data. This strategy has
been widely used in image classification but has to the best of our knowledge
not yet been used in aspect-based sentiment analysis (ABSA). ABSA is a text
analysis technique that determines aspects and their associated sentiment in
opinionated text. In this paper, we investigate the effect of data augmentation
on a state-of-the-art hybrid approach for aspect-based sentiment analysis
(HAABSA). We apply modified versions of easy data augmentation (EDA),
backtranslation, and word mixup. We evaluate the proposed techniques on the
SemEval 2015 and SemEval 2016 datasets. The best result is obtained with the
adjusted version of EDA, which yields a 0.5 percentage point improvement on the
SemEval 2016 dataset and 1 percentage point increase on the SemEval 2015
dataset compared to the original HAABSA model.
- Abstract(参考訳): データ拡張は、元のデータに制約付き変換を適用することで、利用可能なデータの多様性を高める方法である。
この戦略は画像分類において広く用いられてきたが,アスペクトベース感情分析(ABSA)では,私たちの知る限りでは十分である。
ABSAは、意見テキストにおける側面とその関連する感情を決定するテキスト分析技術である。
本稿では、アスペクトベース感情分析(HAABSA)のための最先端ハイブリッドアプローチにおけるデータ拡張の効果について検討する。
簡単なデータ拡張(EDA)、バックトランスレーション、単語ミックスアップの修正版を適用した。
提案手法をSemEval 2015とSemEval 2016データセットで評価した。
最良の結果は、調整されたedaのバージョンで得られ、semeval 2016データセットでは0.5ポイント改善され、semeval 2015データセットではオリジナルのhaabsaモデルと比較して1ポイント向上する。
関連論文リスト
- Unveiling the Superior Paradigm: A Comparative Study of Source-Free Domain Adaptation and Unsupervised Domain Adaptation [52.36436121884317]
Source-Free Domain Adaptation (SFDA) は、現実のシナリオにおいて、Unsupervised Domain Adaptation (UDA) よりも一般的に優れていることを示す。
SFDAは、時間効率、ストレージ要件、対象とする学習目標、負の移動リスクの低減、過度な適合に対する堅牢性の向上といった利点を提供している。
利用可能なソースデータをマルチSFDA手法に効果的に統合する新しい重み推定法を提案する。
論文 参考訳(メタデータ) (2024-11-24T13:49:29Z) - Data Augmentation for Image Classification using Generative AI [8.74488498507946]
データ拡張はデータセットのサイズを拡大するための有望なソリューションである。
最近のアプローチでは、生成AIモデルを使用してデータセットの多様性を改善している。
我々はAGA(Automated Generative Data Augmentation)を提案する。
論文 参考訳(メタデータ) (2024-08-31T21:16:43Z) - Instruct-DeBERTa: A Hybrid Approach for Aspect-based Sentiment Analysis on Textual Reviews [2.0143010051030417]
Aspect-based Sentiment Analysis (ABSA)は自然言語処理(NLP)における重要な課題である
従来の感情分析手法は、全体的な感情を決定するのに有用だが、特定の製品やサービス機能に関する暗黙の意見を見逃すことが多い。
本稿では、レキシコンベースのアプローチから機械学習まで、ABSA方法論の進化を包括的に概観する。
論文 参考訳(メタデータ) (2024-08-23T16:31:07Z) - Towards Robust Aspect-based Sentiment Analysis through
Non-counterfactual Augmentations [40.71705332298682]
非事実的データ拡張に依存する代替手法を提案する。
我々のアプローチはさらにABSAロバストネスベンチマークの新たな最先端を確立し、ドメイン間でうまく転送する。
論文 参考訳(メタデータ) (2023-06-24T13:57:32Z) - A Novel Counterfactual Data Augmentation Method for Aspect-Based
Sentiment Analysis [7.921043998643318]
本稿では,逆の感情極性を持つ意見表現を生成するための,新しい簡易な反実データ拡張手法を提案する。
実験の結果,提案手法は3つのABSAデータセット上での現在の拡張手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2023-06-20T03:25:51Z) - IDA: Informed Domain Adaptive Semantic Segmentation [51.12107564372869]
クラスレベルのセグメンテーション性能に基づいてデータを混合する自己学習フレームワークであるDomain Informed Adaptation (IDA) モデルを提案する。
IDAモデルでは、クラスレベルの性能を期待信頼スコア(ECS)によって追跡し、動的スケジュールを用いて異なる領域のデータに対する混合比を決定する。
提案手法は,GTA-Vの都市景観への適応において1.1 mIoU,SynTHIAの都市への適応において0.9 mIoUのマージンで,最先端のUDA-SS法よりも優れる。
論文 参考訳(メタデータ) (2023-03-05T18:16:34Z) - Dataset Distillation via Factorization [58.8114016318593]
既存のデータセット蒸留(DD)ベースラインに移植可能なプラグ・アンド・プレイ戦略であるEmphHaBaと呼ばれるEmphdataset Factorizationアプローチを導入する。
emphHaBaは、データセットをデータemphHallucinationネットワークとemphBaseの2つのコンポーネントに分解する方法を探っている。
提案手法は, 圧縮パラメータの総数を最大65%削減しつつ, 下流の分類タスクを従来に比べて大幅に改善することができる。
論文 参考訳(メタデータ) (2022-10-30T08:36:19Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - LiDAR dataset distillation within bayesian active learning framework:
Understanding the effect of data augmentation [63.20765930558542]
アクティブラーニング(AL)は、アノテーションコストとデータセットサイズの削減に対処するため、最近再び注目されている。
本稿では,大規模なセマンティックKITTIデータセットの1/4分の1でALベースのデータセット蒸留を原理的に評価する。
我々は、選択したデータセット構成からのサンプルの60%のみを使用して、データ拡張が完全なデータセット精度を達成することを観察した。
論文 参考訳(メタデータ) (2022-02-06T00:04:21Z) - CoDA: Contrast-enhanced and Diversity-promoting Data Augmentation for
Natural Language Understanding [67.61357003974153]
我々はCoDAと呼ばれる新しいデータ拡張フレームワークを提案する。
CoDAは、複数の変換を有機的に統合することで、多種多様な情報付加例を合成する。
すべてのデータサンプルのグローバルな関係を捉えるために、対照的な正則化の目的を導入する。
論文 参考訳(メタデータ) (2020-10-16T23:57:03Z) - On the Generalization Effects of Linear Transformations in Data
Augmentation [32.01435459892255]
データ拡張は、画像やテキストの分類タスクのようなアプリケーションのパフォーマンスを改善するための強力な技術である。
我々は線形変換の族を研究し、過度にパラメータ化された線形回帰設定におけるリッジ推定器への影響について研究する。
本稿では,モデルが変換データに対してどの程度不確実であるかによって,変換空間を探索する拡張手法を提案する。
論文 参考訳(メタデータ) (2020-05-02T04:10:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。