論文の概要: A Self-enhancement Multitask Framework for Unsupervised Aspect Category
Detection
- arxiv url: http://arxiv.org/abs/2311.09708v1
- Date: Thu, 16 Nov 2023 09:35:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-17 15:19:33.405532
- Title: A Self-enhancement Multitask Framework for Unsupervised Aspect Category
Detection
- Title(参考訳): 教師なしアスペクトカテゴリー検出のための自己強調型マルチタスクフレームワーク
- Authors: Thi-Nhung Nguyen, Hoang Ngo, Kiem-Hieu Nguyen, Tuan-Dung Cao
- Abstract要約: この研究は、少数のシードワードを用いた教師なしアスペクトカテゴリー検出の問題に対処する。
本稿では,初期シード語の品質を自動的に向上し,高品質な文章を訓練用として選択するフレームワークを提案する。
さらに,Aspect Term extract と Aspect Term Polarity を併用してAspect Term Detection を訓練し,さらなる性能向上を図る。
- 参考スコア(独自算出の注目度): 0.24578723416255754
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Our work addresses the problem of unsupervised Aspect Category Detection
using a small set of seed words. Recent works have focused on learning
embedding spaces for seed words and sentences to establish similarities between
sentences and aspects. However, aspect representations are limited by the
quality of initial seed words, and model performances are compromised by noise.
To mitigate this limitation, we propose a simple framework that automatically
enhances the quality of initial seed words and selects high-quality sentences
for training instead of using the entire dataset. Our main concepts are to add
a number of seed words to the initial set and to treat the task of noise
resolution as a task of augmenting data for a low-resource task. In addition,
we jointly train Aspect Category Detection with Aspect Term Extraction and
Aspect Term Polarity to further enhance performance. This approach facilitates
shared representation learning, allowing Aspect Category Detection to benefit
from the additional guidance offered by other tasks. Extensive experiments
demonstrate that our framework surpasses strong baselines on standard datasets.
- Abstract(参考訳): 本研究は,少数のシードワードを用いた教師なしアスペクトカテゴリー検出の問題に対処する。
最近の研究は、文とアスペクトの類似性を確立するために、シード語と文の埋め込み空間を学習することに焦点を当てている。
しかしながら、アスペクト表現は初期シード語の品質によって制限され、モデル性能はノイズによって損なわれる。
この制限を緩和するために,初期シード単語の品質を自動向上し,データセット全体を使用するのではなく,高品質な文を選択するシンプルなフレームワークを提案する。
私たちの主な概念は、初期セットに多くのシードワードを追加し、ノイズ解決のタスクを低リソースタスクのデータ拡張のタスクとして扱うことです。
さらに,Aspect Term extract と Aspect Term Polarity を併用してAspect Term Detection を訓練し,さらなる性能向上を図る。
このアプローチは共有表現学習を促進し、アスペクトカテゴリ検出は、他のタスクが提供する追加のガイダンスの恩恵を受けることができる。
大規模な実験によって、私たちのフレームワークは標準データセットの強いベースラインを超えています。
関連論文リスト
- Manual Verbalizer Enrichment for Few-Shot Text Classification [1.860409237919611]
acrshortmaveは、クラスラベルの豊か化による動詞化のためのアプローチである。
本モデルでは, 資源を著しく減らしながら, 最先端の成果が得られている。
論文 参考訳(メタデータ) (2024-10-08T16:16:47Z) - Betrayed by Captions: Joint Caption Grounding and Generation for Open
Vocabulary Instance Segmentation [80.48979302400868]
オープンな語彙のインスタンスセグメンテーションに注目し、セグメンテーションモデルを拡張して、インスタンスレベルの新しいカテゴリを分類し、セグメンテーションする。
これまでは、画像領域と名詞の字幕間の1対1のマッピングを確立するために、大量の字幕データセットと複雑なパイプラインに頼っていた。
我々は,一致したオブジェクトのみに着目して学習効率を向上させる新しいグラウンドニング損失を取り入れた,共同の textbf Caption Grounding and Generation (CGG) フレームワークを考案した。
論文 参考訳(メタデータ) (2023-01-02T18:52:12Z) - Fine-Grained Visual Entailment [51.66881737644983]
そこで本稿では,テキストから画像への微粒な知識要素の論理的関係を予測することを目的として,このタスクの拡張を提案する。
従来の研究とは異なり、本手法は本質的に説明可能であり、異なるレベルの粒度で論理的予測を行う。
本手法は,手動でアノテートした知識要素のデータセットを用いて評価し,この課題に対して68.18%の精度を達成できることを示す。
論文 参考訳(メタデータ) (2022-03-29T16:09:38Z) - On Guiding Visual Attention with Language Specification [76.08326100891571]
注意をそらすのではなく,タスク関連機能に分類証拠を限定するためのアドバイスとして,ハイレベルな言語仕様を用いる。
この方法で空間的注意を監督することは、偏りのあるノイズのあるデータを用いた分類タスクの性能を向上させる。
論文 参考訳(メタデータ) (2022-02-17T22:40:19Z) - Dense Contrastive Visual-Linguistic Pretraining [53.61233531733243]
画像とテキストを共同で表現するマルチモーダル表現学習手法が提案されている。
これらの手法は,大規模マルチモーダル事前学習から高レベルな意味情報を取得することにより,優れた性能を実現する。
そこで本稿では,非バイアスのDense Contrastive Visual-Linguistic Pretrainingを提案する。
論文 参考訳(メタデータ) (2021-09-24T07:20:13Z) - The Single-Noun Prior for Image Clustering [34.97652735163338]
近年,自己教師付きクラスタリング手法は精度の向上を図っているが,教師付き分類法のようには機能していない。
先述の"single-noun"は、セマンティッククラスタは、人間が単一名詞でラベル付けする概念に対応する傾向がある、と述べている。
本稿では,施設配置問題の特別な場合として,この最適化タスクを大規模に解くための簡単な手法を提案する。
論文 参考訳(メタデータ) (2021-04-08T17:54:37Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - User-Guided Aspect Classification for Domain-Specific Texts [25.16272160909319]
本稿では,事前定義されたアスペクトに対して,少数のユーザ提供されたシードワードに基づいてアスペクトを分類する問題について検討する。
最大の課題は、事前に定義されたアスペクトを持たないテキスト用に設計されたノイズの多いmiscアスペクトの扱い方だ。
本稿では,事前定義された側面とミシな側面の相互強化を可能にする新しいフレームワークARYAを提案する。
論文 参考訳(メタデータ) (2020-04-30T03:14:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。