論文の概要: User-Guided Aspect Classification for Domain-Specific Texts
- arxiv url: http://arxiv.org/abs/2004.14555v1
- Date: Thu, 30 Apr 2020 03:14:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 03:56:26.108353
- Title: User-Guided Aspect Classification for Domain-Specific Texts
- Title(参考訳): ドメイン特化テキストのユーザガイドアスペクト分類
- Authors: Peiran Li, Fang Guo, Jingbo Shang
- Abstract要約: 本稿では,事前定義されたアスペクトに対して,少数のユーザ提供されたシードワードに基づいてアスペクトを分類する問題について検討する。
最大の課題は、事前に定義されたアスペクトを持たないテキスト用に設計されたノイズの多いmiscアスペクトの扱い方だ。
本稿では,事前定義された側面とミシな側面の相互強化を可能にする新しいフレームワークARYAを提案する。
- 参考スコア(独自算出の注目度): 25.16272160909319
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Aspect classification, identifying aspects of text segments, facilitates
numerous applications, such as sentiment analysis and review summarization. To
alleviate the human effort on annotating massive texts, in this paper, we study
the problem of classifying aspects based on only a few user-provided seed words
for pre-defined aspects. The major challenge lies in how to handle the noisy
misc aspect, which is designed for texts without any pre-defined aspects. Even
domain experts have difficulties to nominate seed words for the misc aspect,
making existing seed-driven text classification methods not applicable. We
propose a novel framework, ARYA, which enables mutual enhancements between
pre-defined aspects and the misc aspect via iterative classifier training and
seed updating. Specifically, it trains a classifier for pre-defined aspects and
then leverages it to induce the supervision for the misc aspect. The prediction
results of the misc aspect are later utilized to filter out noisy seed words
for pre-defined aspects. Experiments in two domains demonstrate the superior
performance of our proposed framework, as well as the necessity and importance
of properly modeling the misc aspect.
- Abstract(参考訳): テキストセグメントの側面を識別するアスペクト分類は、感情分析やレビュー要約などの多くのアプリケーションを促進する。
本稿では,大量のテキストに注釈を付けることの人的労力を軽減するために,事前定義されたアスペクトに対して,少数のユーザが提供するシードワードのみに基づいてアスペクトを分類する問題について検討する。
主な課題は、事前に定義された側面を持たないテキスト用に設計された、騒がしいmiscの側面をどう扱うかにある。
ドメインの専門家でさえ、miscの側面でシードワードを指名することは困難であり、既存のシード駆動のテキスト分類手法は適用できない。
本稿では,事前定義された側面とミシな側面の相互強化を反復的分類器学習とシード更新を通じて実現する新しいフレームワークARYAを提案する。
具体的には、事前定義されたアスペクトの分類器をトレーニングし、それを利用してmiscアスペクトの監督を誘導する。
このmiscアスペクトの予測結果は、後に事前定義された側面に対してノイズの多いシードワードをフィルタリングするために使用される。
2つの領域における実験は、提案フレームワークの優れた性能を示し、また、miscアスペクトを適切にモデル化する必要性と重要性を示す。
関連論文リスト
- Scene Graph Generation with Role-Playing Large Language Models [50.252588437973245]
オープン語彙シーングラフ生成(OVSGG)に対する現在のアプローチは、CLIPのような視覚言語モデルを使用している。
シーン固有の記述に基づくOVSGGフレームワークであるSDSGGを提案する。
対象と対象の複雑な相互作用を捉えるために,相互視覚アダプタと呼ばれる軽量モジュールを提案する。
論文 参考訳(メタデータ) (2024-10-20T11:40:31Z) - Evaluating Text Classification Robustness to Part-of-Speech Adversarial Examples [0.6445605125467574]
逆の例は意思決定プロセスを騙すために設計された入力であり、人間には理解できないことを意図している。
テキストベースの分類システムでは、入力の変更(テキストの文字列)は常に認識可能である。
テキストベースの逆数例の質を向上させるためには、入力テキストのどの要素に注目する価値があるかを知る必要がある。
論文 参考訳(メタデータ) (2024-08-15T18:33:54Z) - RealCustom: Narrowing Real Text Word for Real-Time Open-Domain
Text-to-Image Customization [57.86083349873154]
テキスト・ツー・イメージのカスタマイズは、与えられた被験者に対してテキスト駆動の画像を合成することを目的としている。
既存の作品は擬似語パラダイム、すなわち、与えられた主題を擬似語として表現し、与えられたテキストで合成する。
我々は、RealCustomを初めて、被写体の影響を関連部分のみに正確に制限することで、制御性から類似性を解き放つことを提示する。
論文 参考訳(メタデータ) (2024-03-01T12:12:09Z) - A Self-enhancement Multitask Framework for Unsupervised Aspect Category
Detection [0.24578723416255754]
この研究は、少数のシードワードを用いた教師なしアスペクトカテゴリー検出の問題に対処する。
本稿では,初期シード語の品質を自動的に向上し,高品質な文章を訓練用として選択するフレームワークを提案する。
さらに,Aspect Term extract と Aspect Term Polarity を併用してAspect Term Detection を訓練し,さらなる性能向上を図る。
論文 参考訳(メタデータ) (2023-11-16T09:35:24Z) - Aspect-oriented Opinion Alignment Network for Aspect-Based Sentiment
Classification [14.212306015270208]
本稿では、意見語とそれに対応する側面の文脈的関連を捉えるために、アスペクト指向オピニオンアライメントネットワーク(AOAN)を提案する。
さらに,対象の側面に関連性のある意見情報を一致させる多視点的注意機構を設計する。
提案モデルでは,3つのベンチマークデータセットに対して最先端の結果が得られた。
論文 参考訳(メタデータ) (2023-08-22T13:55:36Z) - AspectCSE: Sentence Embeddings for Aspect-based Semantic Textual
Similarity Using Contrastive Learning and Structured Knowledge [4.563449647618151]
文埋め込みのアスペクトベースのコントラスト学習手法であるAspectCSEを提案する。
アスペクト固有の情報検索タスクにおいて,複数アスペクトの埋め込みが単一アスペクトの埋め込みよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-07-15T17:01:56Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - DeltaScore: Fine-Grained Story Evaluation with Perturbations [69.33536214124878]
DELTASCOREは,ニュアンスストーリーの側面の評価に摂動技術を用いた新しい手法である。
私たちの中心的な命題は、物語が特定の側面(例えば、流感)で興奮する程度は、特定の摂動に対するその感受性の大きさと相関している、と仮定している。
事前学習言語モデルを用いて,前摂動状態と後摂動状態の確率差を計算することにより,アスペクトの品質を測定する。
論文 参考訳(メタデータ) (2023-03-15T23:45:54Z) - Comprehensive Studies for Arbitrary-shape Scene Text Detection [78.50639779134944]
ボトムアップに基づくシーンテキスト検出のための統合フレームワークを提案する。
統一されたフレームワークの下では、非コアモジュールの一貫性のある設定が保証されます。
包括的調査と精巧な分析により、以前のモデルの利点と欠点を明らかにしている。
論文 参考訳(メタデータ) (2021-07-25T13:18:55Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。