論文の概要: Leveraging Foreign Language Labeled Data for Aspect-Based Opinion Mining
- arxiv url: http://arxiv.org/abs/2003.06858v1
- Date: Sun, 15 Mar 2020 15:53:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-23 08:27:23.887433
- Title: Leveraging Foreign Language Labeled Data for Aspect-Based Opinion Mining
- Title(参考訳): アスペクトベースオピニオンマイニングのための外国語ラベルデータの活用
- Authors: Nguyen Thi Thanh Thuy, Ngo Xuan Bach, Tu Minh Phuong
- Abstract要約: 本稿では,外国語のラベル付きデータを利用したアスペクトベースの意見マイニング手法を提案する。
異なる言語におけるアスペクトや意見は異なる単語で表現される可能性があるため、単語埋め込みを用いて提案する。
またベトナムのレストランレビューから抽出したアスペクトと感情極性の注釈付きコーパスも導入した。
- 参考スコア(独自算出の注目度): 1.503974529275767
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Aspect-based opinion mining is the task of identifying sentiment at the
aspect level in opinionated text, which consists of two subtasks: aspect
category extraction and sentiment polarity classification. While aspect
category extraction aims to detect and categorize opinion targets such as
product features, sentiment polarity classification assigns a sentiment label,
i.e. positive, negative, or neutral, to each identified aspect. Supervised
learning methods have been shown to deliver better accuracy for this task but
they require labeled data, which is costly to obtain, especially for
resource-poor languages like Vietnamese. To address this problem, we present a
supervised aspect-based opinion mining method that utilizes labeled data from a
foreign language (English in this case), which is translated to Vietnamese by
an automated translation tool (Google Translate). Because aspects and opinions
in different languages may be expressed by different words, we propose using
word embeddings, in addition to other features, to reduce the vocabulary
difference between the original and translated texts, thus improving the
effectiveness of aspect category extraction and sentiment polarity
classification processes. We also introduce an annotated corpus of aspect
categories and sentiment polarities extracted from restaurant reviews in
Vietnamese, and conduct a series of experiments on the corpus. Experimental
results demonstrate the effectiveness of the proposed approach.
- Abstract(参考訳): アスペクトベースの意見マイニングは、アスペクトカテゴリー抽出と感情極性分類という2つのサブタスクからなる、意見テキストのアスペクトレベルでの感情を特定するタスクである。
アスペクトカテゴリー抽出は、製品の特徴などの意見対象を検出し分類することを目的としているが、感情極性分類は、各特定されたアスペクトに対して、肯定的、否定的、中立的な感情ラベルを割り当てる。
教師付き学習方法は、このタスクにより良い精度をもたらすことが示されているが、ラベル付きデータが必要である。
この問題に対処するために,外国語(この場合は英語)のラベル付きデータを自動翻訳ツール(google translate)でベトナム語に翻訳する,アスペクトに基づく意見マイニング手法を提案する。
異なる言語におけるアスペクトや意見が異なる単語で表現されるため、他の特徴に加えて、単語の埋め込みを用いて、原文と翻訳文の語彙差を低減し、アスペクトカテゴリー抽出と感情極性分類プロセスの有効性を向上させることを提案する。
また,ベトナムのレストランレビューから抽出されたアスペクトカテゴリと感情極性の注釈付きコーパスを導入し,コーパスに関する一連の実験を行った。
実験の結果,提案手法の有効性が示された。
関連論文リスト
- Experiences from Creating a Benchmark for Sentiment Classification for Varieties of English [8.823927892310238]
既存のベンチマークは、英語の言語変種のように、言語的な多様性を説明できないことが多い。
本稿では、オーストラリア(en-AU)、インド(en-IN)、イギリス(en-UK)の3種類の英語に対する感情分類ベンチマークを構築した経験について紹介する。
論文 参考訳(メタデータ) (2024-10-15T03:02:03Z) - The Lou Dataset -- Exploring the Impact of Gender-Fair Language in German Text Classification [57.06913662622832]
ジェンダーフェア言語は、すべての性別に対処したり、中立形を使用することによって包摂性を促進する。
ジェンダーフェア言語はラベルを反転させ、確実性を減らし、注意パターンを変化させることで予測に大きな影響を及ぼす。
ドイツ語のテキスト分類への影響について最初の知見を提供する一方で、他の言語にもその知見が当てはまる可能性が高い。
論文 参考訳(メタデータ) (2024-09-26T15:08:17Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - CARBD-Ko: A Contextually Annotated Review Benchmark Dataset for
Aspect-Level Sentiment Classification in Korean [3.2146698079532867]
本稿では,事前学習言語モデル(PLM)におけるアスペクトベース感情分類(ABSC)による課題について検討する。
本稿では、アスペクト固有とアスペクト非依存の感情分類を区別するために、アスペクトとデュアルタグの極性を組み込んだベンチマークデータセットであるCARBD-Koを紹介する。
実験結果から,両極性を正確に予測することの難しさを浮き彫りにし,文脈的感情分析モデルの重要性を浮き彫りにした。
論文 参考訳(メタデータ) (2024-02-23T01:49:38Z) - The performance of multiple language models in identifying offensive
language on social media [6.221851249300585]
本研究の目的は、さまざまなアルゴリズムを用いて攻撃的な投稿を識別する能力をテストすることである。
このプロジェクトの動機は、悪質な投稿のスクリーニングを自動化することで、これらの言語の人間検閲に対する害を軽減することである。
論文 参考訳(メタデータ) (2023-12-10T18:58:26Z) - A Corpus for Sentence-level Subjectivity Detection on English News Articles [49.49218203204942]
我々はこのガイドラインを用いて、議論を呼んだ話題に関する英ニュース記事から抽出した638の目的語と411の主観的な文からなるNewsSD-ENGを収集する。
我々のコーパスは、語彙や機械翻訳といった言語固有のツールに頼ることなく、英語で主観的検出を行う方法を舗装している。
論文 参考訳(メタデータ) (2023-05-29T11:54:50Z) - Under the Morphosyntactic Lens: A Multifaceted Evaluation of Gender Bias
in Speech Translation [20.39599469927542]
ジェンダーバイアスは言語技術に影響を及ぼす問題として広く認識されている。
現代の評価慣行のほとんどは、合成条件下での職業名詞の狭いセットに単語レベルの焦点をあてている。
このようなプロトコルは、性合意のモルフォシンタクティック連鎖を特徴とする文法性言語の重要な特徴を見落としている。
論文 参考訳(メタデータ) (2022-03-18T11:14:16Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - Fine-Grained Opinion Summarization with Minimal Supervision [48.43506393052212]
FineSumは、複数のドキュメントから意見を抽出することでターゲットをプロファイルすることを目的としている。
FineSumは、生のコーパスから意見語句を自動的に識別し、異なる側面と感情に分類し、各アスペクト/感覚の下に複数のきめ細かい意見クラスタを構築する。
ベンチマークの自動評価と定量的人的評価の両方が,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2021-10-17T15:16:34Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - A novel approach to sentiment analysis in Persian using discourse and
external semantic information [0.0]
自然言語で書かれた文書から個人の感情を抽出するための多くのアプローチが提案されている。
これらのアプローチの大半は英語に重点を置いているが、ペルシア語のような資源中心の言語は研究作業や言語資源の欠如に悩まされている。
ペルシア語におけるこのギャップのため、現在の研究はペルシア語に適用される感情分析の新しい手法を導入することを目的としている。
論文 参考訳(メタデータ) (2020-07-18T18:40:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。