論文の概要: Presenting an approach based on weighted CapsuleNet networks for Arabic
and Persian multi-domain sentiment analysis
- arxiv url: http://arxiv.org/abs/2306.17068v1
- Date: Mon, 12 Jun 2023 09:53:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-02 13:07:47.662594
- Title: Presenting an approach based on weighted CapsuleNet networks for Arabic
and Persian multi-domain sentiment analysis
- Title(参考訳): アラビア語およびペルシア語多ドメイン感情分析のための重み付きカプセルネットネットワークに基づくアプローチの提案
- Authors: Mahboobeh Sadat Kobari, Nima Karimi, Benyamin Pourhosseini, Ramin
Mousa
- Abstract要約: 本稿では,累積重み付きカプセルネットワークを用いたペルシア語/アラビア語多ドメイン感情分析手法を提案する。
提案手法はDigikalaデータセットを用いて評価し,既存の手法に比べて精度が高かった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sentiment classification is a fundamental task in natural language
processing, assigning one of the three classes, positive, negative, or neutral,
to free texts. However, sentiment classification models are highly domain
dependent; the classifier may perform classification with reasonable accuracy
in one domain but not in another due to the Semantic multiplicity of words
getting poor accuracy. This article presents a new Persian/Arabic multi-domain
sentiment analysis method using the cumulative weighted capsule networks
approach. Weighted capsule ensemble consists of training separate capsule
networks for each domain and a weighting measure called domain belonging degree
(DBD). This criterion consists of TF and IDF, which calculates the dependency
of each document for each domain separately; this value is multiplied by the
possible output that each capsule creates. In the end, the sum of these
multiplications is the title of the final output, and is used to determine the
polarity. And the most dependent domain is considered the final output for each
domain. The proposed method was evaluated using the Digikala dataset and
obtained acceptable accuracy compared to the existing approaches. It achieved
an accuracy of 0.89 on detecting the domain of belonging and 0.99 on detecting
the polarity. Also, for the problem of dealing with unbalanced classes, a
cost-sensitive function was used. This function was able to achieve 0.0162
improvements in accuracy for sentiment classification. This approach on Amazon
Arabic data can achieve 0.9695 accuracies in domain classification.
- Abstract(参考訳): 感情分類は自然言語処理における基本的なタスクであり、ポジティブ、ネガティブ、ニュートラルの3つのクラスのうちの1つを自由テキストに割り当てる。
しかし、感情分類モデルは高度にドメインに依存しており、分類器は、ある領域において妥当な精度で分類を行うが、単語の意味的重複が正確性に乏しいため、別の領域では分類しない。
本稿では,累積加重カプセルネットワークを用いたペルシャ/アラビア多ドメイン感情分析手法を提案する。
軽量カプセルアンサンブルは、各ドメインごとに別々のカプセルネットワークをトレーニングし、ドメイン依存度(DBD)と呼ばれる重み付け尺度から成っている。
この基準はTFとIDFから成り、各ドメインのそれぞれのドキュメントの依存関係を別々に計算し、この値は各カプセルが生成する可能性のある出力によって乗算される。
最終的に、これらの乗法の総和は最終的な出力の肩書きであり、極性を決定するために使われる。
そして、最も依存しているドメインは各ドメインの最終的な出力と見なされる。
提案手法はDigikalaデータセットを用いて評価し,既存の手法に比べて精度が高かった。
その結果,帰属領域の検出精度0.89,極性検出精度0.99が得られた。
また、不均衡なクラスを扱う問題に対して、コスト感受性関数が用いられた。
この機能は感情分類の精度を0.0162改善することができた。
amazon arabic dataに対するこのアプローチは、ドメイン分類において 0.9695 accuraciesを達成することができる。
関連論文リスト
- Efficient Hierarchical Domain Adaptation for Pretrained Language Models [77.02962815423658]
生成言語モデルは、多種多様な一般的なドメインコーパスに基づいて訓練される。
計算効率のよいアダプタアプローチを用いて,ドメイン適応を多種多様なドメインに拡張する手法を提案する。
論文 参考訳(メタデータ) (2021-12-16T11:09:29Z) - Contrastive Learning and Self-Training for Unsupervised Domain
Adaptation in Semantic Segmentation [71.77083272602525]
UDAはラベル付きソースドメインからラベルなしターゲットドメインへの効率的な知識伝達を試みている。
本稿では,領域にまたがるカテゴリ別センタロイドを適応させるコントラスト学習手法を提案する。
提案手法を自己学習で拡張し,メモリ効率の良い時間アンサンブルを用いて一貫性と信頼性の高い擬似ラベルを生成する。
論文 参考訳(メタデータ) (2021-05-05T11:55:53Z) - Learning to Share by Masking the Non-shared for Multi-domain Sentiment
Classification [24.153584996936424]
テキストからドメイン関連語を明示的にマスキングし,これらのドメインに依存しないテキストからドメイン不変感の特徴を学習し,それらのマスキング語を用いてドメイン認識文表現を形成するネットワークを提案する。
適応度の高い複数領域感情分類データセットの実証実験により,提案モデルの有効性が実証された。
論文 参考訳(メタデータ) (2021-04-17T08:15:29Z) - Instance Level Affinity-Based Transfer for Unsupervised Domain
Adaptation [74.71931918541748]
ILA-DAと呼ばれる適応中のソースからターゲットへの転送に対するインスタンス親和性に基づく基準を提案する。
まず、ソースとターゲットをまたいだ類似および異種サンプルを抽出し、マルチサンプルのコントラスト損失を利用してドメインアライメントプロセスを駆動する信頼性が高く効率的な手法を提案する。
ILA-DAの有効性は、様々なベンチマークデータセットに対する一般的なドメイン適応手法よりも精度が一貫した改善を観察することによって検証する。
論文 参考訳(メタデータ) (2021-04-03T01:33:14Z) - Domain Generalization in Biosignal Classification [37.70077538403524]
本研究は,生体信号データの領域一般化を初めて研究したものである。
提案手法は4つの未確認領域に対して最大16%の精度向上を実現する。
論文 参考訳(メタデータ) (2020-11-12T05:15:46Z) - Learning Target Domain Specific Classifier for Partial Domain Adaptation [85.71584004185031]
非教師付きドメイン適応(UDA)は、ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送する際の分散不一致を低減することを目的としている。
本稿では,ターゲットラベル空間をソースラベル空間に仮定する,より現実的なUDAシナリオに焦点を当てる。
論文 参考訳(メタデータ) (2020-08-25T02:28:24Z) - Simultaneous Semantic Alignment Network for Heterogeneous Domain
Adaptation [67.37606333193357]
本稿では,カテゴリ間の相関を同時に利用し,各カテゴリ毎のセントロイドを整列させるために,aSimultaneous Semantic Alignment Network (SSAN)を提案する。
対象の擬似ラベルを利用することで、各カテゴリの特徴表現を整列させるために、ロバストな三重項中心のアライメント機構を明示的に適用する。
テキスト・ツー・イメージ、画像・画像・テキスト・ツー・テキストにわたる様々なHDAタスクの実験は、最先端のHDA手法に対するSSANの優位性を検証することに成功した。
論文 参考訳(メタデータ) (2020-08-04T16:20:37Z) - Domain Generalization via Optimal Transport with Metric Similarity
Learning [16.54463315552112]
データやラベルが利用できない未知のドメインに知識を一般化することは、機械学習モデルにとって不可欠である。
我々は、複数のソースドメインから学習し、未知の統計を持つ対象ドメインに一般化するために、ドメインの一般化問題に取り組む。
論文 参考訳(メタデータ) (2020-07-21T02:56:05Z) - Inductive Unsupervised Domain Adaptation for Few-Shot Classification via
Clustering [16.39667909141402]
ショットの分類は、多様なドメインに適応する必要がある場合、苦労する傾向があります。
本稿では、ClusteringによるFew-shot分類のためのドメイン適応性能を改善するためのフレームワークDaFeCを紹介する。
提案手法は, 絶対利得(分類精度)が4.95%, 9.55%, 3.99%, 11.62%であった。
論文 参考訳(メタデータ) (2020-06-23T08:17:48Z) - Fisher Deep Domain Adaptation [41.50519723389471]
ディープドメイン適応モデルは、ラベル付きソースドメインからの知識を活用することにより、ラベル付けされていないターゲットドメインでニューラルネットワークを学習する。
フィッシャー損失は、クラス内コンパクトでクラス間分離可能な識別表現を学習するために提案される。
論文 参考訳(メタデータ) (2020-03-12T06:17:48Z) - Improving Domain-Adapted Sentiment Classification by Deep Adversarial
Mutual Learning [51.742040588834996]
ドメイン適応型感情分類(ドメイン適応型感情分類、Domain-adapted sentiment classification)は、ラベル付きソースドメインでトレーニングを行い、ラベルなしターゲットドメイン上で文書レベルの感情を適切に推測する。
本稿では,2つの特徴抽出器群,ドメイン識別器群,感情分類器群,ラベル探索器群を包含する新たな相互学習手法を提案する。
論文 参考訳(メタデータ) (2020-02-01T01:22:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。