論文の概要: Multi-Label Sentiment Analysis on 100 Languages with Dynamic Weighting
for Label Imbalance
- arxiv url: http://arxiv.org/abs/2008.11573v1
- Date: Wed, 26 Aug 2020 14:16:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 20:45:06.499073
- Title: Multi-Label Sentiment Analysis on 100 Languages with Dynamic Weighting
for Label Imbalance
- Title(参考訳): ラベル不均衡のための動的重み付き100言語におけるマルチラベル感性解析
- Authors: Selim F. Yilmaz, E. Batuhan Kaynak, Aykut Ko\c{c}, Hamdi
Dibeklio\u{g}lu and Suleyman S. Kozat
- Abstract要約: 言語間感情分析は、市場研究、政治、社会科学など様々な分野に応用されているため、大きな注目を集めている。
Plutchikの感情の輪に従えば、マルチラベル設定で感情分析フレームワークを導入する。
提案手法は,3つの異なる言語において,9つの指標のうち7つで最先端の性能が得られることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate cross-lingual sentiment analysis, which has attracted
significant attention due to its applications in various areas including market
research, politics and social sciences. In particular, we introduce a sentiment
analysis framework in multi-label setting as it obeys Plutchik wheel of
emotions. We introduce a novel dynamic weighting method that balances the
contribution from each class during training, unlike previous static weighting
methods that assign non-changing weights based on their class frequency.
Moreover, we adapt the focal loss that favors harder instances from
single-label object recognition literature to our multi-label setting.
Furthermore, we derive a method to choose optimal class-specific thresholds
that maximize the macro-f1 score in linear time complexity. Through an
extensive set of experiments, we show that our method obtains the
state-of-the-art performance in 7 of 9 metrics in 3 different languages using a
single model compared to the common baselines and the best-performing methods
in the SemEval competition. We publicly share our code for our model, which can
perform sentiment analysis in 100 languages, to facilitate further research.
- Abstract(参考訳): 本研究では,市場研究,政治学,社会科学など様々な分野に応用されている言語間感情分析について検討する。
特に,plutchikの感情の車輪に従うマルチラベル設定における感情分析フレームワークを導入する。
従来の静的重み付け法とは異なり,授業中の各クラスからの貢献のバランスをとる新しい動的重み付け法を提案する。
さらに,単一ラベルの物体認識文献から複数のラベル設定への難易度を優先する焦点損失を適応させた。
さらに、線形時間複雑性においてマクロf1スコアを最大化する最適なクラス固有しきい値を選択する方法を提案する。
提案手法は,1つのモデルを用いて3つの異なる言語における9つの指標のうち7つの指標において,共通ベースラインと1つのセメバルコンペティションにおける最良法と比較して,最先端のパフォーマンスが得られることを示す。
私たちは、100の言語で感情分析ができる私たちのモデルのコードを公に公開し、さらなる研究を支援しています。
関連論文リスト
- LC-Protonets: Multi-label Few-shot learning for world music audio tagging [65.72891334156706]
ラベル結合型プロトタイプネットワーク(LC-Protonets)を導入し,複数ラベルの複数ショット分類の問題に対処する。
LC-Protonetsは、限られたトレーニング項目に存在するラベルのパワーセットから、ラベルの組み合わせごとに1つのプロトタイプを生成する。
本手法は,様々な文化をカバーし,現代音楽と伝統音楽の両方を含む,多様な音楽データセットにまたがる自動音声タグ付けに適用する。
論文 参考訳(メタデータ) (2024-09-17T15:13:07Z) - Active Learning Principles for In-Context Learning with Large Language
Models [65.09970281795769]
本稿では,アクティブ・ラーニング・アルゴリズムが,文脈内学習における効果的な実演選択手法としてどのように機能するかを検討する。
ALによる文脈内サンプル選択は,不確実性の低い高品質な事例を優先し,試験例と類似性を有することを示す。
論文 参考訳(メタデータ) (2023-05-23T17:16:04Z) - AX-MABSA: A Framework for Extremely Weakly Supervised Multi-label Aspect
Based Sentiment Analysis [8.067010122141985]
極めて弱い教師付き多言語Aspect Category Sentiment Analysis フレームワークを提案する。
最初の指示情報として、クラスごとに1つの単語しか依存していません。
本稿では、これらのシードカテゴリと感情語を選択するための自動単語選択手法を提案する。
論文 参考訳(メタデータ) (2022-11-07T19:44:42Z) - Sentiment Classification of Code-Switched Text using Pre-trained
Multilingual Embeddings and Segmentation [1.290382979353427]
コード切替型感情分析のための多段階自然言語処理アルゴリズムを提案する。
提案アルゴリズムは、人間の専門知識に制限のある複数の言語の感情分析のために拡張することができる。
論文 参考訳(メタデータ) (2022-10-29T01:52:25Z) - PercentMatch: Percentile-based Dynamic Thresholding for Multi-Label
Semi-Supervised Classification [64.39761523935613]
トレーニング中の各クラスに対する正と負の擬似ラベルのスコア閾値を動的に変更するためのパーセンタイルベースのしきい値調整手法を提案する。
近年のSSL方式と比較して, Pascal VOC2007 と MS-COCO のデータセットの性能は高い。
論文 参考訳(メタデータ) (2022-08-30T01:27:48Z) - MetaAudio: A Few-Shot Audio Classification Benchmark [2.294014185517203]
この研究は、画像ベースのベンチマークへの依存を軽減することを目的として、初めて包括的で公開され、完全に再現可能なオーディオベースの代替手段を提供する。
7つの音声データセットにおいて,様々な手法の複数ショットの分類性能を比較した。
実験では,MAMLやMeta-Curvatureのような勾配に基づくメタ学習法が,測定法とベースライン法の両方で一貫して優れていた。
論文 参考訳(メタデータ) (2022-04-05T11:33:44Z) - Uncertainty-Aware Balancing for Multilingual and Multi-Domain Neural
Machine Translation Training [58.72619374790418]
MultiUATはモデルの不確実性に基づいてトレーニングデータの使用量を動的に調整する。
クロスドメイン転送を解析し、静的および類似性に基づく手法の欠如を示す。
論文 参考訳(メタデータ) (2021-09-06T08:30:33Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - A Sample Selection Approach for Universal Domain Adaptation [94.80212602202518]
普遍シナリオにおける教師なし領域適応の問題について検討する。
ソースドメインとターゲットドメインの間で共有されるクラスは、一部のみである。
共有クラスのサンプルの同定に有効なスコアリング方式を提案する。
論文 参考訳(メタデータ) (2020-01-14T22:28:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。