論文の概要: Current Landscape of the Russian Sentiment Corpora
- arxiv url: http://arxiv.org/abs/2106.14434v1
- Date: Mon, 28 Jun 2021 07:36:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 18:11:48.209290
- Title: Current Landscape of the Russian Sentiment Corpora
- Title(参考訳): ロシア感情コーポラの現在の景観
- Authors: Evgeny Kotelnikov
- Abstract要約: 深層ニューラルネットワークモデルBERTを用いて、トレーニングデータセットが感情分析のパフォーマンスに与える影響について検討した。
BERTモデルに基づくROMIPセミナーのレビューのコーパスに対して,初めて品質スコアが得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Currently, there are more than a dozen Russian-language corpora for sentiment
analysis, differing in the source of the texts, domain, size, number and ratio
of sentiment classes, and annotation method. This work examines publicly
available Russian-language corpora, presents their qualitative and quantitative
characteristics, which make it possible to get an idea of the current landscape
of the corpora for sentiment analysis. The ranking of corpora by annotation
quality is proposed, which can be useful when choosing corpora for training and
testing. The influence of the training dataset on the performance of sentiment
analysis is investigated based on the use of the deep neural network model
BERT. The experiments with review corpora allow us to conclude that on average
the quality of models increases with an increase in the number of training
corpora. For the first time, quality scores were obtained for the corpus of
reviews of ROMIP seminars based on the BERT model. Also, the study proposes the
task of the building a universal model for sentiment analysis.
- Abstract(参考訳): 現在、感情分析のためのロシア語コーパスが1ダース以上あり、テキストのソース、ドメイン、サイズ、感情クラスの数と比率、アノテーションメソッドが異なる。
本研究は, 公開されているロシア語コーパスを調査し, 質的かつ定量的な特徴を提示し, 感情分析のためのコーパスの現在の景観の把握を可能にする。
アノテーション品質によるコーパスのランキングが提案され、トレーニングとテストのためのコーパスを選択する際に有用である。
深層ニューラルネットワークモデルBERTを用いて、トレーニングデータセットが感情分析のパフォーマンスに与える影響について検討した。
レビューコーパスを用いた実験により、トレーニングコーパス数の増加に伴い、平均的なモデル品質が増加すると結論付けることができる。
BERTモデルに基づくROMIPセミナーのレビューのコーパスに対して,初めて品質スコアが得られた。
また,感情分析のための普遍モデルを構築するタスクを提案する。
関連論文リスト
- Performance evaluation of Reddit Comments using Machine Learning and Natural Language Processing methods in Sentiment Analysis [0.764671395172401]
我々は、Reddit上で58,000のコメントを寄せ集め、感情分析手法を評価した。
我々の研究は、様々なモデルの配列を評価することによって、範囲を広げる。
以上の結果から,RoBERTaモデルはベースラインモデルよりも一貫して優れていることがわかった。
論文 参考訳(メタデータ) (2024-05-27T03:59:28Z) - Exploring Precision and Recall to assess the quality and diversity of LLMs [82.21278402856079]
我々はtextscLlama-2 や textscMistral のような大規模言語モデル (LLM) のための新しい評価フレームワークを提案する。
このアプローチにより、コーパスの整合を必要とせず、生成したテキストの品質と多様性を微妙に評価できる。
論文 参考訳(メタデータ) (2024-02-16T13:53:26Z) - Disco-Bench: A Discourse-Aware Evaluation Benchmark for Language
Modelling [70.23876429382969]
本研究では,多種多様なNLPタスクに対して,文内談話特性を評価できるベンチマークを提案する。
ディスコ・ベンチは文学領域における9つの文書レベルのテストセットから構成されており、豊富な談話現象を含んでいる。
また,言語分析のために,対象モデルが談話知識を学習するかどうかを検証できる診断テストスイートを設計する。
論文 参考訳(メタデータ) (2023-07-16T15:18:25Z) - Multi-Dimensional Evaluation of Text Summarization with In-Context
Learning [79.02280189976562]
本稿では,テキスト内学習を用いた多次元評価器として,大規模言語モデルの有効性について検討する。
実験の結果,テキスト要約作業において,文脈内学習に基づく評価手法が学習評価フレームワークと競合していることが判明した。
次に、テキスト内サンプルの選択や数などの要因がパフォーマンスに与える影響を分析する。
論文 参考訳(メタデータ) (2023-06-01T23:27:49Z) - FRMT: A Benchmark for Few-Shot Region-Aware Machine Translation [64.9546787488337]
本稿では、Few-shot Region-aware Machine Translationのための新しいデータセットと評価ベンチマークFRMTを提案する。
このデータセットは、英語からポルトガル語と中国語の2つの地域変種へのプロの翻訳で構成されている。
論文 参考訳(メタデータ) (2022-10-01T05:02:04Z) - Aspect-Based Sentiment Analysis using Local Context Focus Mechanism with
DeBERTa [23.00810941211685]
Aspect-Based Sentiment Analysis (ABSA)は、感情分析の分野におけるきめ細かいタスクである。
アスペクトベース感性分析問題を解決するための最近のDeBERTaモデル
論文 参考訳(メタデータ) (2022-07-06T03:50:31Z) - Uzbek Sentiment Analysis based on local Restaurant Reviews [0.0]
本稿では,ウズベキスタン語に対する感情分析データセットとして,レストランレビューデータを収集する作業について述べる。
本論文は,データの収集方法,品質最適化のための事前処理方法,評価プロセスの実験的な設定について,詳細な情報を含む。
論文 参考訳(メタデータ) (2022-05-31T16:21:00Z) - A Dataset and BERT-based Models for Targeted Sentiment Analysis on
Turkish Texts [0.0]
対象感情分析に適した注釈付きトルコ語データセットを提案する。
目標感情分析の課題を達成するために,異なるアーキテクチャのBERTモデルを提案する。
論文 参考訳(メタデータ) (2022-05-09T10:57:39Z) - Survey of Aspect-based Sentiment Analysis Datasets [55.61047894397937]
アスペクトベースの感情分析(ABSA)は、ユーザ生成レビューの分析を必要とする自然言語処理の問題である。
ABSAの多くの散在したコーパスは、研究者が特定のABSAサブタスクに適したコーパスを素早く特定することを困難にしている。
本研究では,自律型ABSAシステムの学習・評価に使用できるコーパスデータベースを提案する。
論文 参考訳(メタデータ) (2022-04-11T16:23:36Z) - Sentiment Analysis on Brazilian Portuguese User Reviews [0.0]
本研究は,システム結果の極性を仮定して,文書埋め込み戦略の予測性能を解析する。
この分析には、単一のデータセットに統合されたブラジルの5つの感情分析データセットと、トレーニング、テスト、バリデーションセットの参照パーティショニングが含まれている。
論文 参考訳(メタデータ) (2021-12-10T11:18:26Z) - An analysis of full-size Russian complexly NER labelled corpus of
Internet user reviews on the drugs based on deep learning and language neural
nets [94.37521840642141]
我々は、インターネットユーザーレビューのフルサイズのロシアの複雑なNERラベルコーパスを提示します。
高度なディープラーニングニューラルネットワークセットは、ロシアのテキストから薬理学的に有意義な実体を抽出するために使用される。
論文 参考訳(メタデータ) (2021-04-30T19:46:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。