論文の概要: A Cross-Validation Study of Turkish Sentiment Analysis Datasets and Tools
- arxiv url: http://arxiv.org/abs/2412.05964v1
- Date: Sun, 08 Dec 2024 14:59:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-10 14:55:51.338793
- Title: A Cross-Validation Study of Turkish Sentiment Analysis Datasets and Tools
- Title(参考訳): トルコ感覚分析データセットとツールの相互検証研究
- Authors: Şevval Çakıcı, Dilara Karaduman, Mehmet Akif Çırlan, Ali Hürriyetoğlu,
- Abstract要約: この研究は、トルコ語における感情分析のより微妙な理解を促進する。
トルコにおける10年以上にわたるこの分類に基づく感情分析データセットの地図を提供する。
これらのデータセット上で最先端の感情分析ツールを実行し、人気のあるトルコの感情データセットのパフォーマンスを分析しました。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In recent years, sentiment analysis has gained increasing significance, prompting researchers to explore datasets in various languages, including Turkish. However, the limited availability of Turkish datasets has led to their multifaceted usage in different studies, yielding diverse outcomes. To overcome this challenge, a rigorous review was conducted of research articles published between 2012 and 2022. 31 studies were listed, and 23 Turkish datasets obtained from publicly available sources and email requests used in these studies were collected. We labeled these 31 studies using a taxonomy. We provide a map of sentiment analysis datasets according to this taxonomy in Turkish over 10 years. Moreover, we run state-of-the-art sentiment analysis tools on these datasets and analyzed performance across popular Turkish sentiment datasets. We observed that the performance of the sentiment analysis tools significantly depends on the characteristics of the target text. Our study fosters a more nuanced understanding of sentiment analysis in the Turkish language.
- Abstract(参考訳): 近年、感情分析の重要性が高まっており、研究者はトルコ語を含む様々な言語でデータセットを探索している。
しかし、トルコのデータセットの可用性は限られており、様々な研究で多面的な使用法が採用され、様々な結果が得られている。
この課題を克服するため、2012年から2022年にかけて、厳格な研究論文のレビューが行われた。
調査31件をリストアップし,公開資料から得られたトルコのデータセット23件と,これらの研究に使用した電子メール要求を収集した。
分類学を用いてこれらの31つの研究をラベル付けした。
トルコにおける10年以上にわたるこの分類に基づく感情分析データセットの地図を提供する。
さらに、これらのデータセット上で最先端の感情分析ツールを実行し、人気のあるトルコの感情データセットのパフォーマンスを分析します。
その結果,感情分析ツールの性能は対象のテキストの特性に大きく依存していることがわかった。
我々の研究は、トルコ語における感情分析のより微妙な理解を促進する。
関連論文リスト
- Optimizing Research Portfolio For Semantic Impact [55.2480439325792]
サイテーション指標は学術的影響を評価するために広く用いられているが、社会的偏見に悩まされている。
本稿では,研究効果を予測する新しいフレームワークであるrXiv Semantic Impact (XSI)を紹介する。
XSIは学術知識グラフにおける研究概念の進化を追跡している。
論文 参考訳(メタデータ) (2025-02-19T17:44:13Z) - You Shall Know a Tool by the Traces it Leaves: The Predictability of Sentiment Analysis Tools [74.98850427240464]
感情分析ツールが同じデータセットで一致しないことを示す。
感傷的アノテーションに使用される感情ツールは,その結果から予測できることを示す。
論文 参考訳(メタデータ) (2024-10-18T17:27:38Z) - Open the Data! Chuvash Datasets [50.59120569845975]
Chuvash言語用の包括的データセットを4つ紹介する。
これらのデータセットには、モノリンガルデータセット、ロシア語による並列データセット、英語による並列データセット、オーディオデータセットが含まれる。
論文 参考訳(メタデータ) (2024-05-31T07:51:19Z) - Cross-Lingual Learning vs. Low-Resource Fine-Tuning: A Case Study with Fact-Checking in Turkish [0.9217021281095907]
実世界で3238件のクレームからなるFCTRデータセットを紹介した。
このデータセットは複数のドメインにまたがり、3つのトルコのファクトチェック組織から収集された証拠が組み込まれている。
論文 参考訳(メタデータ) (2024-03-01T09:57:46Z) - Text2Analysis: A Benchmark of Table Question Answering with Advanced
Data Analysis and Unclear Queries [67.0083902913112]
高度な解析タスクを取り入れたText2Analysisベンチマークを開発した。
また,5つのイノベーティブかつ効果的なアノテーション手法を開発した。
3つの異なる指標を用いて5つの最先端モデルを評価する。
論文 参考訳(メタデータ) (2023-12-21T08:50:41Z) - Toxic language detection: a systematic review of Arabic datasets [5.945303394300328]
本稿では,オンライン有害言語に着目したアラビア語データセットの包括的調査を行う。
利用可能な54のデータセットとその対応論文を体系的に収集した。
研究コミュニティの利便性のために、分析データセットのリストはGitHubリポジトリに保持されている。
論文 参考訳(メタデータ) (2023-12-12T12:43:01Z) - Robust Sentiment Analysis for Low Resource languages Using Data
Augmentation Approaches: A Case Study in Marathi [0.9553673944187253]
感情分析は、テキストデータに表される感情を理解する上で重要な役割を果たす。
低リソース言語における感情分析の研究努力には大きなギャップがある。
本稿では,低リソースのIndic言語であるMarathiに対するデータ拡張アプローチについて概説する。
論文 参考訳(メタデータ) (2023-10-01T17:09:31Z) - Sentiment Analysis of Persian Language: Review of Algorithms, Approaches
and Datasets [0.0]
感情分析を解くのに使われるほとんどの方法は、機械学習とディープラーニングである。
LSTMやBi-LSTMのようなBERTとRNNニューラルネットワークは感情分析において高い精度を実現している。
論文 参考訳(メタデータ) (2022-11-09T13:08:46Z) - A Dataset and BERT-based Models for Targeted Sentiment Analysis on
Turkish Texts [0.0]
対象感情分析に適した注釈付きトルコ語データセットを提案する。
目標感情分析の課題を達成するために,異なるアーキテクチャのBERTモデルを提案する。
論文 参考訳(メタデータ) (2022-05-09T10:57:39Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Sentiment Analysis Based on Deep Learning: A Comparative Study [69.09570726777817]
世論の研究は我々に貴重な情報を提供することができる。
感情分析の効率性と正確性は、自然言語処理で直面する課題によって妨げられている。
本稿では、感情分析の問題を解決するためにディープラーニングを用いた最新の研究をレビューする。
論文 参考訳(メタデータ) (2020-06-05T16:28:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。