論文の概要: Sentiment Analysis for Roman Urdu Text over Social Media, a Comparative
Study
- arxiv url: http://arxiv.org/abs/2010.16408v1
- Date: Mon, 5 Oct 2020 16:19:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 21:51:18.200038
- Title: Sentiment Analysis for Roman Urdu Text over Social Media, a Comparative
Study
- Title(参考訳): ソーシャルメディアを用いたローマ語ウルドゥー語テキストの感性分析 : 比較研究
- Authors: Irfan Qutab, Khawar Iqbal Malik, Hira Arooj
- Abstract要約: ローマ・ウルドゥー語は、パキスタンとインドのソーシャルネットワークにおいて最も支配的な言語である。
本稿では,ロマン・ウルドゥ語文の感情を調べるために用いられた先行概念と戦略について述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In present century, data volume is increasing enormously. The data could be
in form for image, text, voice, and video. One factor in this huge growth of
data is usage of social media where everyone is posting data on daily basis
during chatting, exchanging information, and uploading their personal and
official credential. Research of sentiments seeks to uncover abstract knowledge
in Published texts in which users communicate their emotions and thoughts about
shared content, including blogs, news and social networks. Roman Urdu is the
one of most dominant language on social networks in Pakistan and India. Roman
Urdu is among the varieties of the world's third largest Urdu language but yet
not sufficient work has been done in this language. In this article we
addressed the prior concepts and strategies used to examine the sentiment of
the roman Urdu text and reported their results as well.
- Abstract(参考訳): 現在、データ量は大幅に増加している。
データは画像、テキスト、音声、ビデオの形式になるかもしれない。
この膨大なデータ増加の要因の1つは、誰もがチャット、情報交換、個人的および公式の資格情報のアップロード中に毎日データを投稿するソーシャルメディアの利用である。
感情の研究は、ユーザーがブログ、ニュース、ソーシャルネットワークなど、共有コンテンツに関する感情や考えを伝える出版テキストの抽象的な知識を明らかにすることを目的としている。
ローマ・ウルドゥ語はパキスタンとインドのソーシャルネットワークでもっとも支配的な言語の一つである。
ローマ・ウルドゥー語は世界で3番目に大きいウルドゥー語の変種であるが、この言語では十分な作業がなされていない。
本稿では,ロマン・ウルドゥの文章の感情を調べるために用いられた先行概念と戦略について考察し,その結果を報告する。
関連論文リスト
- From Statistical Methods to Pre-Trained Models; A Survey on Automatic Speech Recognition for Resource Scarce Urdu Language [41.272055304311905]
本稿では,東南アジア諸国で広く話されている資源制約のあるウルドゥー語について述べる。
ウルドゥーASRにおける将来の研究の現在の研究動向、技術進歩、および潜在的方向性について概説する。
論文 参考訳(メタデータ) (2024-11-20T17:39:56Z) - Reddit is all you need: Authorship profiling for Romanian [49.1574468325115]
著者プロファイリング(英: Authorship profiling)とは、著者の著作に基づいて著者の特徴を特定する過程である。
本稿では,ルーマニア語における短いテキストのコーパスについて紹介する。
論文 参考訳(メタデータ) (2024-10-13T16:27:31Z) - Dataset and Benchmark for Urdu Natural Scenes Text Detection, Recognition and Visual Question Answering [50.52792174648067]
このイニシアチブは、テキストと視覚的理解のギャップを埋めようとしている。
そこで本研究では,1000以上の自然シーン画像からなるマルチタスクUrduシーンテキストデータセットを提案する。
テキストインスタンスの細かいアノテーションを提供し、以前のデータセットの制限に対処します。
論文 参考訳(メタデータ) (2024-05-21T06:48:26Z) - Urdu Speech and Text Based Sentiment Analyzer [1.4630964945453113]
本研究は,ユーザ評価に基づく新しいマルチクラスUrduデータセットを提案する。
提案したデータセットには1万のレビューが含まれており、人間の専門家によって慎重に2つのカテゴリに分類されている。
Naivebayes、Stanza、Textblob、Vader、Frairを含む5種類のレキシコンおよびルールベースのアルゴリズムが採用され、実験の結果、Flairが70%の精度で他のテストアルゴリズムより優れていることが示された。
論文 参考訳(メタデータ) (2022-07-19T10:11:22Z) - A Survey on sentiment analysis in Persian: A Comprehensive System
Perspective Covering Challenges and Advances in Resources, and Methods [0.0]
本論文の主な目標は、ペルシャ感情分析における最先端の進歩に関する包括的な文献調査を提供することである。
ペルシャ語テキストの感情分析手法に関する詳細な調査を行い、ペルシア語に関する以前の関連研究について論じる。
英語感情分析の最先端の発展によれば、ペルシャ語のテキストでは対処されていない問題や課題がリストアップされている。
論文 参考訳(メタデータ) (2021-04-30T04:31:21Z) - Factorization of Fact-Checks for Low Resource Indian Languages [44.94080515860928]
FactDRILは、インドの地域言語のための最初の大規模多言語ファクトチェックデータセットです。
本データセットは英語9,058サンプル,ヒンディー語5,155サンプルからなり,残りの8,222サンプルは様々な地域言語に分布する。
このデータセットは貴重なリソースであり、低リソース言語での偽ニュースの拡散と戦う出発点となると期待しています。
論文 参考訳(メタデータ) (2021-02-23T16:47:41Z) - BOLD: Dataset and Metrics for Measuring Biases in Open-Ended Language
Generation [42.34923623457615]
Open-Ended Language Generationデータセットのバイアスは23,679の英語テキスト生成プロンプトで構成されている。
3つの人気のある言語モデルから生成されたテキストを調べると、これらのモデルの大半は、人によるウィキペディアのテキストよりも大きな社会的バイアスを示すことが明らかになっている。
論文 参考訳(メタデータ) (2021-01-27T22:07:03Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z) - PoliWAM: An Exploration of a Large Scale Corpus of Political Discussions
on WhatsApp Messenger [1.2301855531996841]
WhatsApp Messengerは、現在180か国、20億人以上で情報を広める最も人気のあるチャンネルの1つだ。
近年、いくつかの国が政治的・社会的キャンペーンにおいてその効果と影響力を目撃している。
我々は選挙運動中に情報とプロパガンダの流れが急増しているのを観察する。
論文 参考訳(メタデータ) (2020-10-26T00:35:57Z) - Characterising User Content on a Multi-lingual Social Network [9.13241181020543]
インドにおけるShareChatと呼ばれる多言語ソーシャルネットワークの特性について紹介する。
私たちは、2019年のインド総選挙の前と14の言語で72週間にわたって、網羅的なデータセットを収集しました。
テルグ語、マラヤラム語、タミル語、カナダ語は政治的イメージの誘惑に支配的であることが判明した。
論文 参考訳(メタデータ) (2020-04-23T22:25:48Z) - ParsEL 1.0: Unsupervised Entity Linking in Persian Social Media Texts [6.866104126509981]
ソーシャルメディアデータの大部分は自然言語テキストである。
最近、ペルシャの知識グラフであるFarsBaseが50万近いエンティティを含む形で導入された。
本稿では,教師なしペルシャのエンティティリンクシステムを提案する。
論文 参考訳(メタデータ) (2020-04-22T19:34:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。