論文の概要: ARAACOM: ARAbic Algerian Corpus for Opinion Mining
- arxiv url: http://arxiv.org/abs/2001.08010v1
- Date: Wed, 22 Jan 2020 13:45:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 18:49:13.797760
- Title: ARAACOM: ARAbic Algerian Corpus for Opinion Mining
- Title(参考訳): ARAACOM:アラビックアルジェリアのコーパス、オピニオン採掘へ
- Authors: Zitouni Abdelhafid (LIRE), Hichem Rahab (ICOSI, LIRE), Abdelhafid
Zitouni (LIRE), Mahieddine Djoudi (TECHN\'E - EA 6316)
- Abstract要約: Webにおけるオピニオンマイニングはますます注目の的になりつつある。
本稿では,アラビア・アルジェリアの新聞における意見マイニングのためのアプローチを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nowadays, it is no more needed to do an enormous effort to distribute a lot
of forms to thousands of people and collect them, then convert this from into
electronic format to track people opinion about some subjects. A lot of web
sites can today reach a large spectrum with less effort. The majority of web
sites suggest to their visitors to leave backups about their feeling of the
site or events. So, this makes for us a lot of data which need powerful mean to
exploit. Opinion mining in the web becomes more and more an attracting task,
due the increasing need for individuals and societies to track the mood of
people against several subjects of daily life (sports, politics,
television,...). A lot of works in opinion mining was developed in western
languages especially English, such works in Arabic language still very scarce.
In this paper, we propose our approach, for opinion mining in Arabic Algerian
news paper. CCS CONCEPTS $\bullet$Information systems~Sentiment analysis
$\bullet$ Computing methodologies~Natural language processing
- Abstract(参考訳): 今日では、何千人もの人々に多くのフォームを配布し、それらを収集し、それを電子フォーマットに変換して、一部の主題についての人々の意見を追跡するために、膨大な努力をする必要はもはやない。
今日では多くのwebサイトが、少ない労力で大きな領域に到達できる。
ウェブサイトの大多数は訪問者に、サイトやイベントに対する気持ちをバックアップしておくよう勧めている。
そのため、強力な活用手段を必要とする多くのデータが必要になります。
ウェブにおける意見のマイニングは、日々の生活(スポーツ、政治、テレビ、...)における人々のムードを追跡する個人や社会の必要性が高まっているため、ますます魅力的なタスクになっている。
意見採鉱の多くの著作は西欧語、特に英語で開発され、アラビア語の著作は非常に少ない。
本稿では,アラビア・アルジェリアの新聞における意見マイニングのためのアプローチを提案する。
ccs の概念 $\bullet$information systems~sentiment analysis $\bullet$ computing methodology~自然言語処理
関連論文リスト
- Sentiment Analysis in Twitter Social Network Centered on Cryptocurrencies Using Machine Learning [1.9336815376402718]
本稿では,Twitter上での暗号通貨に関するイラン人の意見を考察する。
感情に基づいてツイートを分類する最良のモデルを提供する。
論文 参考訳(メタデータ) (2025-01-16T16:15:52Z) - Data Enrichment Work and AI Labor in Latin America and the Caribbean [48.06503696906059]
我々はラテンアメリカとカリブ海の16カ国で100人のクラウドワーカーを対象に調査を行った。
これらの労働者は、彼らの家族から強い支持と賞賛を受けながら、彼らのデジタル労働に対する誇りと敬意を示していた。
群衆の仕事は、財政と職業の独立への足掛かりとも見なされた。
論文 参考訳(メタデータ) (2025-01-13T00:11:47Z) - ArMeme: Propagandistic Content in Arabic Memes [9.48177009736915]
我々は,プロパガンダ的コンテンツの手動アノテーションを用いたアラビア・ミーム・データセットを開発した。
我々は,その検出のための計算ツールの開発を目的とした包括的解析を行う。
論文 参考訳(メタデータ) (2024-06-06T09:56:49Z) - Utilizing deep learning models for the identification of enhancers and
super-enhancers based on genomic and epigenomic features [0.0]
本稿では,9つの広く認識されている暗号通貨に着目した,英語のつぶやきの膨大なデータセットを広範囲に検証する。
我々の主な目的は、これらの暗号通貨に関連するソーシャルメディアコンテンツの心理言語学的・感情分析を行うことであった。
この研究は、様々なデジタルコインの言語特性を比較し、各コインのコミュニティに現れる独特の言語パターンに光を当てた。
論文 参考訳(メタデータ) (2024-01-15T04:58:50Z) - BERTuit: Understanding Spanish language in Twitter through a native
transformer [70.77033762320572]
bfBERTuitは、これまでスペイン語のために提案された大きなトランスフォーマーで、2億3000万のスペイン語ツイートの膨大なデータセットで事前トレーニングされている。
私たちのモチベーションは、スペイン語のTwitterをよりよく理解し、このソーシャルネットワークにフォーカスしたアプリケーションに利用するための強力なリソースを提供することです。
論文 参考訳(メタデータ) (2022-04-07T14:28:51Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - Sentiment Classification in Swahili Language Using Multilingual BERT [0.04297070083645048]
本研究は、現在の最新モデルである多言語BERTを用いて、スワヒリデータセットの感情分類を行う。
このデータは、異なるソーシャルメディアプラットフォームとisear emotionデータセットで8.2kのレビューとコメントを抽出、注釈付けすることで作成された。
モデルは微調整され、最高の精度は87.59%に達した。
論文 参考訳(メタデータ) (2021-04-19T01:47:00Z) - hBert + BiasCorp -- Fighting Racism on the Web [58.768804813646334]
これはfox news、breitbartnews、youtubeの3つの特定のソースから139,090のコメントとニュースを含むデータセットです。
本研究では、hBERT を新しい Hopfield Layer を用いて、予め訓練された BERT モデルの特定の層を修正する。
開発者がwebアプリケーションでトレーニングされたモデルを利用できるようにするため、javascriptライブラリとchrome拡張アプリケーションもリリースしています。
論文 参考訳(メタデータ) (2021-04-06T02:17:20Z) - Factorization of Fact-Checks for Low Resource Indian Languages [44.94080515860928]
FactDRILは、インドの地域言語のための最初の大規模多言語ファクトチェックデータセットです。
本データセットは英語9,058サンプル,ヒンディー語5,155サンプルからなり,残りの8,222サンプルは様々な地域言語に分布する。
このデータセットは貴重なリソースであり、低リソース言語での偽ニュースの拡散と戦う出発点となると期待しています。
論文 参考訳(メタデータ) (2021-02-23T16:47:41Z) - Mere account mein kitna balance hai? -- On building voice enabled
Banking Services for Multilingual Communities [47.955173277834795]
我々は,多言語社会のための音声対応型銀行サービスの構築に向けた最初の取り組みについて紹介する。
コードミキシング(Code Mixing)は、ある言語からの語彙項目が別の言語の発話に埋め込まれる現象である。
音声に基づく意図認識システムを構築するための様々な訓練戦略について検討する。
論文 参考訳(メタデータ) (2020-10-09T01:20:09Z) - SANA : Sentiment Analysis on Newspapers comments in Algeria [0.0]
私たちはアルジェリアの新聞のウェブサイトでコメントによる作業に興味を持っています。
SANAとOCAの2つのコーパスが使用された。
分類には、サポートベクトルマシン、ナイーブベイズ(英語版)およびケネレスト隣人(英語版)を採用する。
論文 参考訳(メタデータ) (2020-05-31T08:02:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。