論文の概要: ARAACOM: ARAbic Algerian Corpus for Opinion Mining
- arxiv url: http://arxiv.org/abs/2001.08010v1
- Date: Wed, 22 Jan 2020 13:45:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 18:49:13.797760
- Title: ARAACOM: ARAbic Algerian Corpus for Opinion Mining
- Title(参考訳): ARAACOM:アラビックアルジェリアのコーパス、オピニオン採掘へ
- Authors: Zitouni Abdelhafid (LIRE), Hichem Rahab (ICOSI, LIRE), Abdelhafid
Zitouni (LIRE), Mahieddine Djoudi (TECHN\'E - EA 6316)
- Abstract要約: Webにおけるオピニオンマイニングはますます注目の的になりつつある。
本稿では,アラビア・アルジェリアの新聞における意見マイニングのためのアプローチを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nowadays, it is no more needed to do an enormous effort to distribute a lot
of forms to thousands of people and collect them, then convert this from into
electronic format to track people opinion about some subjects. A lot of web
sites can today reach a large spectrum with less effort. The majority of web
sites suggest to their visitors to leave backups about their feeling of the
site or events. So, this makes for us a lot of data which need powerful mean to
exploit. Opinion mining in the web becomes more and more an attracting task,
due the increasing need for individuals and societies to track the mood of
people against several subjects of daily life (sports, politics,
television,...). A lot of works in opinion mining was developed in western
languages especially English, such works in Arabic language still very scarce.
In this paper, we propose our approach, for opinion mining in Arabic Algerian
news paper. CCS CONCEPTS $\bullet$Information systems~Sentiment analysis
$\bullet$ Computing methodologies~Natural language processing
- Abstract(参考訳): 今日では、何千人もの人々に多くのフォームを配布し、それらを収集し、それを電子フォーマットに変換して、一部の主題についての人々の意見を追跡するために、膨大な努力をする必要はもはやない。
今日では多くのwebサイトが、少ない労力で大きな領域に到達できる。
ウェブサイトの大多数は訪問者に、サイトやイベントに対する気持ちをバックアップしておくよう勧めている。
そのため、強力な活用手段を必要とする多くのデータが必要になります。
ウェブにおける意見のマイニングは、日々の生活(スポーツ、政治、テレビ、...)における人々のムードを追跡する個人や社会の必要性が高まっているため、ますます魅力的なタスクになっている。
意見採鉱の多くの著作は西欧語、特に英語で開発され、アラビア語の著作は非常に少ない。
本稿では,アラビア・アルジェリアの新聞における意見マイニングのためのアプローチを提案する。
ccs の概念 $\bullet$information systems~sentiment analysis $\bullet$ computing methodology~自然言語処理
関連論文リスト
- Arabic Text Sentiment Analysis: Reinforcing Human-Performed Surveys with
Wider Topic Analysis [49.1574468325115]
詳細な研究は、2002年から2020年の間に英語で出版された133のASA論文を手作業で分析する。
主な発見は、機械学習、レキシコンベース、ハイブリッドアプローチといった、ASAで使用されるさまざまなアプローチを示している。
アラビア文字SAについては、業界だけでなく学術分野でも使用できるASAツールを開発する必要がある。
論文 参考訳(メタデータ) (2024-03-04T10:37:48Z) - Utilizing deep learning models for the identification of enhancers and
super-enhancers based on genomic and epigenomic features [0.0]
本稿では,9つの広く認識されている暗号通貨に着目した,英語のつぶやきの膨大なデータセットを広範囲に検証する。
我々の主な目的は、これらの暗号通貨に関連するソーシャルメディアコンテンツの心理言語学的・感情分析を行うことであった。
この研究は、様々なデジタルコインの言語特性を比較し、各コインのコミュニティに現れる独特の言語パターンに光を当てた。
論文 参考訳(メタデータ) (2024-01-15T04:58:50Z) - Hate speech detection in algerian dialect using deep learning [0.0]
オンラインアルジェリアメッセージ上でヘイトスピーチを検出するための完全なアプローチを提案する。
このコーパスにはアラビア語で書かれたアルジェ語方言の13.5K以上の文書が含まれており、憎しみや非憎しみが込められている。
論文 参考訳(メタデータ) (2023-09-20T19:54:48Z) - BERTuit: Understanding Spanish language in Twitter through a native
transformer [70.77033762320572]
bfBERTuitは、これまでスペイン語のために提案された大きなトランスフォーマーで、2億3000万のスペイン語ツイートの膨大なデータセットで事前トレーニングされている。
私たちのモチベーションは、スペイン語のTwitterをよりよく理解し、このソーシャルネットワークにフォーカスしたアプリケーションに利用するための強力なリソースを提供することです。
論文 参考訳(メタデータ) (2022-04-07T14:28:51Z) - bitsa_nlp@LT-EDI-ACL2022: Leveraging Pretrained Language Models for
Detecting Homophobia and Transphobia in Social Media Comments [0.9981479937152642]
ソーシャルメディアコメントにおけるホモフォビアとトランスフォビアを検出するためのLT-EDI共有タスクを提案する。
我々はmBERTのようなモノリンガル・マルチリンガル・トランスフォーマーモデルを用いて実験を行った。
私たちは、タミル語だけでなく、英語でYouTubeコメントの注意深い注釈付き実生活データセット上で、彼らのパフォーマンスを観察します。
論文 参考訳(メタデータ) (2022-03-27T10:15:34Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - Sentiment Classification in Swahili Language Using Multilingual BERT [0.04297070083645048]
本研究は、現在の最新モデルである多言語BERTを用いて、スワヒリデータセットの感情分類を行う。
このデータは、異なるソーシャルメディアプラットフォームとisear emotionデータセットで8.2kのレビューとコメントを抽出、注釈付けすることで作成された。
モデルは微調整され、最高の精度は87.59%に達した。
論文 参考訳(メタデータ) (2021-04-19T01:47:00Z) - hBert + BiasCorp -- Fighting Racism on the Web [58.768804813646334]
これはfox news、breitbartnews、youtubeの3つの特定のソースから139,090のコメントとニュースを含むデータセットです。
本研究では、hBERT を新しい Hopfield Layer を用いて、予め訓練された BERT モデルの特定の層を修正する。
開発者がwebアプリケーションでトレーニングされたモデルを利用できるようにするため、javascriptライブラリとchrome拡張アプリケーションもリリースしています。
論文 参考訳(メタデータ) (2021-04-06T02:17:20Z) - Factorization of Fact-Checks for Low Resource Indian Languages [44.94080515860928]
FactDRILは、インドの地域言語のための最初の大規模多言語ファクトチェックデータセットです。
本データセットは英語9,058サンプル,ヒンディー語5,155サンプルからなり,残りの8,222サンプルは様々な地域言語に分布する。
このデータセットは貴重なリソースであり、低リソース言語での偽ニュースの拡散と戦う出発点となると期待しています。
論文 参考訳(メタデータ) (2021-02-23T16:47:41Z) - Mere account mein kitna balance hai? -- On building voice enabled
Banking Services for Multilingual Communities [47.955173277834795]
我々は,多言語社会のための音声対応型銀行サービスの構築に向けた最初の取り組みについて紹介する。
コードミキシング(Code Mixing)は、ある言語からの語彙項目が別の言語の発話に埋め込まれる現象である。
音声に基づく意図認識システムを構築するための様々な訓練戦略について検討する。
論文 参考訳(メタデータ) (2020-10-09T01:20:09Z) - SANA : Sentiment Analysis on Newspapers comments in Algeria [0.0]
私たちはアルジェリアの新聞のウェブサイトでコメントによる作業に興味を持っています。
SANAとOCAの2つのコーパスが使用された。
分類には、サポートベクトルマシン、ナイーブベイズ(英語版)およびケネレスト隣人(英語版)を採用する。
論文 参考訳(メタデータ) (2020-05-31T08:02:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。