論文の概要: Learning Word Representations for Tunisian Sentiment Analysis
- arxiv url: http://arxiv.org/abs/2010.06857v1
- Date: Wed, 14 Oct 2020 07:47:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 13:19:19.487906
- Title: Learning Word Representations for Tunisian Sentiment Analysis
- Title(参考訳): チュニジア感覚分析のための単語表現の学習
- Authors: Abir Messaoudi and Hatem Haddad and Moez Ben HajHmida and Chayma
Fourati and Abderrazak Ben Hamida
- Abstract要約: ソーシャルメディア上のチュニジア人は、ラテン文字(TUNIZI)を使用して地元の方言で表現する傾向がある
これにより、オンラインの意見を探求し、認識するプロセスに新たな課題が持ち上がる。
本稿では,ソーシャルメディア上で使用されるチュニジア方言の感情分析に注目した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tunisians on social media tend to express themselves in their local dialect
using Latin script (TUNIZI). This raises an additional challenge to the process
of exploring and recognizing online opinions. To date, very little work has
addressed TUNIZI sentiment analysis due to scarce resources for training an
automated system. In this paper, we focus on the Tunisian dialect sentiment
analysis used on social media. Most of the previous work used machine learning
techniques combined with handcrafted features. More recently, Deep Neural
Networks were widely used for this task, especially for the English language.
In this paper, we explore the importance of various unsupervised word
representations (word2vec, BERT) and we investigate the use of Convolutional
Neural Networks and Bidirectional Long Short-Term Memory. Without using any
kind of handcrafted features, our experimental results on two publicly
available datasets showed comparable performances to other languages.
- Abstract(参考訳): ソーシャルメディア上のチュニジア人は、ラテン文字(TUNIZI)を使って地元の方言で表現する傾向がある。
これにより、オンラインの意見を探求し認識するプロセスに新たな課題が生まれます。
これまで、自動システムのトレーニングに必要なリソースが少ないため、TUNIZIの感情分析に対処する作業はほとんど行われていない。
本稿では,ソーシャルメディア上で使用されるチュニジア方言の感情分析に注目した。
以前の作業のほとんどは、機械学習技術と手作りの機能を組み合わせたものだった。
最近では、ディープニューラルネットワークがこのタスク、特に英語で広く使われている。
本稿では,様々な教師なし単語表現(word2vec, BERT)の重要性について検討し,畳み込みニューラルネットワークと双方向長短期記憶の利用について検討する。
手作りの機能を使わずに、2つの公開データセットにおける実験結果は、他の言語と同等のパフォーマンスを示しました。
関連論文リスト
- A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.77214818319054]
自然言語推論は自然言語理解のプロキシである。
ルーマニア語のNLIコーパスは公開されていない。
58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文 参考訳(メタデータ) (2024-05-20T08:41:15Z) - Unravelling Interlanguage Facts via Explainable Machine Learning [10.71581852108984]
我々は、説明可能な機械学習アルゴリズムによって訓練されたNLI分類器の内部に焦点をあてる。
我々は、この視点を用いて、NLIと相補的なタスクの両方に対処し、テキストがネイティブまたは非ネイティブ話者によって書かれたかどうかを推測する。
話者のL1を最も示唆する2つの課題を解くのに最も有効な言語特性について検討する。
論文 参考訳(メタデータ) (2022-08-02T14:05:15Z) - Self-Supervised Speech Representation Learning: A Review [105.1545308184483]
自己教師付き表現学習法は、幅広いタスクやドメインに利益をもたらす単一の普遍的モデルを約束する。
音声表現学習は、生成的、コントラスト的、予測的という3つの主要なカテゴリで同様の進歩を経験している。
本稿では,自己指導型音声表現学習のアプローチと,他の研究領域との関係について述べる。
論文 参考訳(メタデータ) (2022-05-21T16:52:57Z) - Sense representations for Portuguese: experiments with sense embeddings
and deep neural language models [0.0]
教師なしの感覚表現は、その文脈意味をテキストで分析することによって、単語の異なる感覚を誘導することができる。
ポルトガル語への感性埋め込みを創出するための最初の実験について述べる。
論文 参考訳(メタデータ) (2021-08-31T18:07:01Z) - Watch and Learn: Mapping Language and Noisy Real-world Videos with
Self-supervision [54.73758942064708]
我々は、明示的なアノテーションを使わずに、文章と騒々しいビデオスニペットのマッピングを学習することで、視覚と自然言語を理解するように機械に教える。
トレーニングと評価のために、多数のオンラインビデオとサブタイトルを含む新しいデータセットApartmenTourをコントリビュートする。
論文 参考訳(メタデータ) (2020-11-19T03:43:56Z) - Deep Learning for Text Style Transfer: A Survey [71.8870854396927]
テキストスタイル転送は、生成したテキストの特定の属性を制御することを目的として、自然言語生成において重要なタスクである。
2017年の最初のニューラルテキストスタイル転送作業以降,100以上の代表的な記事を対象とした,ニューラルテキストスタイル転送の研究の体系的な調査を行う。
タスクの定式化、既存のデータセットとサブタスク、評価、並列データと非並列データの存在下での豊富な方法論について論じる。
論文 参考訳(メタデータ) (2020-11-01T04:04:43Z) - On the Effects of Using word2vec Representations in Neural Networks for
Dialogue Act Recognition [0.6767885381740952]
文中の単語列をキャプチャする再帰モデルを探索するディープニューラルネットワークを提案する。
このモデルを英語、フランス語、チェコ語という3つの言語で検証する。
論文 参考訳(メタデータ) (2020-10-22T07:21:17Z) - Abstractive Summarization of Spoken and Written Instructions with BERT [66.14755043607776]
本稿では,BERTSumモデルの最初の対話型言語への応用について述べる。
我々は多種多様な話題にまたがるナレーションビデオの抽象要約を生成する。
我々は、これをインテリジェントな仮想アシスタントの機能として統合し、要求に応じて文字と音声の両方の指導内容の要約を可能にすることを想定する。
論文 参考訳(メタデータ) (2020-08-21T20:59:34Z) - AttViz: Online exploration of self-attention for transparent neural
language modeling [7.574392147428978]
本研究では,AttVizを提案する。AttVizは,個々のテキストトークンに関連付けられた自己注意値の探索を行うオンラインツールキットである。
既存のディープラーニングパイプラインが、AttVizに適したアウトプットを生成し、最小限の労力で、アテンションヘッドとアグリゲーションの新たな視覚化を提供する方法を示します。
論文 参考訳(メタデータ) (2020-05-12T12:21:40Z) - Information-Theoretic Probing for Linguistic Structure [74.04862204427944]
本稿では,相互情報を推定するための情報理論による探索運用手法を提案する。
我々は,NLP研究でしばしば不足している10の型的多様言語について評価した。
論文 参考訳(メタデータ) (2020-04-07T01:06:36Z) - Convolutional Neural Networks for Sentiment Analysis in Persian Social
Media [6.51882364384472]
畳み込みニューラルネットワーク(CNN)を用いたペルシア語テキストの感情分析手法を提案する。
本研究では,Curve 測定値を用いた3種類のペルシア語ソーシャルメディアテキストのデータセットの評価を行った。
論文 参考訳(メタデータ) (2020-02-14T19:52:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。