論文の概要: Hindi/Bengali Sentiment Analysis Using Transfer Learning and Joint Dual
Input Learning with Self Attention
- arxiv url: http://arxiv.org/abs/2202.05457v1
- Date: Fri, 11 Feb 2022 05:36:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-15 05:38:28.331609
- Title: Hindi/Bengali Sentiment Analysis Using Transfer Learning and Joint Dual
Input Learning with Self Attention
- Title(参考訳): 移動学習と自己注意を伴う二重入力学習を用いたヒンディー・ベンガル感覚分析
- Authors: Shahrukh Khan and Mahnoor Shahid
- Abstract要約: 我々の研究は、深層ニューラルネットワークをトランスファーラーニングや統合二重入力学習設定で効果的に活用し、感情を効果的に分類し、ヒンディー語とベンガル語のヘイトスピーチを検出する方法について検討している。
統合二重入力学習環境では自己注意のBiLSTMを使用し、ヒンディー語とベンガル語のデータセット上に1つのニューラルネットワークを同時に、それぞれの埋め込みを用いてトレーニングする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sentiment Analysis typically refers to using natural language processing,
text analysis and computational linguistics to extract affect and emotion based
information from text data. Our work explores how we can effectively use deep
neural networks in transfer learning and joint dual input learning settings to
effectively classify sentiments and detect hate speech in Hindi and Bengali
data. We start by training Word2Vec word embeddings for Hindi \textbf{HASOC
dataset} and Bengali hate speech and then train LSTM and subsequently, employ
parameter sharing based transfer learning to Bengali sentiment classifiers by
reusing and fine-tuning the trained weights of Hindi classifiers with both
classifier being used as baseline in our study. Finally, we use BiLSTM with
self attention in joint dual input learning setting where we train a single
neural network on Hindi and Bengali dataset simultaneously using their
respective embeddings.
- Abstract(参考訳): 感性分析は、通常、自然言語処理、テキスト分析、および計算言語学を用いて、テキストデータから感情と感情に基づく情報を抽出する。
我々の研究は、ヒンディー語とベンガル語のデータにおいて、感情を効果的に分類しヘイトスピーチを検出するために、深層ニューラルネットワークを転送学習と共同入力学習設定に効果的に利用する方法について研究している。
まず、Hindi \textbf{HASOC dataset} と Bengali hate speech の Word2Vec 単語埋め込みを訓練し、LSTM を訓練し、その後、パラメータ共有に基づく変換学習をベンガル感情分類器に適用し、ヒンディー語分類器の訓練された重みを再利用・微調整し、両分類器をベースラインとして用いた。
最後に、bindiとbengaliデータセット上で、それぞれの組込みを使用して単一のニューラルネットワークを同時にトレーニングする、2つの入力学習設定で、自己注意でbilstmを使用する。
関連論文リスト
- Multichannel Attention Networks with Ensembled Transfer Learning to Recognize Bangla Handwritten Charecter [1.5236380958983642]
この研究では、アンサンブルトランスファーラーニングとマルチチャネルアテンションネットワークを備えた畳み込みニューラルネットワーク(CNN)を用いた。
我々は、CAMTERdb 3.1.2データセットを用いて提案モデルを評価し、生データセットの92%、前処理データセットの98.00%の精度を達成した。
論文 参考訳(メタデータ) (2024-08-20T15:51:01Z) - A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.77214818319054]
自然言語推論は自然言語理解のプロキシである。
ルーマニア語のNLIコーパスは公開されていない。
58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文 参考訳(メタデータ) (2024-05-20T08:41:15Z) - Share What You Already Know: Cross-Language-Script Transfer and
Alignment for Sentiment Detection in Code-Mixed Data [0.0]
コードスイッチングには複数の言語が混在しており、ソーシャルメディアのテキストでますます発生してきている現象である。
事前訓練された多言語モデルは、主に言語のネイティブスクリプトのデータを利用する。
各言語でネイティブスクリプトを使用すると、事前訓練された知識のため、テキストのより良い表現が生成される。
論文 参考訳(メタデータ) (2024-02-07T02:59:18Z) - An exploratory experiment on Hindi, Bengali hate-speech detection and
transfer learning using neural networks [0.0]
本研究では,ヒンディー語とベンガル語におけるヘイトスピーチテキストを検出するニューラルネットワークのトレーニング手法を提案する。
また、これらの言語が同じ起源を持つため、いくつかの拡張に類似していることから、トランスファーラーニングがこれらの言語学習にどのように適用できるかについても検討する。
論文 参考訳(メタデータ) (2022-01-06T10:13:28Z) - Utilizing Wordnets for Cognate Detection among Indian Languages [50.83320088758705]
ヒンディー語と10のインド諸語間の単語対を検出する。
深層学習手法を用いて単語対が共生か否かを予測する。
性能は最大26%向上した。
論文 参考訳(メタデータ) (2021-12-30T16:46:28Z) - Harnessing Cross-lingual Features to Improve Cognate Detection for
Low-resource Languages [50.82410844837726]
言語間単語埋め込みを用いた14言語間のコニャートの検出を実証する。
インドの12言語からなる挑戦的データセットを用いて,コニャート検出手法の評価を行った。
我々は,コグネート検出のためのFスコアで最大18%の改善点を観察した。
論文 参考訳(メタデータ) (2021-12-16T11:17:58Z) - Offensive Language and Hate Speech Detection with Deep Learning and
Transfer Learning [1.77356577919977]
我々は、ツイートを自動的に3つのクラスに分類するアプローチを提案する。
我々は、テキスト分類、感情チェック、テキストデータ拡張を含む主要な機能を含むクラスモジュールを作成する。
論文 参考訳(メタデータ) (2021-08-06T20:59:47Z) - Reinforced Iterative Knowledge Distillation for Cross-Lingual Named
Entity Recognition [54.92161571089808]
言語間NERは、知識をリッチリソース言語から低リソース言語に転送する。
既存の言語間NERメソッドは、ターゲット言語でリッチなラベル付けされていないデータをうまく利用しない。
半教師付き学習と強化学習のアイデアに基づく新しいアプローチを開発する。
論文 参考訳(メタデータ) (2021-06-01T05:46:22Z) - Learning Contextualised Cross-lingual Word Embeddings and Alignments for
Extremely Low-Resource Languages Using Parallel Corpora [63.5286019659504]
そこで本稿では,小さな並列コーパスに基づく文脈型言語間単語埋め込み学習手法を提案する。
本手法は,入力文の翻訳と再構成を同時に行うLSTMエンコーダデコーダモデルを用いて単語埋め込みを実現する。
論文 参考訳(メタデータ) (2020-10-27T22:24:01Z) - Anubhuti -- An annotated dataset for emotional analysis of Bengali short
stories [2.3424047967193826]
アヌブティはベンガルの短編小説の著者が表現した感情を分析するための最初の、そして最大のテキストコーパスである。
本稿では,データ収集手法,手作業によるアノテーション処理,そして結果として生じるハイアノテータ間の合意について説明する。
我々は、ベースライン機械学習と感情分類のためのディープラーニングモデルを用いて、データセットの性能を検証した。
論文 参考訳(メタデータ) (2020-10-06T22:33:58Z) - ALICE: Active Learning with Contrastive Natural Language Explanations [69.03658685761538]
本研究では,学習におけるデータ効率を向上させるために,AlICEを用いたアクティブラーニングを提案する。
ALICEは、まずアクティブラーニングを使用して、最も情報に富んだラベルクラスを選択し、対照的な自然言語の説明を引き出す。
意味的に抽出された知識を用いて、これらの説明から知識を抽出する。
論文 参考訳(メタデータ) (2020-09-22T01:02:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。