論文の概要: An exploratory experiment on Hindi, Bengali hate-speech detection and
transfer learning using neural networks
- arxiv url: http://arxiv.org/abs/2201.01997v1
- Date: Thu, 6 Jan 2022 10:13:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-07 18:54:49.577212
- Title: An exploratory experiment on Hindi, Bengali hate-speech detection and
transfer learning using neural networks
- Title(参考訳): ニューラルネットワークを用いたヒンディー語のヘイトスピーチ検出と伝達学習に関する探索実験
- Authors: Tung Minh Phung, Jan Cloos
- Abstract要約: 本研究では,ヒンディー語とベンガル語におけるヘイトスピーチテキストを検出するニューラルネットワークのトレーニング手法を提案する。
また、これらの言語が同じ起源を持つため、いくつかの拡張に類似していることから、トランスファーラーニングがこれらの言語学習にどのように適用できるかについても検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work presents our approach to train a neural network to detect
hate-speech texts in Hindi and Bengali. We also explore how transfer learning
can be applied to learning these languages, given that they have the same
origin and thus, are similar to some extend. Even though the whole experiment
was conducted with low computational power, the obtained result is comparable
to the results of other, more expensive, models. Furthermore, since the
training data in use is relatively small and the two languages are almost
entirely unknown to us, this work can be generalized as an effort to demystify
lost or alien languages that no human is capable of understanding.
- Abstract(参考訳): 本研究では,ヒンディー語とベンガル語におけるヘイトスピーチテキストを検出するニューラルネットワークのトレーニング手法を提案する。
また、これらの言語が同じ起源を持つため、いくつかの拡張に類似していることから、トランスファーラーニングをこれらの言語学習に適用する方法についても検討する。
実験全体は低い計算力で実施されたが、得られた結果は他のより高価なモデルの結果に匹敵するものである。
さらに、使用中のトレーニングデータは比較的小さく、2つの言語はほとんど不明であるため、この研究は、人間が理解できない失われた言語やエイリアンの言語を解読する試みとして一般化することができる。
関連論文リスト
- On the Correspondence between Compositionality and Imitation in Emergent
Neural Communication [1.4610038284393165]
我々の研究は、ディープ・ニューラル・エージェントがプレイするルイス・ゲームにおける構成性と模倣の関係を探求する。
教師付き学習は平均的な言語を作り出す傾向があり、強化学習はより構成的な言語に対する選択的な圧力をもたらす。
論文 参考訳(メタデータ) (2023-05-22T11:41:29Z) - Communication Drives the Emergence of Language Universals in Neural
Agents: Evidence from the Word-order/Case-marking Trade-off [3.631024220680066]
ニューラルエージェント言語学習通信フレームワーク(NeLLCom)を提案する。
我々はエージェントに特定のバイアスをハードコーディングすることなく、新しいフレームワークでトレードオフを複製することに成功しました。
論文 参考訳(メタデータ) (2023-01-30T17:22:33Z) - Learning an Artificial Language for Knowledge-Sharing in Multilingual
Translation [15.32063273544696]
コードブック内のエントリにエンコーダ状態を割り当てることで,多言語モデルの潜伏空間を識別する。
我々は,現実的なデータ量と領域を用いた大規模実験へのアプローチを検証する。
また、学習した人工言語を用いてモデル行動を分析し、類似のブリッジ言語を使用することで、残りの言語間での知識共有が向上することを発見した。
論文 参考訳(メタデータ) (2022-11-02T17:14:42Z) - What Artificial Neural Networks Can Tell Us About Human Language
Acquisition [47.761188531404066]
自然言語処理のための機械学習の急速な進歩は、人間がどのように言語を学ぶかについての議論を変革する可能性がある。
計算モデルによる学習可能性の関連性を高めるためには,人間に対して大きな優位性を持たず,モデル学習者を訓練する必要がある。
論文 参考訳(メタデータ) (2022-08-17T00:12:37Z) - Same Neurons, Different Languages: Probing Morphosyntax in Multilingual
Pre-trained Models [84.86942006830772]
多言語事前学習モデルは文法に関する言語・ユニバーサルの抽象化を導出できると推測する。
43の言語と14のモルフォシンタクティックなカテゴリーで、最先端のニューロンレベルのプローブを用いて、初めて大規模な実験を行った。
論文 参考訳(メタデータ) (2022-05-04T12:22:31Z) - Hindi/Bengali Sentiment Analysis Using Transfer Learning and Joint Dual
Input Learning with Self Attention [0.0]
我々の研究は、深層ニューラルネットワークをトランスファーラーニングや統合二重入力学習設定で効果的に活用し、感情を効果的に分類し、ヒンディー語とベンガル語のヘイトスピーチを検出する方法について検討している。
統合二重入力学習環境では自己注意のBiLSTMを使用し、ヒンディー語とベンガル語のデータセット上に1つのニューラルネットワークを同時に、それぞれの埋め込みを用いてトレーニングする。
論文 参考訳(メタデータ) (2022-02-11T05:36:11Z) - Utilizing Wordnets for Cognate Detection among Indian Languages [50.83320088758705]
ヒンディー語と10のインド諸語間の単語対を検出する。
深層学習手法を用いて単語対が共生か否かを予測する。
性能は最大26%向上した。
論文 参考訳(メタデータ) (2021-12-30T16:46:28Z) - Harnessing Cross-lingual Features to Improve Cognate Detection for
Low-resource Languages [50.82410844837726]
言語間単語埋め込みを用いた14言語間のコニャートの検出を実証する。
インドの12言語からなる挑戦的データセットを用いて,コニャート検出手法の評価を行った。
我々は,コグネート検出のためのFスコアで最大18%の改善点を観察した。
論文 参考訳(メタデータ) (2021-12-16T11:17:58Z) - Knowledge Distillation for Multilingual Unsupervised Neural Machine
Translation [61.88012735215636]
unsupervised neural machine translation (UNMT) は、最近、いくつかの言語対に対して顕著な結果を得た。
UNMTは単一の言語ペア間でのみ翻訳することができ、同時に複数の言語ペアに対して翻訳結果を生成することはできない。
本稿では,1つのエンコーダと1つのデコーダを用いて13言語間を翻訳する簡単な手法を実証的に紹介する。
論文 参考訳(メタデータ) (2020-04-21T17:26:16Z) - Information-Theoretic Probing for Linguistic Structure [74.04862204427944]
本稿では,相互情報を推定するための情報理論による探索運用手法を提案する。
我々は,NLP研究でしばしば不足している10の型的多様言語について評価した。
論文 参考訳(メタデータ) (2020-04-07T01:06:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。