Fugu-MT 論文翻訳(概要): Bangla Text Classification using Transformers

論文の概要: Bangla Text Classification using Transformers

arxiv url: http://arxiv.org/abs/2011.04446v1
Date: Mon, 9 Nov 2020 14:12:07 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-28 00:06:14.308504
Title: Bangla Text Classification using Transformers
Title（参考訳）: トランスフォーマーを用いたバングラ語テキスト分類
Authors: Tanvirul Alam, Akib Khan and Firoj Alam
Abstract要約: テキスト分類はNLPの最も初期の問題の一つである。本研究では,Banglaテキスト分類タスクのための多言語変換モデルを微調整する。 6つのベンチマークデータセットのアート結果の状態を把握し、前回の結果を5～29%の精度で改善する。
参考スコア（独自算出の注目度）: 2.3475904942266697
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Text classification has been one of the earliest problems in NLP. Over time the scope of application areas has broadened and the difficulty of dealing with new areas (e.g., noisy social media content) has increased. The problem-solving strategy switched from classical machine learning to deep learning algorithms. One of the recent deep neural network architecture is the Transformer. Models designed with this type of network and its variants recently showed their success in many downstream natural language processing tasks, especially for resource-rich languages, e.g., English. However, these models have not been explored fully for Bangla text classification tasks. In this work, we fine-tune multilingual transformer models for Bangla text classification tasks in different domains, including sentiment analysis, emotion detection, news categorization, and authorship attribution. We obtain the state of the art results on six benchmark datasets, improving upon the previous results by 5-29% accuracy across different tasks.
Abstract（参考訳）: テキスト分類はNLPの最も初期の問題の一つである。時間とともに、アプリケーション領域の範囲は拡大し、新しい領域(例えば、騒がしいソーシャルメディアコンテンツ)を扱うことの難しさが増した。問題解決戦略は、古典的な機械学習からディープラーニングアルゴリズムに切り替わった。最近のディープニューラルネットワークアーキテクチャの1つはtransformerである。このタイプのネットワークで設計されたモデルとその変種は、最近、下流の自然言語処理タスク、特に英語などリソース豊富な言語で成功している。しかし、これらのモデルはBanglaテキスト分類タスクのために完全には研究されていない。本研究では,感情分析,感情検出,ニュース分類,著者属性など,さまざまな領域におけるBanglaテキスト分類タスクの多言語変換モデルを微調整する。 6つのベンチマークデータセットにおける技術結果の状態を把握し,各タスクの精度を5～29%向上させた。

関連論文リスト

Bangla Grammatical Error Detection Leveraging Transformer-based Token Classification [0.0]
世界で7番目に話されている言語であるバングラ語における自動文法チェッカーの開発について検討する。本手法では,トークン分類問題としてタスクを分割し,最先端のトランスフォーマーモデルを活用する。本システムは,様々な情報源から得られた25,000以上のテキストからなるデータセットを用いて評価する。
論文参考訳（メタデータ） (2024-11-13T05:22:45Z)
Language Models for Text Classification: Is In-Context Learning Enough? [54.869097980761595]
最近の基礎言語モデルでは、ゼロショットや少数ショットの設定で多くのNLPタスクで最先端のパフォーマンスが示されている。より標準的なアプローチよりもこれらのモデルの利点は、自然言語(prompts)で書かれた命令を理解する能力である。これにより、アノテーション付きインスタンスが限られているドメインのテキスト分類問題に対処するのに適している。
論文参考訳（メタデータ） (2024-03-26T12:47:39Z)
T3L: Translate-and-Test Transfer Learning for Cross-Lingual Text Classification [50.675552118811]
言語間テキスト分類は通常、様々な言語で事前訓練された大規模多言語言語モデル(LM)に基づいて構築される。本稿では,古典的な「翻訳とテスト」パイプラインを再考し,翻訳と分類の段階を適切に分離することを提案する。
論文参考訳（メタデータ） (2023-06-08T07:33:22Z)
To Augment or Not to Augment? A Comparative Study on Text Augmentation Techniques for Low-Resource NLP [0.0]
本稿では,構文の変更を行うテキスト拡張手法の3つのカテゴリについて検討する。音声のタグ付けや依存性解析,セマンティックロールのラベル付けなどにおいて,多種多様な言語ファミリに対して比較を行った。以上の結果から,mBERTに基づくベースラインの強化により,より高機能化が可能であることが示唆された。
論文参考訳（メタデータ） (2021-11-18T10:52:48Z)
Sentiment analysis in tweets: an assessment study from classical to modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文参考訳（メタデータ） (2021-05-29T21:05:28Z)
Sentiment Classification in Bangla Textual Content: A Comparative Study [4.2394281761764]
本研究では,古典学習アルゴリズムと深層学習アルゴリズムの両方を用いて,公開されている感情ラベル付きデータセットと設計分類器について検討する。以上の結果から,バングラではこれまで検討されていないトランスフォーマーモデルが,他のモデルよりも優れていたことが示唆された。
論文参考訳（メタデータ） (2020-11-19T21:06:28Z)
Be More with Less: Hypergraph Attention Networks for Inductive Text Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文参考訳（メタデータ） (2020-11-01T00:21:59Z)
Pretrained Transformers for Text Ranking: BERT and Beyond [53.83210899683987]
このサーベイは、トランスフォーマーとして知られるニューラルネットワークアーキテクチャによるテキストランキングの概要を提供する。トランスフォーマーと自己教師型事前学習の組み合わせは、自然言語処理のパラダイムシフトの原因となっている。
論文参考訳（メタデータ） (2020-10-13T15:20:32Z)
An Evaluation of Recent Neural Sequence Tagging Models in Turkish Named Entity Recognition [5.161531917413708]
本研究では,条件付きランダムフィールド層を有する変圧器ベースネットワークを提案する。本研究は,移動学習が形態的に豊かな言語処理に与える影響を定量化する文献に寄与する。
論文参考訳（メタデータ） (2020-05-14T06:54:07Z)
Deep Learning for Hindi Text Classification: A Comparison [6.8629257716723]
デヴァナガリ文字で書かれた形態的に豊かで低資源のヒンディー語を分類する研究は、大きなラベル付きコーパスがないために限られている。本研究では,CNN,LSTM,注意に基づくモデル評価のために,英文データセットの翻訳版を用いた。また,本論文は,一般的なテキスト分類手法のチュートリアルとしても機能する。
論文参考訳（メタデータ） (2020-01-19T09:29:12Z)
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer [64.22926988297685]
下流タスクで微調整される前に、まずデータリッチタスクでモデルが事前訓練されるトランスファーラーニングは、自然言語処理(NLP)において強力な手法として登場した。本稿では,すべてのテキストベースの言語問題をテキスト・トゥ・テキスト・フォーマットに変換する統一フレームワークにより,NLPのためのトランスファー学習手法を導入する状況について検討する。
論文参考訳（メタデータ） (2019-10-23T17:37:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。