論文の概要: A Survey on Text Classification: From Shallow to Deep Learning
- arxiv url: http://arxiv.org/abs/2008.00364v6
- Date: Wed, 22 Dec 2021 11:35:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 19:37:51.610781
- Title: A Survey on Text Classification: From Shallow to Deep Learning
- Title(参考訳): テキスト分類に関する調査:浅層学習から深層学習へ
- Authors: Qian Li, Hao Peng, Jianxin Li, Congying Xia, Renyu Yang, Lichao Sun,
Philip S. Yu, Lifang He
- Abstract要約: 過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
- 参考スコア(独自算出の注目度): 83.47804123133719
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text classification is the most fundamental and essential task in natural
language processing. The last decade has seen a surge of research in this area
due to the unprecedented success of deep learning. Numerous methods, datasets,
and evaluation metrics have been proposed in the literature, raising the need
for a comprehensive and updated survey. This paper fills the gap by reviewing
the state-of-the-art approaches from 1961 to 2021, focusing on models from
traditional models to deep learning. We create a taxonomy for text
classification according to the text involved and the models used for feature
extraction and classification. We then discuss each of these categories in
detail, dealing with both the technical developments and benchmark datasets
that support tests of predictions. A comprehensive comparison between different
techniques, as well as identifying the pros and cons of various evaluation
metrics are also provided in this survey. Finally, we conclude by summarizing
key implications, future research directions, and the challenges facing the
research area.
- Abstract(参考訳): テキスト分類は自然言語処理において最も基本的で不可欠な課題である。
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
多くの方法、データセット、評価指標が文献に提案されており、包括的かつ更新された調査の必要性が高まっている。
本稿では,1961年から2021年までの最先端のアプローチを概観し,従来のモデルからディープラーニングまでのモデルに注目して,そのギャップを埋める。
我々は,関連するテキストと特徴抽出と分類に用いるモデルに基づいて,テキスト分類の分類法を作成する。
次に、これらのカテゴリについて詳細に議論し、予測テストをサポートする技術開発とベンチマークデータセットの両方を扱う。
本調査では,異なる手法の総合的な比較と,各種評価指標の長所と短所の同定について述べる。
最後に、重要な意味、今後の研究の方向性、そして研究領域に直面する課題を要約する。
関連論文リスト
- Text Classification using Graph Convolutional Networks: A Comprehensive Survey [11.1080224302799]
グラフ畳み込みネットワーク(GCN)ベースのアプローチは、この10年間、この分野で大きな注目を集めてきた。
本研究の目的は,GCNをベースとしたテキスト分類手法をアーキテクチャや監視方法に関して要約し,分類することである。
論文 参考訳(メタデータ) (2024-10-12T07:03:42Z) - Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.12545440385489]
大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文 参考訳(メタデータ) (2024-10-02T20:48:28Z) - Detecting Statements in Text: A Domain-Agnostic Few-Shot Solution [1.3654846342364308]
最先端のアプローチは通常、作成にコストがかかる大規模な注釈付きデータセット上の微調整モデルを含む。
本稿では,クレームに基づくテキスト分類タスクの共通パラダイムとして,定性的で多目的な少ショット学習手法の提案とリリースを行う。
本手法は,気候変動対策,トピック/スタンス分類,うつ病関連症状検出の3つの課題の文脈で説明する。
論文 参考訳(メタデータ) (2024-05-09T12:03:38Z) - A Comprehensive Survey of Text Classification Techniques and Their Research Applications: Observational and Experimental Insights [2.1436706159840013]
本研究では,研究分野に基づくテキスト分類に特化して設計された包括的分類法を提案する。
分類学は、研究分野ベースのカテゴリ、研究分野ベースのサブカテゴリ、方法論ベースの技術、方法論のサブテクニック、研究分野の応用という階層的なレベルに分けられる。
論文 参考訳(メタデータ) (2024-01-11T08:17:42Z) - Deep Learning Schema-based Event Extraction: Literature Review and
Current Trends [60.29289298349322]
ディープラーニングに基づくイベント抽出技術が研究ホットスポットとなっている。
本稿では,ディープラーニングモデルに焦点をあて,最先端のアプローチを見直し,そのギャップを埋める。
論文 参考訳(メタデータ) (2021-07-05T16:32:45Z) - Deep Learning for Scene Classification: A Survey [48.57123373347695]
シーン分類は、コンピュータビジョンにおける長年の、根本的かつ挑戦的な問題である。
大規模データセットの出現と深層学習技術のルネッサンスは、シーン表現と分類の分野において顕著な進歩をもたらした。
本稿では,深層学習によるシーン分類における最近の成果を総合的に調査する。
論文 参考訳(メタデータ) (2021-01-26T03:06:50Z) - A Survey of Embedding Space Alignment Methods for Language and Knowledge
Graphs [77.34726150561087]
単語,文,知識グラフの埋め込みアルゴリズムに関する現在の研究状況について調査する。
本稿では、関連するアライメント手法の分類と、この研究分野で使用されるベンチマークデータセットについて論じる。
論文 参考訳(メタデータ) (2020-10-26T16:08:13Z) - Deep Learning Based Text Classification: A Comprehensive Review [75.8403533775179]
本稿では,近年開発されたテキスト分類のための150以上のディープラーニングモデルについてレビューする。
また、テキスト分類に広く使われている40以上の一般的なデータセットの要約も提供する。
論文 参考訳(メタデータ) (2020-04-06T02:00:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。