論文の概要: Text Classification: A Review, Empirical, and Experimental Evaluation
- arxiv url: http://arxiv.org/abs/2401.12982v1
- Date: Thu, 11 Jan 2024 08:17:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-28 15:44:34.509195
- Title: Text Classification: A Review, Empirical, and Experimental Evaluation
- Title(参考訳): テキスト分類 : レビュー・経験的・実験的評価
- Authors: Kamal Taha, Paul D. Yoo, Chan Yeun, Aya Taha
- Abstract要約: 既存の調査論文は、テキスト分類のためのアルゴリズムを幅広いクラスに分類している。
アルゴリズムを階層的にきめ細かなクラスと特定のテクニックに分類する,新しい方法論の分類法を導入する。
本研究は,本手法をテキスト分類アルゴリズムの分類に利用した最初の調査である。
- 参考スコア(独自算出の注目度): 2.341806147715478
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The explosive and widespread growth of data necessitates the use of text
classification to extract crucial information from vast amounts of data.
Consequently, there has been a surge of research in both classical and deep
learning text classification methods. Despite the numerous methods proposed in
the literature, there is still a pressing need for a comprehensive and
up-to-date survey. Existing survey papers categorize algorithms for text
classification into broad classes, which can lead to the misclassification of
unrelated algorithms and incorrect assessments of their qualities and behaviors
using the same metrics. To address these limitations, our paper introduces a
novel methodological taxonomy that classifies algorithms hierarchically into
fine-grained classes and specific techniques. The taxonomy includes methodology
categories, methodology techniques, and methodology sub-techniques. Our study
is the first survey to utilize this methodological taxonomy for classifying
algorithms for text classification. Furthermore, our study also conducts
empirical evaluation and experimental comparisons and rankings of different
algorithms that employ the same specific sub-technique, different
sub-techniques within the same technique, different techniques within the same
category, and categories
- Abstract(参考訳): データの爆発的かつ広範な成長は、膨大なデータから重要な情報を抽出するためにテキスト分類を使用する必要がある。
その結果,古典的テキスト分類法と深層学習的テキスト分類法の両方の研究が急増した。
文献で提案された多くの手法にもかかわらず、包括的で最新の調査の必要性は依然として迫られている。
既存の調査論文では、テキスト分類のアルゴリズムを幅広いクラスに分類しており、無関係なアルゴリズムの誤分類や、同じメトリクスを用いた品質や行動の誤った評価につながる可能性がある。
そこで本研究では,アルゴリズムを階層的に細粒度クラスや特定の手法に分類する手法的分類法を提案する。
分類には方法論のカテゴリ、方法論のテクニック、方法論のサブテクニックが含まれる。
本研究は,本手法をテキスト分類アルゴリズムの分類に利用した最初の調査である。
さらに,本研究では,同一の特定のサブテクニック,同一のテクニック,同一のカテゴリ内の異なるテクニック,およびカテゴリを用いて,異なるアルゴリズムの試験的評価と比較およびランク付けを行う。
関連論文リスト
- Empirical and Experimental Insights into Data Mining Techniques for
Crime Prediction: A Comprehensive Survey [0.8702432681310399]
本稿では,犯罪データ分析に使用される統計的手法,機械学習アルゴリズム,深層学習技術について述べる。
本稿では,犯罪予測アルゴリズムを特定の手法に分類する手法を提案する。
論文 参考訳(メタデータ) (2024-02-17T15:00:45Z) - Empirical and Experimental Perspectives on Big Data in Recommendation
Systems: A Comprehensive Survey [2.6319554262325924]
本稿では,レコメンデーションシステムにおけるビッグデータアルゴリズムの包括的分析について述べる。
それは、現在のアルゴリズムの徹底的な分析と、正確な分類のための新しい階層的な分類法である。
論文 参考訳(メタデータ) (2024-02-01T23:51:29Z) - Incremental hierarchical text clustering methods: a review [49.32130498861987]
本研究の目的は,階層的および漸進的クラスタリング技術の解析である。
本研究の主な貢献は、文書クラスタリングのテキスト化を目的とした、2010年から2018年にかけて出版された研究で使用されるテクニックの組織化と比較である。
論文 参考訳(メタデータ) (2023-12-12T22:27:29Z) - Text Classification: A Perspective of Deep Learning Methods [0.0679877553227375]
本稿では,テキスト分類作業に必要な重要なステップを含む,深層学習に基づくテキスト分類アルゴリズムを提案する。
論文の最後には、異なる深層学習テキスト分類法を比較し、要約する。
論文 参考訳(メタデータ) (2023-09-24T21:49:51Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - A Survey of Embedding Space Alignment Methods for Language and Knowledge
Graphs [77.34726150561087]
単語,文,知識グラフの埋め込みアルゴリズムに関する現在の研究状況について調査する。
本稿では、関連するアライメント手法の分類と、この研究分野で使用されるベンチマークデータセットについて論じる。
論文 参考訳(メタデータ) (2020-10-26T16:08:13Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Deep Learning Based Text Classification: A Comprehensive Review [75.8403533775179]
本稿では,近年開発されたテキスト分類のための150以上のディープラーニングモデルについてレビューする。
また、テキスト分類に広く使われている40以上の一般的なデータセットの要約も提供する。
論文 参考訳(メタデータ) (2020-04-06T02:00:30Z) - Imbalanced classification: a paradigm-based review [21.578692329486643]
クラス不均衡問題に対処する複数の再サンプリング手法が提案されている。
それぞれのテクニックをいつ使うかについては、一般的なガイダンスはない。
不均衡なクラスサイズ下でのバイナリ分類のための共通再サンプリング手法をパラダイムベースでレビューする。
論文 参考訳(メタデータ) (2020-02-11T18:34:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。