論文の概要: A Comprehensive Survey of Text Classification Techniques and Their Research Applications: Observational and Experimental Insights
- arxiv url: http://arxiv.org/abs/2401.12982v2
- Date: Mon, 25 Nov 2024 14:32:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:16:09.542936
- Title: A Comprehensive Survey of Text Classification Techniques and Their Research Applications: Observational and Experimental Insights
- Title(参考訳): テキスト分類手法の総合的調査とその研究応用:観察と実験的考察
- Authors: Kamal Taha, Paul D. Yoo, Chan Yeun, Aya Taha,
- Abstract要約: 本研究では,研究分野に基づくテキスト分類に特化して設計された包括的分類法を提案する。
分類学は、研究分野ベースのカテゴリ、研究分野ベースのサブカテゴリ、方法論ベースの技術、方法論のサブテクニック、研究分野の応用という階層的なレベルに分けられる。
- 参考スコア(独自算出の注目度): 2.1436706159840013
- License:
- Abstract: The exponential growth of textual data presents substantial challenges in management and analysis, notably due to high storage and processing costs. Text classification, a vital aspect of text mining, provides robust solutions by enabling efficient categorization and organization of text data. These techniques allow individuals, researchers, and businesses to derive meaningful patterns and insights from large volumes of text. This survey paper introduces a comprehensive taxonomy specifically designed for text classification based on research fields. The taxonomy is structured into hierarchical levels: research field-based category, research field-based sub-category, methodology-based technique, methodology sub-technique, and research field applications. We employ a dual evaluation approach: empirical and experimental. Empirically, we assess text classification techniques across four critical criteria. Experimentally, we compare and rank the methodology sub-techniques within the same methodology technique and within the same overall research field sub-category. This structured taxonomy, coupled with thorough evaluations, provides a detailed and nuanced understanding of text classification algorithms and their applications, empowering researchers to make informed decisions based on precise, field-specific insights.
- Abstract(参考訳): テキストデータの指数関数的な成長は、特に高いストレージと処理コストのために、管理と分析において重大な課題をもたらす。
テキストマイニングの重要な側面であるテキスト分類は、テキストデータの効率的な分類と整理を可能にすることによって、堅牢なソリューションを提供する。
これらの技術は、個人、研究者、ビジネスが大量のテキストから意味のあるパターンや洞察を導き出すことを可能にする。
本研究では,研究分野に基づくテキスト分類に特化して設計された包括的分類法を提案する。
分類学は、研究分野ベースのカテゴリ、研究分野ベースのサブカテゴリ、方法論ベースの技術、方法論のサブテクニック、研究分野の応用という階層的なレベルに分けられる。
実験と実験という2つの評価手法を採用している。
実験により,4つの基準にまたがるテキスト分類手法を実証的に評価した。
実験では,同じ方法論手法と,同じ研究分野のサブカテゴリにおいて,方法論のサブテクニックを比較し,ランク付けする。
この構造化分類学は、徹底的な評価と相まって、テキスト分類アルゴリズムとその応用に関する詳細で曖昧な理解を提供し、研究者が精密でフィールド固有の洞察に基づいて情報的な決定を行うことを可能にする。
関連論文リスト
- An Instance-based Plus Ensemble Learning Method for Classification of Scientific Papers [2.0794749869068005]
本稿では,科学論文の分類に事例ベース学習とアンサンブル学習を併用した新しい手法を提案する。
実験の結果,提案手法は論文を様々な研究領域に分類する上で効果的かつ効果的であることが示唆された。
論文 参考訳(メタデータ) (2024-09-21T19:42:15Z) - Empirical and Experimental Perspectives on Big Data in Recommendation
Systems: A Comprehensive Survey [2.6319554262325924]
本稿では,レコメンデーションシステムにおけるビッグデータアルゴリズムの包括的分析について述べる。
それは、現在のアルゴリズムの徹底的な分析と、正確な分類のための新しい階層的な分類法である。
論文 参考訳(メタデータ) (2024-02-01T23:51:29Z) - Incremental hierarchical text clustering methods: a review [49.32130498861987]
本研究の目的は,階層的および漸進的クラスタリング技術の解析である。
本研究の主な貢献は、文書クラスタリングのテキスト化を目的とした、2010年から2018年にかけて出版された研究で使用されるテクニックの組織化と比較である。
論文 参考訳(メタデータ) (2023-12-12T22:27:29Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - Deep Learning Schema-based Event Extraction: Literature Review and
Current Trends [60.29289298349322]
ディープラーニングに基づくイベント抽出技術が研究ホットスポットとなっている。
本稿では,ディープラーニングモデルに焦点をあて,最先端のアプローチを見直し,そのギャップを埋める。
論文 参考訳(メタデータ) (2021-07-05T16:32:45Z) - Using Full-text Content of Academic Articles to Build a Methodology
Taxonomy of Information Science in China [10.949304105928286]
本研究は情報科学の方法論分類法を構築するための新しい概念を提供する。
提案手法は従来の手法よりも詳細に分類され,分類の更新速度が向上した。
論文 参考訳(メタデータ) (2021-01-20T01:56:43Z) - A Survey of Embedding Space Alignment Methods for Language and Knowledge
Graphs [77.34726150561087]
単語,文,知識グラフの埋め込みアルゴリズムに関する現在の研究状況について調査する。
本稿では、関連するアライメント手法の分類と、この研究分野で使用されるベンチマークデータセットについて論じる。
論文 参考訳(メタデータ) (2020-10-26T16:08:13Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Deep Learning Based Text Classification: A Comprehensive Review [75.8403533775179]
本稿では,近年開発されたテキスト分類のための150以上のディープラーニングモデルについてレビューする。
また、テキスト分類に広く使われている40以上の一般的なデータセットの要約も提供する。
論文 参考訳(メタデータ) (2020-04-06T02:00:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。