論文の概要: Incremental hierarchical text clustering methods: a review
- arxiv url: http://arxiv.org/abs/2312.07769v1
- Date: Tue, 12 Dec 2023 22:27:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-14 17:24:10.480479
- Title: Incremental hierarchical text clustering methods: a review
- Title(参考訳): インクリメンタル階層的テキストクラスタリング手法:レビュー
- Authors: Fernando Simeone, Maik Olher Chaves, Ahmed Esmin
- Abstract要約: 本研究の目的は,階層的および漸進的クラスタリング技術の解析である。
本研究の主な貢献は、文書クラスタリングのテキスト化を目的とした、2010年から2018年にかけて出版された研究で使用されるテクニックの組織化と比較である。
- 参考スコア(独自算出の注目度): 49.32130498861987
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The growth in Internet usage has contributed to a large volume of
continuously available data, and has created the need for automatic and
efficient organization of the data. In this context, text clustering techniques
are significant because they aim to organize documents according to their
characteristics. More specifically, hierarchical and incremental clustering
techniques can organize dynamic data in a hierarchical form, thus guaranteeing
that this organization is updated and its exploration is facilitated. Based on
the relevance and contemporary nature of the field, this study aims to analyze
various hierarchical and incremental clustering techniques; the main
contribution of this research is the organization and comparison of the
techniques used by studies published between 2010 and 2018 that aimed to texts
documents clustering. We describe the principal concepts related to the
challenge and the different characteristics of these published works in order
to provide a better understanding of the research in this field.
- Abstract(参考訳): インターネット利用の増加は、継続的に利用可能な大量のデータに寄与し、データの自動的かつ効率的な組織化の必要性を生み出した。
この文脈では、テキストクラスタリング技術は、その特徴に従って文書を整理することを目的としているため、重要である。
より具体的には、階層的かつインクリメンタルなクラスタリング技術は、動的データを階層的な形式で整理することができるため、この組織が更新され、その探索が容易になる。
本研究の主な貢献は,2010年から2018年にかけて出版されたテキスト文書のクラスタリングを目的とした研究で使用されている手法の組織化と比較である。
本研究の理解を深めるために,本研究の課題と出版作品の異なる特徴に関する主要な概念について述べる。
関連論文リスト
- HiReview: Hierarchical Taxonomy-Driven Automatic Literature Review Generation [15.188580557890942]
HiReviewは階層的な分類による自動文献レビュー生成のための新しいフレームワークである。
大規模な実験により、HiReviewは最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-10-02T13:02:03Z) - Text Clustering with LLM Embeddings [0.0]
テキストクラスタリングの有効性は、テキスト埋め込みとクラスタリングアルゴリズムの選択に大きく依存する。
大規模言語モデル(LLM)の最近の進歩は、このタスクを強化する可能性を秘めている。
LLM埋め込みは構造化言語の微妙さを捉えるのに優れていることを示す。
論文 参考訳(メタデータ) (2024-03-22T11:08:48Z) - A Comprehensive Survey of Text Classification Techniques and Their Research Applications: Observational and Experimental Insights [2.1436706159840013]
本研究では,研究分野に基づくテキスト分類に特化して設計された包括的分類法を提案する。
分類学は、研究分野ベースのカテゴリ、研究分野ベースのサブカテゴリ、方法論ベースの技術、方法論のサブテクニック、研究分野の応用という階層的なレベルに分けられる。
論文 参考訳(メタデータ) (2024-01-11T08:17:42Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - A Comprehensive Survey on Deep Clustering: Taxonomy, Challenges, and
Future Directions [48.97008907275482]
クラスタリングは、文献で広く研究されている基本的な機械学習タスクである。
ディープクラスタリング(Deep Clustering)、すなわち表現学習とクラスタリングを共同で最適化する手法が提案され、コミュニティで注目を集めている。
深層クラスタリングの本質的なコンポーネントを要約し、深層クラスタリングと深層クラスタリングの相互作用を設計する方法によって既存の手法を分類する。
論文 参考訳(メタデータ) (2022-06-15T15:05:13Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - Path Based Hierarchical Clustering on Knowledge Graphs [1.713291434132985]
対象クラスタの階層化を誘導する新しい手法を提案する。
この階層上のクラスタに対象を割り当てる前に、まずタグ階層を構築します。
実世界の3つのデータセット上で,コヒーレントクラスタ階層を誘導する手法の能力を定量的に示す。
論文 参考訳(メタデータ) (2021-09-27T16:42:43Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。