論文の概要: Incremental hierarchical text clustering methods: a review
- arxiv url: http://arxiv.org/abs/2312.07769v1
- Date: Tue, 12 Dec 2023 22:27:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-14 17:24:10.480479
- Title: Incremental hierarchical text clustering methods: a review
- Title(参考訳): インクリメンタル階層的テキストクラスタリング手法:レビュー
- Authors: Fernando Simeone, Maik Olher Chaves, Ahmed Esmin
- Abstract要約: 本研究の目的は,階層的および漸進的クラスタリング技術の解析である。
本研究の主な貢献は、文書クラスタリングのテキスト化を目的とした、2010年から2018年にかけて出版された研究で使用されるテクニックの組織化と比較である。
- 参考スコア(独自算出の注目度): 49.32130498861987
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The growth in Internet usage has contributed to a large volume of
continuously available data, and has created the need for automatic and
efficient organization of the data. In this context, text clustering techniques
are significant because they aim to organize documents according to their
characteristics. More specifically, hierarchical and incremental clustering
techniques can organize dynamic data in a hierarchical form, thus guaranteeing
that this organization is updated and its exploration is facilitated. Based on
the relevance and contemporary nature of the field, this study aims to analyze
various hierarchical and incremental clustering techniques; the main
contribution of this research is the organization and comparison of the
techniques used by studies published between 2010 and 2018 that aimed to texts
documents clustering. We describe the principal concepts related to the
challenge and the different characteristics of these published works in order
to provide a better understanding of the research in this field.
- Abstract(参考訳): インターネット利用の増加は、継続的に利用可能な大量のデータに寄与し、データの自動的かつ効率的な組織化の必要性を生み出した。
この文脈では、テキストクラスタリング技術は、その特徴に従って文書を整理することを目的としているため、重要である。
より具体的には、階層的かつインクリメンタルなクラスタリング技術は、動的データを階層的な形式で整理することができるため、この組織が更新され、その探索が容易になる。
本研究の主な貢献は,2010年から2018年にかけて出版されたテキスト文書のクラスタリングを目的とした研究で使用されている手法の組織化と比較である。
本研究の理解を深めるために,本研究の課題と出版作品の異なる特徴に関する主要な概念について述べる。
関連論文リスト
- CEIL: A General Classification-Enhanced Iterative Learning Framework for
Text Clustering [16.08402937918212]
短文クラスタリングのための新しい分類強化反復学習フレームワークを提案する。
各イテレーションにおいて、まず最初に言語モデルを採用して、初期テキスト表現を検索する。
厳密なデータフィルタリングと集約プロセスの後、クリーンなカテゴリラベルを持つサンプルが検索され、監督情報として機能する。
最後に、表現能力が改善された更新言語モデルを使用して、次のイテレーションでクラスタリングを強化する。
論文 参考訳(メタデータ) (2023-04-20T14:04:31Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Seeking the Truth Beyond the Data. An Unsupervised Machine Learning
Approach [0.0]
クラスタリングは、ラベルのない要素/オブジェクトがグループ化される、教師なしの機械学習方法論である。
この記事では、最も広く使われているクラスタリング手法について詳しく説明する。
3つのデータセットに基づいて、これらのアルゴリズムのクラスタリング効率の比較を強調している。
論文 参考訳(メタデータ) (2022-07-14T14:22:36Z) - A Comprehensive Survey on Deep Clustering: Taxonomy, Challenges, and
Future Directions [48.97008907275482]
クラスタリングは、文献で広く研究されている基本的な機械学習タスクである。
ディープクラスタリング(Deep Clustering)、すなわち表現学習とクラスタリングを共同で最適化する手法が提案され、コミュニティで注目を集めている。
深層クラスタリングの本質的なコンポーネントを要約し、深層クラスタリングと深層クラスタリングの相互作用を設計する方法によって既存の手法を分類する。
論文 参考訳(メタデータ) (2022-06-15T15:05:13Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - A Survey of Evolutionary Multi-Objective Clustering Approaches [0.0]
進化的多目的クラスタリングの一般的なアーキテクチャで提案される特徴と構成要素に基づいてアルゴリズムを解析する。
新しいアプローチを設計したり、既存のものを選択したり使用する際には、特定のクラスタリングプロパティ以外にこれらの側面を観察することが不可欠です。
論文 参考訳(メタデータ) (2021-10-15T13:53:12Z) - Path Based Hierarchical Clustering on Knowledge Graphs [1.713291434132985]
対象クラスタの階層化を誘導する新しい手法を提案する。
この階層上のクラスタに対象を割り当てる前に、まずタグ階層を構築します。
実世界の3つのデータセット上で,コヒーレントクラスタ階層を誘導する手法の能力を定量的に示す。
論文 参考訳(メタデータ) (2021-09-27T16:42:43Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。