論文の概要: Deep Autoencoder-based Fuzzy C-Means for Topic Detection
- arxiv url: http://arxiv.org/abs/2102.02636v1
- Date: Tue, 2 Feb 2021 07:41:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-06 01:27:22.932266
- Title: Deep Autoencoder-based Fuzzy C-Means for Topic Detection
- Title(参考訳): トピック検出のためのdeep autoencoderベースのファジィc-means
- Authors: Hendri Murfi, Natasha Rosaline, Nora Hariadi
- Abstract要約: 本稿では,ディープオートエンコーダとファジィc-meansを用いて,トピック検出のためのディープラーニングを採用する。
ファジィ c-平均は、セントロイドを識別するために低次元表現をグループ化する。
オートエンコーダのデコーダは、セントロイドを元の表現に変換し、トピックとして解釈する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Topic detection is a process for determining topics from a collection of
textual data. One of the topic detection methods is a clustering-based method,
which assumes that the centroids are topics. The clustering method has the
advantage that it can process data with negative representations. Therefore,
the clustering method allows a combination with a broader representation
learning method. In this paper, we adopt deep learning for topic detection by
using a deep autoencoder and fuzzy c-means called deep autoencoder-based fuzzy
c-means (DFCM). The encoder of the autoencoder performs a lower-dimensional
representation learning. Fuzzy c-means groups the lower-dimensional
representation to identify the centroids. The autoencoder's decoder transforms
back the centroids into the original representation to be interpreted as the
topics. Our simulation shows that DFCM improves the coherence score of
eigenspace-based fuzzy c-means (EFCM) and is comparable to the leading standard
methods, i.e., nonnegative matrix factorization (NMF) or latent Dirichlet
allocation (LDA).
- Abstract(参考訳): トピック検出は、テキストデータの集合からトピックを決定するプロセスである。
トピック検出手法の1つはクラスタリングに基づく手法で、centroidsがトピックであると仮定する。
クラスタリング手法は、負の表現でデータを処理できるという利点がある。
したがって、クラスタリング法はより広範な表現学習法と組み合わせることができる。
本稿では,Deep Autoencoder とfuzzy c-means (DFCM) を用いて,話題検出のためのディープラーニングを採用する。
オートエンコーダのエンコーダは、低次元表現学習を行う。
ファジィc-平均は、中心体を識別するために低次元表現をグループ化する。
オートエンコーダのデコーダは、centroidsを元の表現に変換し、トピックとして解釈する。
このシミュレーションにより、DFCMは固有空間ベースのファジィc-平均(EFCM)のコヒーレンススコアを改善し、非負行列ファクタリゼーション(NMF)や潜在ディリクレアロケーション(LDA)といった主要な標準手法に匹敵する。
関連論文リスト
- Anchor-free Clustering based on Anchor Graph Factorization [18.809954521548303]
Anchor Graph Factorization(AFCAGF)に基づくAnchor-free Clusteringと呼ばれる新しい手法を提案する。
AFCAGFはアンカーグラフの学習において革新的であり、サンプル間のペア距離の計算のみを必要とする。
我々は,クラスタセンターとFKMのサンプル間のメンバシップ行列の概念を,複数のアンカーポイントとサンプルを含むアンカーグラフに進化させた。
論文 参考訳(メタデータ) (2024-02-24T02:16:42Z) - A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - Center Focusing Network for Real-Time LiDAR Panoptic Segmentation [58.1194137706868]
高精度かつリアルタイムなLiDARパノプティブセグメンテーションを実現するために、CFNet(Central Focus Network)を導入した。
CFFEは、元のLiDARポイントと仮想インスタンスセンターの関係を明確に理解するために提案されている。
我々のCFNetは、すべての既存のメソッドを大きなマージンで上回り、最も効率的なメソッドよりも1.6倍高速です。
論文 参考訳(メタデータ) (2023-11-16T01:52:11Z) - A Process for Topic Modelling Via Word Embeddings [0.0]
この研究は、単語の埋め込み、次元の縮小、クラスタリングに基づくアルゴリズムを組み合わせる。
目的は、未分類テキストの集合からトピックを取得することである。
論文 参考訳(メタデータ) (2023-10-06T15:10:35Z) - Feature Selection using Sparse Adaptive Bottleneck Centroid-Encoder [1.2487990897680423]
2つ以上のクラスで識別される特徴を決定するために,新しい非線形モデル SABCE (Sparse Adaptive Bottleneckid-Encoder) を導入する。
このアルゴリズムは、高次元生物学的、画像、音声、加速度センサデータなど、様々な実世界のデータセットに適用される。
論文 参考訳(メタデータ) (2023-06-07T21:37:21Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - DAC: Deep Autoencoder-based Clustering, a General Deep Learning
Framework of Representation Learning [0.0]
dac,deep autoencoder-based clustering,深層ニューロンネットワークを用いてクラスタリング表現を学ぶためのデータ駆動フレームワークを提案する。
実験結果から,KMeansクラスタリングアルゴリズムの性能をさまざまなデータセット上で効果的に向上させることができた。
論文 参考訳(メタデータ) (2021-02-15T11:31:00Z) - Determinantal consensus clustering [77.34726150561087]
本稿では,クラスタリングアルゴリズムのランダム再起動における決定点プロセス (DPP) の利用を提案する。
DPPは部分集合内の中心点の多様性を好んでいる。
DPPとは対照的に、この手法は多様性の確保と、すべてのデータフェースについて良好なカバレッジを得るために失敗することを示す。
論文 参考訳(メタデータ) (2021-02-07T23:48:24Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - MetaSDF: Meta-learning Signed Distance Functions [85.81290552559817]
ニューラルな暗示表現で形状を一般化することは、各関数空間上の学習先行値に比例する。
形状空間の学習をメタラーニング問題として定式化し、勾配に基づくメタラーニングアルゴリズムを利用してこの課題を解決する。
論文 参考訳(メタデータ) (2020-06-17T05:14:53Z) - K-bMOM: a robust Lloyd-type clustering algorithm based on bootstrap
Median-of-Means [3.222802562733787]
本稿では,データセットの外れ値の存在に頑健な新しいクラスタリングアルゴリズムを提案する。
我々は、中央値統計のアイデアに基づいて、セントロイドを推定するが、ブロックを構築しながら置き換えることができる。
我々は,K-means歪に対する収束率の頑健さを導出することにより,敵の汚染に対する頑健さを証明した。
論文 参考訳(メタデータ) (2020-02-10T16:08:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。