論文の概要: New Approach to Clustering Random Attributes
- arxiv url: http://arxiv.org/abs/2412.09748v1
- Date: Thu, 12 Dec 2024 22:37:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-16 15:02:15.912035
- Title: New Approach to Clustering Random Attributes
- Title(参考訳): ランダム属性のクラスタリングへの新しいアプローチ
- Authors: Zenon Gniazdowski,
- Abstract要約: 本稿では,異なる属性をクラスタリングする新しいアルゴリズムを提案する。
符号化過程において、名目属性は数値形式で新しい表現を得る。
提案手法はいくつかのサンプルデータセットに対して検証された。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This paper proposes a new method for similarity analysis and, consequently, a new algorithm for clustering different types of random attributes, both numerical and nominal. However, in order for nominal attributes to be clustered, their values must be properly encoded. In the encoding process, nominal attributes obtain a new representation in numerical form. Only the numeric attributes can be subjected to factor analysis, which allows them to be clustered in terms of their similarity to factors. The proposed method was tested for several sample datasets. It was found that the proposed method is universal. On the one hand, the method allows clustering of numerical attributes. On the other hand, it provides the ability to cluster nominal attributes. It also allows simultaneous clustering of numerical attributes and numerically encoded nominal attributes.
- Abstract(参考訳): 本稿では,類似度分析のための新しい手法を提案し,その結果,数値的・名義的に異なる種類のランダム属性をクラスタリングする新しいアルゴリズムを提案する。
しかし、名目属性をクラスタ化するためには、それらの値を適切にエンコードする必要がある。
符号化過程において、名目属性は数値形式で新しい表現を得る。
数値属性のみが因子分析の対象となり、因子との類似性の観点からそれらをクラスタ化することができる。
提案手法はいくつかのサンプルデータセットに対して検証された。
提案手法は普遍的であることがわかった。
一方,本手法は数値属性のクラスタリングを可能にする。
一方、識別属性をクラスタリングする機能を提供する。
また、数値属性と数値エンコードされた名目属性の同時クラスタリングも可能である。
関連論文リスト
- A new approach for evaluating internal cluster validation indices [0.0]
クラスタ検証は、最高の性能のアルゴリズムを選択するために必要である。
追加情報(外部情報)を使わずに、この目的のためにいくつかの指標が提案された。
評価手法は, 地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・
論文 参考訳(メタデータ) (2023-08-02T06:55:33Z) - Retrieval-Augmented Classification with Decoupled Representation [31.662843145399044]
そこで本研究では,KNN(Kk$-nearest-neighbor)に基づく拡張分類検索手法を提案する。
分類と検索の共有表現がパフォーマンスを損なうことや,トレーニングの不安定化につながることが判明した。
本手法は,幅広い分類データセットを用いて評価する。
論文 参考訳(メタデータ) (2023-03-23T06:33:06Z) - High-dimensional variable clustering based on maxima of a weakly dependent random process [1.1999555634662633]
本稿では,Asymptotic Independent Block (AI-block)モデルと呼ばれる,変数クラスタリングのための新しいモデルのクラスを提案する。
このモデルのクラスは特定可能であり、つまり、分割の間に部分的な順序を持つ極大要素が存在し、統計的推測が可能であることを意味する。
また,変数のクラスタを列挙するチューニングパラメータに依存するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-02T08:24:26Z) - Personalized Federated Learning via Convex Clustering [72.15857783681658]
本稿では,局所凸型ユーザコストを用いた個人化フェデレーション学習のためのアルゴリズム群を提案する。
提案するフレームワークは,異なるユーザのモデルの違いをペナル化する凸クラスタリングの一般化に基づいている。
論文 参考訳(メタデータ) (2022-02-01T19:25:31Z) - Make an Omelette with Breaking Eggs: Zero-Shot Learning for Novel
Attribute Synthesis [65.74825840440504]
我々は,ZSLA(Zero Shot Learning for Attributes)を提案する。
提案手法は,新しい属性の検出器をゼロショット学習方式で合成することができる。
提案手法は,Caltech-UCSD Birds-200-2011データセット上の32個の属性のみを用いて,他の207個の新しい属性を合成することができる。
論文 参考訳(メタデータ) (2021-11-28T15:45:54Z) - Multivariate feature ranking of gene expression data [62.997667081978825]
ペアワイズ相関とペアワイズ整合性に基づく2つの新しい多変量特徴ランキング手法を提案する。
提案手法は, クラスタリング変動, チ・スクエアド, 相関, 情報ゲイン, ReliefF および Significance の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-03T17:19:53Z) - Multi-Objective Few-shot Learning for Fair Classification [23.05869193599414]
本稿では,データ内の二次属性に対する予測クラスの相違を緩和する枠組みを提案する。
提案手法は,データから一次クラスラベルを予測することの主目的を学習することに加えて,クラスタメンバシップに対するクラスラベル分布の差異を最小限に抑えるためにクラスタリングをベースとした多目的関数を学習することを含む。
論文 参考訳(メタデータ) (2021-10-05T11:28:58Z) - Predictive K-means with local models [0.028675177318965035]
予測クラスタリングは、2つの世界のベストを獲得しようとします。
この手法を用いて2つの新しいアルゴリズムを提案し、予測性能に競争力があることを様々なデータセットで示す。
論文 参考訳(メタデータ) (2020-12-16T10:49:36Z) - Selecting Relevant Features from a Multi-domain Representation for
Few-shot Classification [91.67977602992657]
本稿では,従来の特徴適応手法よりもシンプルかつ効果的である特徴選択に基づく新しい戦略を提案する。
このような特徴の上に構築された単純な非パラメトリック分類器は高い精度を示し、訓練中に見たことのない領域に一般化する。
論文 参考訳(メタデータ) (2020-03-20T15:44:17Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z) - Certified Robustness to Label-Flipping Attacks via Randomized Smoothing [105.91827623768724]
機械学習アルゴリズムは、データ中毒攻撃の影響を受けやすい。
任意の関数に対するランダム化スムージングの統一的なビューを示す。
本稿では,一般的なデータ中毒攻撃に対して,ポイントワイズで確実に堅牢な分類器を構築するための新しい戦略を提案する。
論文 参考訳(メタデータ) (2020-02-07T21:28:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。