論文の概要: Towards Continuous Consistency Axiom
- arxiv url: http://arxiv.org/abs/2202.06015v1
- Date: Sat, 12 Feb 2022 08:25:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-15 15:54:36.382100
- Title: Towards Continuous Consistency Axiom
- Title(参考訳): 連続的一貫性公理に向けて
- Authors: Mieczyslaw A. Klopotek and Robert A. Klopotek
- Abstract要約: 機械学習分野、特にクラスタリングにおける新しいアルゴリズムの開発には、ラベル付きデータセットの可用性が必要である。
我々は、クラインバーグの内部整合公理を中心的整合公理に置き換える別の公理系を提案する。
我々は、新しいシステムが、自動調整された$k$を持つ$k$-meansの階層的なバージョンに適合していることを示し、矛盾しない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Development of new algorithms in the area of machine learning, especially
clustering, comparative studies of such algorithms as well as testing according
to software engineering principles requires availability of labeled data sets.
While standard benchmarks are made available, a broader range of such data sets
is necessary in order to avoid the problem of overfitting. In this context,
theoretical works on axiomatization of clustering algorithms, especially axioms
on clustering preserving transformations are quite a cheap way to produce
labeled data sets from existing ones. However, the frequently cited axiomatic
system of Kleinberg:2002, as we show in this paper, is not applicable for
finite dimensional Euclidean spaces, in which many algorithms like $k$-means,
operate. In particular, the so-called outer-consistency axiom fails upon making
small changes in datapoint positions and inner-consistency axiom is valid only
for identity transformation in general settings.
Hence we propose an alternative axiomatic system, in which Kleinberg's inner
consistency axiom is replaced by a centric consistency axiom and outer
consistency axiom is replaced by motion consistency axiom. We demonstrate that
the new system is satisfiable for a hierarchical version of $k$-means with
auto-adjusted $k$, hence it is not contradictory. Additionally, as $k$-means
creates convex clusters only, we demonstrate that it is possible to create a
version detecting concave clusters and still the axiomatic system can be
satisfied. The practical application area of such an axiomatic system may be
the generation of new labeled test data from existent ones for clustering
algorithm testing. %We propose the gravitational consistency as a replacement
which does not have this deficiency.
- Abstract(参考訳): 機械学習、特にクラスタリングの分野での新しいアルゴリズムの開発は、このようなアルゴリズムの比較研究とソフトウェア工学の原則によるテストには、ラベル付きデータセットの可用性が必要である。
標準ベンチマークは利用可能であるが、オーバーフィッティングの問題を避けるためには、そのようなデータセットの幅広い範囲が必要である。
この文脈では、クラスタリングアルゴリズムの公理化に関する理論的研究、特にクラスタリング保存変換の公理は、既存のアルゴリズムからラベル付きデータセットを生成するための非常に安価な方法である。
しかし、頻繁に引用されるクラインバーグ:2002 の公理系は、本論文で示すように、k$-means のような多くのアルゴリズムが作用する有限次元ユークリッド空間には適用できない。
特に、いわゆる外部整合公理は、データポイント位置の小さな変更で失敗し、内部整合公理は一般的な設定におけるアイデンティティ変換にのみ有効である。
そこで我々は,クラインバーグの内的整合性公理を中心的一貫性公理に置き換え,外的一貫性公理を運動的一貫性公理に置き換えた別の公理系を提案する。
我々は、新しいシステムが、自動調整された$k$を持つ$k$-meansの階層的なバージョンに適合していることを示し、矛盾しない。
さらに、$k$-meansは凸クラスタのみを生成するので、凹クラスタを検出するバージョンを作成することが可能であり、それでも公理系は満足できることを示す。
このような公理系の実践的応用分野は、クラスタリングアルゴリズムテストのための既存のシステムから新しいラベル付きテストデータを生成することである。
%) この欠損を伴わない置換物として重力一貫性を提案する。
関連論文リスト
- A Fresh Look at Generalized Category Discovery through Non-negative Matrix Factorization [83.12938977698988]
Generalized Category Discovery (GCD) は、ラベル付きベースデータを用いて、ベース画像と新規画像の両方を分類することを目的としている。
現在のアプローチでは、コサイン類似性に基づく共起行列 $barA$ の固有の最適化に不適切に対処している。
本稿では,これらの欠陥に対処するNon-Negative Generalized Category Discovery (NN-GCD) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T07:24:11Z) - Wide Gaps and Clustering Axioms [0.0]
k-平均は、距離に基づくクラスタリングアルゴリズムのためのクラインバーグの公理系と矛盾している。
我々は,2つの新しいクラスタビリティ特性,変分k-分離性と残留k-分離性を導入する。
我々は、k-meansを、ユークリッドおよび非ユークリッドセッティングにおけるクラインバーグの公理的フレームワークと照合する。
論文 参考訳(メタデータ) (2023-08-07T10:43:48Z) - Semi-supervised Community Detection via Structural Similarity Metrics [0.0]
本研究では,新しいノードのコミュニティラベルを推定することを目的とした,半教師付きコミュニティ検出問題について検討する。
本稿では,新しいノードとK$コミュニティ間の構造的類似度メトリック'を計算するアルゴリズムを提案する。
我々の知る限りでは、理論的な保証を提供する最初の半教師付きコミュニティ検出アルゴリズムである。
論文 参考訳(メタデータ) (2023-06-01T19:02:50Z) - Can Evolutionary Clustering Have Theoretical Guarantees? [21.343803954998915]
進化的クラスタリングは多くの成功例を見出したが、すべての結果は実証的であり、理論的な支持が欠如している。
本稿では,GSEMOの近似性能を理論的に保証できることを証明して,このギャップを埋める。
論文 参考訳(メタデータ) (2022-12-04T09:00:35Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Normalised clustering accuracy: An asymmetric external cluster validity measure [2.900810893770134]
クラスタリングアルゴリズムは、伝統的に内部または外部の妥当性尺度を用いて評価される。
本稿では、一般的に使われている古典的分割類似度スコアは、いくつかの望ましい性質を欠いていると論じる。
我々は,最適セットマッチング精度のバージョンである新しい尺度を提案し,分析する。
論文 参考訳(メタデータ) (2022-09-07T05:08:34Z) - Lattice-Based Methods Surpass Sum-of-Squares in Clustering [98.46302040220395]
クラスタリングは教師なし学習における基本的なプリミティブである。
最近の研究は、低次手法のクラスに対する低い境界を確立している。
意外なことに、この特定のクラスタリングモデルのtextitdoesは、統計的-計算的ギャップを示さない。
論文 参考訳(メタデータ) (2021-12-07T18:50:17Z) - High-dimensional separability for one- and few-shot learning [58.8599521537]
この作業は、実用的な質問、人工知能(AI)エラーの修正によって進められている。
特殊な外部デバイスである修正器が開発されている。従来のAIシステムを変更することなく、迅速かつ非イテレーティブなシステム修正を提供する必要がある。
AIシステムの新しいマルチコレクタが提示され、深層畳み込みニューラルネットワークによってエラーを予測し、新しいクラスのオブジェクトを学習する例が紹介される。
論文 参考訳(メタデータ) (2021-06-28T14:58:14Z) - Fuzzy Clustering with Similarity Queries [56.96625809888241]
ファジィ(fuzzy, soft objective)は、よく知られた$k$-means問題の一般化である。
クエリを少なくすることで、問題の解決が容易になる。
論文 参考訳(メタデータ) (2021-06-04T02:32:26Z) - A Unified Joint Maximum Mean Discrepancy for Domain Adaptation [73.44809425486767]
本論文は,最適化が容易なjmmdの統一形式を理論的に導出する。
統合JMMDから、JMMDは分類に有利な特徴ラベル依存を低下させることを示す。
本稿では,その依存を促進する新たなmmd行列を提案し,ラベル分布シフトにロバストな新しいラベルカーネルを考案する。
論文 参考訳(メタデータ) (2021-01-25T09:46:14Z) - Algebraic Ground Truth Inference: Non-Parametric Estimation of Sample
Errors by AI Algorithms [0.0]
非パラメトリックなパフォーマンス推定器は、自律的な設定において魅力的なソリューションである。
基礎的真理を持つ実験における精度推定器は100分の1よりも優れていることを示す。
本手法の実用性は,オンライン広告キャンペーンによる実世界のデータセットと,一般的な分類ベンチマークのサンプルに示される。
論文 参考訳(メタデータ) (2020-06-15T12:04:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。