論文の概要: Entropy-Aware Similarity for Balanced Clustering: A Case Study with
Melanoma Detection
- arxiv url: http://arxiv.org/abs/2305.15417v1
- Date: Thu, 11 May 2023 11:51:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-28 04:40:39.469120
- Title: Entropy-Aware Similarity for Balanced Clustering: A Case Study with
Melanoma Detection
- Title(参考訳): バランスクラスタリングにおけるエントロピー認識の類似性:メラノーマ検出例
- Authors: Seok Bin Son, Soohyun Park, Joongheon Kim
- Abstract要約: 本稿では,バランスの度合いとして定義できるエントロピー・アウェアの類似性を利用して,バランスクラスタリングの新しい手法を提案する。
我々は、クラスタリング中のバランスを最大化する平衡クラスタリング(EASB)のエントロピー対応類似性という用語を作った。
提案手法の有効性は、実際のメラノーマ中間体データ、特に国際皮膚画像コラボレーション(ISIC)2019と2020年の課題データセットに基づいて評価される。
- 参考スコア(独自算出の注目度): 11.359304766115685
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Clustering data is an unsupervised learning approach that aims to divide a
set of data points into multiple groups. It is a crucial yet demanding subject
in machine learning and data mining. Its successful applications span various
fields. However, conventional clustering techniques necessitate the
consideration of balance significance in specific applications. Therefore, this
paper addresses the challenge of imbalanced clustering problems and presents a
new method for balanced clustering by utilizing entropy-aware similarity, which
can be defined as the degree of balances. We have coined the term,
entropy-aware similarity for balanced clustering (EASB), which maximizes
balance during clustering by complementary clustering of unbalanced data and
incorporating entropy in a novel similarity formula that accounts for both
angular differences and distances. The effectiveness of the proposed approach
is evaluated on actual melanoma medial data, specifically the International
Skin Imaging Collaboration (ISIC) 2019 and 2020 challenge datasets, to
demonstrate how it can successfully cluster the data while preserving balance.
Lastly, we can confirm that the proposed method exhibited outstanding
performance in detecting melanoma, comparing to classical methods.
- Abstract(参考訳): データクラスタリングは、データポイントのセットを複数のグループに分割することを目的とした教師なしの学習アプローチである。
これは、機械学習とデータマイニングにおいて重要な課題である。
その応用は様々な分野にまたがる。
しかし、従来のクラスタリング技術では、特定のアプリケーションにおけるバランスの重要性を考慮する必要がある。
そこで本稿では,不均衡クラスタリング問題の課題に対処し,均衡度として定義できるエントロピー・アウェアの類似性を利用した新しいバランスクラスタリング手法を提案する。
本研究では,不均衡データの相補的クラスタリングによってクラスタリング中のバランスを最大化し,角度差と距離の両方を考慮に入れた新しい類似式にエントロピーを取り入れた,バランスクラスタリングのためのエントロピー対応類似性(entropy-aware similarity)という用語を作成した。
本手法の有効性は,実際のメラノーマ,特にinternational skin imaging collaboration (isic) 2019および2020 challenge datasetsを用いて評価し,バランスを保ちながらデータを効果的にクラスタ化できることを実証した。
最後に,提案手法が従来の方法と比較してメラノーマの検出に優れていたことを確認する。
関連論文リスト
- Robust and Automatic Data Clustering: Dirichlet Process meets
Median-of-Means [18.3248037914529]
本稿では,モデルに基づく手法とセントロイド方式の原理を統合することにより,効率的かつ自動的なクラスタリング手法を提案する。
クラスタリング誤差の上限に関する統計的保証は,既存のクラスタリングアルゴリズムよりも提案手法の利点を示唆している。
論文 参考訳(メタデータ) (2023-11-26T19:01:15Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Fairness in Visual Clustering: A Novel Transformer Clustering Approach [32.806921406869996]
まず、クラスタの純度の観点から、ディープクラスタリングモデルにおける人口統計バイアスを評価する。
フェアネスの側面を維持するために、すべてのクラスタに対して純粋性一貫性を促進するために、新しい損失関数が導入された。
本稿では,複数クラスタ間の相関を計測する新しいアテンション機構であるクロスアテンションを提案する。
論文 参考訳(メタデータ) (2023-04-14T21:59:32Z) - Likelihood Adjusted Semidefinite Programs for Clustering Heterogeneous
Data [16.153709556346417]
クラスタリングは広くデプロイされた学習ツールである。
iLA-SDPはEMよりも感度が低く、高次元データでは安定である。
論文 参考訳(メタデータ) (2022-09-29T21:03:13Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Simplex Clustering via sBeta with Applications to Online Adjustment of
Black-Box Predictions [17.10067035969846]
我々はk-sBetasと呼ばれる新しい確率的クラスタリング手法を提案する。
クラスタリング分布の一般的な視点を提供し、歪みに基づく手法に基づく統計モデルでは十分説明できないことを強調する。
本定式化は,クラスタデータのモデリングにおける様々なパラメトリック密度を近似し,クラスタバランスバイアスの制御を可能にする。
論文 参考訳(メタデータ) (2022-07-30T18:29:11Z) - Data-heterogeneity-aware Mixing for Decentralized Learning [63.83913592085953]
グラフの混合重みとノード間のデータ不均一性の関係に収束の依存性を特徴付ける。
グラフが現在の勾配を混合する能力を定量化する計量法を提案する。
そこで本研究では,パラメータを周期的かつ効率的に最適化する手法を提案する。
論文 参考訳(メタデータ) (2022-04-13T15:54:35Z) - Deep Conditional Gaussian Mixture Model for Constrained Clustering [7.070883800886882]
制約付きクラスタリングは、部分的にラベル付けされたデータの増加量に関する事前情報を利用することができる。
本稿では、直感的で解釈可能で、勾配変動推論の枠組みで効率的に訓練できる制約付きクラスタリングのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-11T13:38:09Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Consistent Estimation of Identifiable Nonparametric Mixture Models from
Grouped Observations [84.81435917024983]
この研究は、グループ化された観測から任意の同定可能な混合モデルを一貫して推定するアルゴリズムを提案する。
ペア化された観測のために実践的な実装が提供され、アプローチは既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-06-12T20:44:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。