論文の概要: Entropy-Aware Similarity for Balanced Clustering: A Case Study with
Melanoma Detection
- arxiv url: http://arxiv.org/abs/2305.15417v1
- Date: Thu, 11 May 2023 11:51:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-28 04:40:39.469120
- Title: Entropy-Aware Similarity for Balanced Clustering: A Case Study with
Melanoma Detection
- Title(参考訳): バランスクラスタリングにおけるエントロピー認識の類似性:メラノーマ検出例
- Authors: Seok Bin Son, Soohyun Park, Joongheon Kim
- Abstract要約: 本稿では,バランスの度合いとして定義できるエントロピー・アウェアの類似性を利用して,バランスクラスタリングの新しい手法を提案する。
我々は、クラスタリング中のバランスを最大化する平衡クラスタリング(EASB)のエントロピー対応類似性という用語を作った。
提案手法の有効性は、実際のメラノーマ中間体データ、特に国際皮膚画像コラボレーション(ISIC)2019と2020年の課題データセットに基づいて評価される。
- 参考スコア(独自算出の注目度): 11.359304766115685
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Clustering data is an unsupervised learning approach that aims to divide a
set of data points into multiple groups. It is a crucial yet demanding subject
in machine learning and data mining. Its successful applications span various
fields. However, conventional clustering techniques necessitate the
consideration of balance significance in specific applications. Therefore, this
paper addresses the challenge of imbalanced clustering problems and presents a
new method for balanced clustering by utilizing entropy-aware similarity, which
can be defined as the degree of balances. We have coined the term,
entropy-aware similarity for balanced clustering (EASB), which maximizes
balance during clustering by complementary clustering of unbalanced data and
incorporating entropy in a novel similarity formula that accounts for both
angular differences and distances. The effectiveness of the proposed approach
is evaluated on actual melanoma medial data, specifically the International
Skin Imaging Collaboration (ISIC) 2019 and 2020 challenge datasets, to
demonstrate how it can successfully cluster the data while preserving balance.
Lastly, we can confirm that the proposed method exhibited outstanding
performance in detecting melanoma, comparing to classical methods.
- Abstract(参考訳): データクラスタリングは、データポイントのセットを複数のグループに分割することを目的とした教師なしの学習アプローチである。
これは、機械学習とデータマイニングにおいて重要な課題である。
その応用は様々な分野にまたがる。
しかし、従来のクラスタリング技術では、特定のアプリケーションにおけるバランスの重要性を考慮する必要がある。
そこで本稿では,不均衡クラスタリング問題の課題に対処し,均衡度として定義できるエントロピー・アウェアの類似性を利用した新しいバランスクラスタリング手法を提案する。
本研究では,不均衡データの相補的クラスタリングによってクラスタリング中のバランスを最大化し,角度差と距離の両方を考慮に入れた新しい類似式にエントロピーを取り入れた,バランスクラスタリングのためのエントロピー対応類似性(entropy-aware similarity)という用語を作成した。
本手法の有効性は,実際のメラノーマ,特にinternational skin imaging collaboration (isic) 2019および2020 challenge datasetsを用いて評価し,バランスを保ちながらデータを効果的にクラスタ化できることを実証した。
最後に,提案手法が従来の方法と比較してメラノーマの検出に優れていたことを確認する。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - HeNCler: Node Clustering in Heterophilous Graphs through Learned Asymmetric Similarity [55.27586970082595]
HeNClerは、Heterophilous Node Clusteringの新しいアプローチである。
HeNClerは異種グラフコンテキストにおけるノードクラスタリングタスクの性能を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2024-05-27T11:04:05Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Robust and Automatic Data Clustering: Dirichlet Process meets
Median-of-Means [18.3248037914529]
本稿では,モデルに基づく手法とセントロイド方式の原理を統合することにより,効率的かつ自動的なクラスタリング手法を提案する。
クラスタリング誤差の上限に関する統計的保証は,既存のクラスタリングアルゴリズムよりも提案手法の利点を示唆している。
論文 参考訳(メタデータ) (2023-11-26T19:01:15Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Fairness in Visual Clustering: A Novel Transformer Clustering Approach [32.806921406869996]
まず、クラスタの純度の観点から、ディープクラスタリングモデルにおける人口統計バイアスを評価する。
フェアネスの側面を維持するために、すべてのクラスタに対して純粋性一貫性を促進するために、新しい損失関数が導入された。
本稿では,複数クラスタ間の相関を計測する新しいアテンション機構であるクロスアテンションを提案する。
論文 参考訳(メタデータ) (2023-04-14T21:59:32Z) - Likelihood Adjusted Semidefinite Programs for Clustering Heterogeneous
Data [16.153709556346417]
クラスタリングは広くデプロイされた学習ツールである。
iLA-SDPはEMよりも感度が低く、高次元データでは安定である。
論文 参考訳(メタデータ) (2022-09-29T21:03:13Z) - Data-heterogeneity-aware Mixing for Decentralized Learning [63.83913592085953]
グラフの混合重みとノード間のデータ不均一性の関係に収束の依存性を特徴付ける。
グラフが現在の勾配を混合する能力を定量化する計量法を提案する。
そこで本研究では,パラメータを周期的かつ効率的に最適化する手法を提案する。
論文 参考訳(メタデータ) (2022-04-13T15:54:35Z) - Deep Conditional Gaussian Mixture Model for Constrained Clustering [7.070883800886882]
制約付きクラスタリングは、部分的にラベル付けされたデータの増加量に関する事前情報を利用することができる。
本稿では、直感的で解釈可能で、勾配変動推論の枠組みで効率的に訓練できる制約付きクラスタリングのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-11T13:38:09Z) - Consistent Estimation of Identifiable Nonparametric Mixture Models from
Grouped Observations [84.81435917024983]
この研究は、グループ化された観測から任意の同定可能な混合モデルを一貫して推定するアルゴリズムを提案する。
ペア化された観測のために実践的な実装が提供され、アプローチは既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-06-12T20:44:22Z) - Blocked Clusterwise Regression [0.0]
我々は、各ユニットが複数の潜伏変数を持つことを可能にすることで、離散的非観測的不均一性に対する以前のアプローチを一般化する。
我々は,クラスタの過剰な数のクラスタリングの理論に寄与し,この設定に対する新たな収束率を導出する。
論文 参考訳(メタデータ) (2020-01-29T23:29:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。