Fugu-MT 論文翻訳(概要): A Scalable k-Medoids Clustering via Whale Optimization Algorithm

論文の概要: A Scalable k-Medoids Clustering via Whale Optimization Algorithm

arxiv url: http://arxiv.org/abs/2408.16993v1
Date: Fri, 30 Aug 2024 03:43:37 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-02 16:29:13.329696
Title: A Scalable k-Medoids Clustering via Whale Optimization Algorithm
Title（参考訳）: 鯨最適化アルゴリズムによるスケーラブルk-メドイドクラスタリング
Authors: Huang Chenan, Narumasa Tsutsumida,
Abstract要約: We introduced WOA-kMedoids, a novel unsupervised clustering method which with the Whale Optimization Algorithm (WOA)。セントロイド選択を最適化することにより、WOA-kMedoidsは観測数に関してk-メドロイドアルゴリズムの計算複雑性を2次からほぼ直線に減らす。 UCRアーカイブから25種類の時系列データセットを用いたWOA-kMedoidsの性能評価を行った。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Unsupervised clustering has emerged as a critical tool for uncovering hidden patterns and insights from vast, unlabeled datasets. However, traditional methods like Partitioning Around Medoids (PAM) struggle with scalability due to their quadratic computational complexity. To address this limitation, we introduce WOA-kMedoids, a novel unsupervised clustering method that incorporates the Whale Optimization Algorithm (WOA), a nature-inspired metaheuristic inspired by the hunting strategies of humpback whales. By optimizing centroid selection, WOA-kMedoids reduces computational complexity of the k-medoids algorithm from quadratic to near-linear with respect to the number of observations. This improvement in efficiency enables WOA-kMedoids to be scalable to large datasets while maintaining high clustering accuracy. We evaluated the performance of WOA-kMedoids on 25 diverse time series datasets from the UCR archive. Our empirical results demonstrate that WOA-kMedoids maintains clustering accuracy similar to PAM. While WOA-kMedoids exhibited slightly higher runtime than PAM on small datasets (less than 300 observations), it outperformed PAM in computational efficiency on larger datasets. The scalability of WOA-kMedoids, combined with its consistently high accuracy, positions it as a promising and practical choice for unsupervised clustering in big data applications. WOA-kMedoids has implications for efficient knowledge discovery in massive, unlabeled datasets across various domains.
Abstract（参考訳）: 教師なしクラスタリングは、巨大なラベルのないデータセットから隠れたパターンや洞察を明らかにするための重要なツールとして登場した。しかしながら、PAM(Partitioning Around Medoids)のような従来の手法は、2次計算の複雑さのためにスケーラビリティに苦慮している。 WOA-kMedoids, Whale Optimization Algorithm (WOA)を組み込んだ非教師型クラスタリング手法を導入する。セントロイド選択を最適化することにより、WOA-kMedoidsは観測数に関してk-メドロイドアルゴリズムの計算複雑性を2次からほぼ直線に減らす。この効率の改善により、WOA-kMedoidsはクラスタリングの精度を高く保ちながら、大規模なデータセットにスケーラブルになる。 UCRアーカイブから25種類の時系列データセットを用いたWOA-kMedoidsの性能評価を行った。実験の結果, WOA-kMedoids は PAM と同様のクラスタリング精度を維持していることがわかった。 WOA-kMedoids は小さなデータセットでは PAM よりも若干高いランタイムを示し(300観測未満)、より大きなデータセットでは計算効率で PAM を上回った。 WOA-kMedoidsのスケーラビリティは、その一貫した精度と相まって、ビッグデータアプリケーションにおける教師なしクラスタリングのための有望かつ実践的な選択肢として位置づけられている。 WOA-kMedoidsは、様々な領域にわたる大規模でラベル付けされていないデータセットにおいて、効率的な知識発見に影響を及ぼす。

関連論文リスト

Differential-UMamba: Rethinking Tumor Segmentation Under Limited Data Scenarios [3.1231963031043786]
Diff-UMambaは、UNetフレームワークとmambaメカニズムを組み合わせて長距離依存関係をモデル化する新しいアーキテクチャである。 Diff-UMambaの中心部にはノイズ低減モジュールがあり、ノイズや無関係なアクティベーションを抑制するための信号差分戦略を採用している。このアーキテクチャは、特に低データ設定において、セグメンテーションの精度と堅牢性を改善する。
論文参考訳（メタデータ） (2025-07-24T08:23:11Z)
A Comparison of Deep Learning Methods for Cell Detection in Digital Cytology [1.607370483729741]
Papanicolaou-stained cytological Whole Slide Images (WSIs) における細胞検出のためのDeep Learning (DL) 法の性能評価を行った。市販のアルゴリズムとカスタム設計の検出器について検討し、2つのデータセットに適用する。その結果、特に改良された完全畳み込み回帰ネットワーク(IFCRN)法は、検出精度と計算効率の両方の観点からセグメンテーションに基づく手法よりも優れていた。
論文参考訳（メタデータ） (2025-04-09T15:08:12Z)
Enhanced ECG Arrhythmia Detection Accuracy by Optimizing Divergence-Based Data Fusion [5.575308369829893]
ケルネル密度推定(KDE)とクルバック・リーブラー(KL)の発散を利用した特徴量に基づく融合アルゴリズムを提案する。健常者2000名, 病人2000名から収集した心電図による社内データセットを用いて, PTB-XLデータセットを用いて本手法の検証を行った。その結果, 本手法は, 統合データセットにおける異常心電図症例の特徴に基づく分類精度を大幅に向上させることを示した。
論文参考訳（メタデータ） (2025-03-19T12:16:48Z)
Towards Learnable Anchor for Deep Multi-View Clustering [49.767879678193005]
本稿では,線形時間でクラスタリングを行うDeep Multi-view Anchor Clustering (DMAC)モデルを提案する。最適なアンカーを用いて、全サンプルグラフを計算し、クラスタリングのための識別的埋め込みを導出する。いくつかのデータセットの実験では、最先端の競合に比べてDMACの性能と効率が優れていることが示されている。
論文参考訳（メタデータ） (2025-03-16T09:38:11Z)
OneBatchPAM: A Fast and Frugal K-Medoids Algorithm [6.69456225406097]
本稿では,大規模データセットを適切な計算時間とメモリの複雑さで処理する新しいk-medoids近似アルゴリズムを提案する。単一のサイズ m n のバッチは、ほとんどの k-メディドのベースラインと比較して、O(n2) ではなく、必要なメモリサイズとペアの異なる計算数を O(mn) に減少させる。我々は,m = O(log(n)) のバッチが強い確率で元の局所探索アルゴリズムと同じ性能を保証するのに十分であることを示す理論的結果を得る。
論文参考訳（メタデータ） (2025-01-31T16:48:16Z)
SMILE-UHURA Challenge -- Small Vessel Segmentation at Mesoscopic Scale from Ultra-High Resolution 7T Magnetic Resonance Angiograms [60.35639972035727]
公開されている注釈付きデータセットの欠如は、堅牢で機械学習駆動のセグメンテーションアルゴリズムの開発を妨げている。 SMILE-UHURAチャレンジは、7T MRIで取得したTime-of-Flightアンジオグラフィーの注釈付きデータセットを提供することで、公開されている注釈付きデータセットのギャップに対処する。 Diceスコアは、それぞれのデータセットで0.838 $pm$0.066と0.716 $pm$ 0.125まで到達し、平均パフォーマンスは0.804 $pm$ 0.15までになった。
論文参考訳（メタデータ） (2024-11-14T17:06:00Z)
K-Means Clustering With Incomplete Data with the Use of Mahalanobis Distances [0.0]
我々は従来のユークリッド距離の代わりにマハラノビス距離を組み込む統一K平均アルゴリズムを開発した。我々のアルゴリズムはスタンドアローンの計算とK平均の両方を一貫して上回ることを示す。これらの結果は、IRISデータセットと楕円型クラスタでランダムに生成されたデータの両方にわたって保持される。
論文参考訳（メタデータ） (2024-10-31T00:05:09Z)
Boosting K-means for Big Data by Fusing Data Streaming with Global Optimization [0.3069335774032178]
K平均クラスタリングはデータマイニングの基盤であるが、その効率は大量のデータセットに直面すると悪化する。可変近傍探索(VNS)メタヒューリスティックを利用して,K平均クラスタリングをビッグデータに最適化する新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-10-18T15:43:34Z)
Artificial Data Point Generation in Clustered Latent Space for Small Medical Datasets [4.542616945567623]
本稿では,クラスタ化潜在空間(AGCL)における人工データポイント生成手法を提案する。 AGCLは、合成データ生成により、小さな医療データセットの分類性能を向上させるように設計されている。顔の表情データを利用してパーキンソン病検診に応用した。
論文参考訳（メタデータ） (2024-09-26T09:51:08Z)
Minimally Supervised Learning using Topological Projections in Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文参考訳（メタデータ） (2024-01-12T22:51:48Z)
A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文参考訳（メタデータ） (2023-12-17T04:41:07Z)
The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文参考訳（メタデータ） (2023-09-13T10:40:41Z)
Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文参考訳（メタデータ） (2023-06-15T17:55:05Z)
Bootstrapping Your Own Positive Sample: Contrastive Learning With Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。 EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文参考訳（メタデータ） (2021-04-07T06:02:04Z)
Federated Deep AUC Maximization for Heterogeneous Data with a Constant Communication Complexity [77.78624443410216]
異種胸部データ検出のための改良型FDAMアルゴリズムを提案する。本研究は,提案アルゴリズムの通信が機械数に強く依存し,精度レベルにも強く依存していることを示す。 FDAMアルゴリズムのベンチマークデータセットと、異なる組織の医療用胸部X線画像に対する効果を実験により実証した。
論文参考訳（メタデータ） (2021-02-09T04:05:19Z)
SumGNN: Multi-typed Drug Interaction Prediction via Efficient Knowledge Graph Summarization [64.56399911605286]
本稿では,サブグラフ抽出モジュールによって実現された知識要約グラフニューラルネットワークSumGNNを提案する。 SumGNNは5.54%まで最高のベースラインを上回り、データ関係の低いタイプでは特にパフォーマンスの向上が顕著である。
論文参考訳（メタデータ） (2020-10-04T00:14:57Z)
BanditPAM: Almost Linear Time $k$-Medoids Clustering via Multi-Armed Bandits [16.1767275655842]
現在の$k$-medoidsクラスタリングアルゴリズム、例えば、PAM(Partitioning Around Medoids)は反復的であり、各イテレーションで$n$のデータセットサイズであり、大規模なデータセットでは極めて高価である。マルチアームバンディットの技法にインスパイアされたランダム化アルゴリズムであるBanditPAMを提案する。これは、PAMの繰り返しの複雑さを$O(n2)$から$O(n log n)$に減らし、実際に保持されるデータに対する仮定の下で、高い確率で同じ結果を返す。我々は、コーディングを含むいくつかの大規模な実世界のデータセットで実験的に結果を検証する。
論文参考訳（メタデータ） (2020-06-11T22:17:16Z)
ROAM: Random Layer Mixup for Semi-Supervised Learning in Medical Imaging [43.26668942258135]
医療画像のセグメンテーションは、機械学習の手法が抱える大きな課題の1つだ。我々はRandOm lAyer MixupのROAMを提案する。 ROAMは、全脳セグメンテーションに対してそれぞれ2.40%と16.50%の相対的な改善を施した、完全に監督された(89.5%)と半監督された(87.0%)設定のSOTA(State-of-the-art)を達成している。
論文参考訳（メタデータ） (2020-03-20T18:07:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。