論文の概要: Comparing Euclidean and Hyperbolic K-Means for Generalized Category Discovery
- arxiv url: http://arxiv.org/abs/2602.04932v1
- Date: Wed, 04 Feb 2026 12:40:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.556278
- Title: Comparing Euclidean and Hyperbolic K-Means for Generalized Category Discovery
- Title(参考訳): 一般カテゴリー発見のためのユークリッドと双曲K平均の比較
- Authors: Mohamad Dalal, Thomas B. Moeslund, Joakim Bruslund Haurum,
- Abstract要約: ハイパボリッククラスタリングGCD(HC-GCD)について紹介する。
HC-GCDは、双曲幾何学のローレンツ・ハイパーボロイドモデルへの埋め込みを学習し、これらの埋め込みを双曲K-Meansアルゴリズムを用いて双曲空間に直接クラスタ化する。
双曲K平均はユークリッドK平均よりも精度が高いことを示す。
- 参考スコア(独自算出の注目度): 21.17471771009869
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hyperbolic representation learning has been widely used to extract implicit hierarchies within data, and recently it has found its way to the open-world classification task of Generalized Category Discovery (GCD). However, prior hyperbolic GCD methods only use hyperbolic geometry for representation learning and transform back to Euclidean geometry when clustering. We hypothesize this is suboptimal. Therefore, we present Hyperbolic Clustered GCD (HC-GCD), which learns embeddings in the Lorentz Hyperboloid model of hyperbolic geometry, and clusters these embeddings directly in hyperbolic space using a hyperbolic K-Means algorithm. We test our model on the Semantic Shift Benchmark datasets, and demonstrate that HC-GCD is on par with the previous state-of-the-art hyperbolic GCD method. Furthermore, we show that using hyperbolic K-Means leads to better accuracy than Euclidean K-Means. We carry out ablation studies showing that clipping the norm of the Euclidean embeddings leads to decreased accuracy in clustering unseen classes, and increased accuracy for seen classes, while the overall accuracy is dataset dependent. We also show that using hyperbolic K-Means leads to more consistent clusters when varying the label granularity.
- Abstract(参考訳): 双曲表現学習は、データ内の暗黙の階層を抽出するために広く用いられており、近年、一般化カテゴリー発見(Generalized Category Discovery, GCD)のオープンワールド分類タスクへの道を見出した。
しかし、従来の双曲型GCD法は、表現学習に双曲幾何学のみを使用し、クラスタリング時にユークリッド幾何学に変換する。
これは最適ではないと仮定する。
そこで我々は,双曲幾何学のローレンツ・ハイパーボロイドモデルへの埋め込みを学習し,これらの埋め込みを双曲K-Meansアルゴリズムを用いて双曲空間に直接クラスタ化するハイパーボリッククラスタリングGCD(HC-GCD)を提案する。
本稿では,Semantic Shift Benchmarkデータセットを用いて実験を行い,HC-GCDが従来のハイパーボリックGCD法と同等であることを示す。
さらに, 双曲K平均はユークリッドK平均よりも精度が高いことを示す。
本研究では,ユークリッド埋め込みの基準をクリッピングすることで,目に見えないクラスをクラスタリングする際の精度が低下し,参照クラスに対する精度が向上し,全体の精度がデータセットに依存していることを示すアブレーション研究を行った。
また, 双曲的K-平均を用いることで, ラベルの粒度が変化すると, より一貫したクラスタが得られることを示す。
関連論文リスト
- Hyperbolic Gaussian Blurring Mean Shift: A Statistical Mode-Seeking Framework for Clustering in Curved Spaces [15.555757275390846]
クラスタリングは、データのパターンを明らかにするための基本的な教師なしの学習タスクである。
本稿では,双曲空間へのGBMSの新たな拡張であるHypeGBMSを紹介する。
我々の手法はユークリッド計算を双曲距離に置き換え、すべての更新が空間の幾何学と整合性を保つためにMbius重み付き手段を用いる。
論文 参考訳(メタデータ) (2025-12-12T10:40:26Z) - Hyperbolic Category Discovery [12.654574453480635]
Generalized Category Discovery (GCD) は、既知のクラスや未知のクラスに属するかに関わらず、未ラベルのサブセット内のすべてのイメージを分類することを目的としている。
GCDのための階層認識表現と分類器を学習するためのハイパーボリックフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-08T15:12:33Z) - Clustering in hyperbolic balls [0.0]
双曲球に$k$-meansクラスタリングを導入する。
第2に、双曲球における新しい確率分布の混合を学習するための期待最大化(EM)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-01-31T16:03:06Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Hyperbolic Delaunay Geometric Alignment [52.835250875177756]
双曲空間におけるデータセットの比較のための類似度スコアを提案する。
中心となる考え方は、与えられた集合をまたいだデータポイントを接続する双曲デラウネーグラフのエッジを数えることである。
人工および実生活の生物学的データに関する実証的研究を行い、HyperDGAが集合間の古典的距離の双曲バージョンより優れていることを示す。
論文 参考訳(メタデータ) (2024-04-12T17:14:58Z) - Hyperbolic vs Euclidean Embeddings in Few-Shot Learning: Two Sides of
the Same Coin [49.12496652756007]
この結果から, 共通の双曲半径での双曲埋め込みが達成できることが示唆された。
従来のベンチマーク結果とは対照的に、ユークリッド計量を備えた固定半径エンコーダにより、より良い性能が得られることを示す。
論文 参考訳(メタデータ) (2023-09-18T14:51:46Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Differentiating through the Fr\'echet Mean [51.32291896926807]
フレット平均(Fr'echet mean)はユークリッド平均の一般化である。
任意のリーマン多様体に対して Fr'echet 平均を微分する方法を示す。
これにより、Fr'echet平均を双曲型ニューラルネットワークパイプラインに完全に統合する。
論文 参考訳(メタデータ) (2020-02-29T19:49:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。