論文の概要: A Scalable Approach to Clustering Embedding Projections
- arxiv url: http://arxiv.org/abs/2504.07285v1
- Date: Wed, 09 Apr 2025 21:24:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-11 12:24:28.252427
- Title: A Scalable Approach to Clustering Embedding Projections
- Title(参考訳): クラスタリング・エンベッド・プロジェクションへのスケーラブルなアプローチ
- Authors: Donghao Ren, Fred Hohman, Dominik Moritz,
- Abstract要約: 本稿では, 点ではなく, 投影された2次元空間におけるカーネル密度推定を用いた効率的なクラスタリング手法について述べる。
このアルゴリズムは、数百ミリ秒で2次元密度マップから高品質なクラスタ領域を生成することができる。
- 参考スコア(独自算出の注目度): 17.968152209605908
- License:
- Abstract: Interactive visualization of embedding projections is a useful technique for understanding data and evaluating machine learning models. Labeling data within these visualizations is critical for interpretation, as labels provide an overview of the projection and guide user navigation. However, most methods for producing labels require clustering the points, which can be computationally expensive as the number of points grows. In this paper, we describe an efficient clustering approach using kernel density estimation in the projected 2D space instead of points. This algorithm can produce high-quality cluster regions from a 2D density map in a few hundred milliseconds, orders of magnitude faster than current approaches. We contribute the design of the algorithm, benchmarks, and applications that demonstrate the utility of the algorithm, including labeling and summarization.
- Abstract(参考訳): 埋め込みプロジェクションのインタラクティブな可視化は、データの理解と機械学習モデルの評価に有用である。
これらのビジュアライゼーション内のデータのラベル付けは、プロジェクションの概要とユーザナビゲーションのガイドを提供するため、解釈に不可欠である。
しかしながら、ラベルを生成するほとんどの方法はポイントをクラスタリングする必要があるが、ポイントの数が増えるにつれて計算的にコストがかかる可能性がある。
本稿では,点ではなく投影された2次元空間におけるカーネル密度推定を用いた効率的なクラスタリング手法について述べる。
このアルゴリズムは、数百ミリ秒で2次元密度マップから高品質なクラスタ領域を生成することができる。
ラベル付けや要約を含むアルゴリズムの有用性を実証するアルゴリズム,ベンチマーク,アプリケーションの設計に貢献する。
関連論文リスト
- Label Learning Method Based on Tensor Projection [82.51786483693206]
テンソルプロジェクション(LLMTP)に基づくラベル学習手法を提案する。
行列射影変換をテンソル射影に拡張し、ビュー間の空間構造情報を活用できるようにする。
さらに、テンソルのSchatten $p$-norm正規化を導入し、異なるビューのクラスタリングラベル行列を可能な限り一貫性を持たせる。
論文 参考訳(メタデータ) (2024-02-26T13:03:26Z) - A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Deep Multi-View Subspace Clustering with Anchor Graph [11.291831842959926]
アンカーグラフ(DMCAG)を用いた深層多視点サブスペースクラスタリング手法を提案する。
DMCAGは各ビューの埋め込み機能を独立して学習し、サブスペース表現を得るために使用される。
本手法は他の最先端手法よりも優れたクラスタリング性能を実現する。
論文 参考訳(メタデータ) (2023-05-11T16:17:43Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z) - A Dynamical Systems Algorithm for Clustering in Hyperspectral Imagery [0.18374319565577152]
ハイパースペクトル画像におけるクラスタリングのための新しい動的システムアルゴリズムを提案する。
このアルゴリズムの主な考え方は、密度を増加させる方向に「データポイントが押される」ことであり、同じ密度の領域に終わるピクセル群は同じクラスに属する。
本手法は, 既定素材のクラスを基礎事実として, k-means アルゴリズムと性能を比較した都市景観におけるアルゴリズムの評価を行う。
論文 参考訳(メタデータ) (2022-07-21T17:31:57Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds [54.73161039445703]
本稿では,ポイントレベルのアノテーションのみを用いて訓練された典型的なオブジェクト検出を可能にする,新たな自己学習手法を提案する。
トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点の推定を監督する。
実験の結果,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-25T02:14:42Z) - Clustering with Tangles: Algorithmic Framework and Theoretical
Guarantees [10.992467680364962]
本稿では,機械学習応用におけるトライアングルの実用可能性を示す。
任意のデータセットのカットの集合が与えられたとき、トライアングルはこれらのカットを密集構造の方向を指し示すために集約する。
タングルを用いたクラスタリングのためのアルゴリズムフレームワークを構築し、様々な設定で理論的保証を証明し、広範囲なシミュレーションとユースケースを提供する。
論文 参考訳(メタデータ) (2020-06-25T14:23:56Z) - Flow-based Algorithms for Improving Clusters: A Unifying Framework,
Software, and Performance [0.0]
グラフ内のベクトル空間やノードのクラスタリングポイントは、統計データ解析においてユビキタスプリミティブである。
このクラスタ改善問題に対するアルゴリズムの原則に着目する。
ローカルGraphClustering Pythonパッケージでこれらのアルゴリズムの効率的な実装を開発します。
論文 参考訳(メタデータ) (2020-04-20T20:14:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。