Fugu-MT 論文翻訳(概要): Transferable Deep Metric Learning for Clustering

論文の概要: Transferable Deep Metric Learning for Clustering

arxiv url: http://arxiv.org/abs/2302.06523v1
Date: Mon, 13 Feb 2023 17:09:59 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-14 14:43:46.903793
Title: Transferable Deep Metric Learning for Clustering
Title（参考訳）: クラスタリングのための転送可能なDeep Metric Learning
Authors: Simo Alami.C, Rim Kaddah, Jesse Read
Abstract要約: 高い空間におけるクラスタリングは難しい作業であり、通常の次元距離のメトリクスは次元性の呪いの下ではもはや適切ではないかもしれない。ラベル付きデータセットでメトリクスを学習し、異なるデータセットにそれを適用できることを示します。少数のラベル付きトレーニングデータセットと浅いネットワークを使用しながら、最先端技術と競合する結果を得る。
参考スコア（独自算出の注目度）: 1.2762298148425795
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Clustering in high dimension spaces is a difficult task; the usual distance metrics may no longer be appropriate under the curse of dimensionality. Indeed, the choice of the metric is crucial, and it is highly dependent on the dataset characteristics. However a single metric could be used to correctly perform clustering on multiple datasets of different domains. We propose to do so, providing a framework for learning a transferable metric. We show that we can learn a metric on a labelled dataset, then apply it to cluster a different dataset, using an embedding space that characterises a desired clustering in the generic sense. We learn and test such metrics on several datasets of variable complexity (synthetic, MNIST, SVHN, omniglot) and achieve results competitive with the state-of-the-art while using only a small number of labelled training datasets and shallow networks.
Abstract（参考訳）: 高次元空間におけるクラスタリングは難しい作業であり、通常の距離メトリクスは次元性の呪いの下ではもはや適切ではないかもしれない。実際、メートル法の選択は極めて重要であり、データセットの特徴に大きく依存している。しかし、単一のメトリックを使用して、異なるドメインの複数のデータセットでクラスタリングを正しく実行することができる。転送可能なメトリックを学習するためのフレームワークを提供することを提案する。ラベル付きデータセットでメトリクスを学習し、それを異なるデータセットをクラスタ化するために適用できることを、一般的な意味で望ましいクラスタ化を特徴付ける埋め込み空間を使って示します。変動複雑性のいくつかのデータセット(合成、MNIST、SVHN、omniglot)でそのようなメトリクスを学び、少数のラベル付きトレーニングデータセットと浅いネットワークを使用して最先端技術と競合する結果を得る。

関連論文リスト

Learning Unified Distance Metric for Heterogeneous Attribute Data Clustering [60.05209293008078]
クラスタ分析のための異種属性再構成と表現(HARR)学習パラダイム HarR はパラメータフリーで収束保証され、異なる要求されたクラスタ数 $k$ に対してより効果的に自己適応することができる。
論文参考訳（メタデータ） (2026-03-03T08:13:16Z)
Bridging the Semantic Gap for Categorical Data Clustering via Large Language Models [64.58262227709842]
ARISE(Attention-weighted Representation with Integrated Semantic Embeddings)が紹介される。正確なクラスタリングのためにカテゴリデータのメトリック空間を補完するセマンティックアウェア表現を構築する。 8つのベンチマークデータセットの実験では、7つの代表的なデータセットよりも一貫した改善が示されている。
論文参考訳（メタデータ） (2026-01-03T11:37:46Z)
ESMC: MLLM-Based Embedding Selection for Explainable Multiple Clustering [79.69917150582633]
MLLM(Multi-modal large language model)は、ユーザ主導のクラスタリングを実現するために利用することができる。本手法はまず,MLLMのテキストトークンの隠蔽状態が対応する特徴と強く関連していることを明らかにする。また、擬似ラベル学習を付加した軽量クラスタリングヘッドを採用し、クラスタリング精度を大幅に向上させた。
論文参考訳（メタデータ） (2025-11-30T04:36:51Z)
CADM: Cluster-customized Adaptive Distance Metric for Categorical Data Clustering [54.20010572648918]
分類データ間の距離を直接計算できないため、分類データのクラスタリングには適切な距離メートル法が不可欠である。本稿では,クラスタ内の属性の異なる分布に基づいて距離を競合的に更新できる分類データクラスタリングのためのクラスタカストマイズド距離メトリックを提案する。
論文参考訳（メタデータ） (2025-11-08T03:24:22Z)
Global Ground Metric Learning with Applications to scRNA data [5.70896453969985]
共有距離空間上の任意の分布を学習するための新しい手法を提案する。本手法は,グローバルメトリックのような個々の点間の距離を提供するが,学習には分布レベルのクラスラベルしか必要としない。複数の疾患にまたがる患者レベルの scRNA-seq データを用いたアプローチの有効性と解釈性を示した。
論文参考訳（メタデータ） (2025-06-18T11:53:13Z)
Adaptive and Robust DBSCAN with Multi-agent Reinforcement Learning [53.527506374566485]
本稿では,多エージェント強化学習クラスタフレームワーク,すなわちAR-DBSCANを用いた新しいAdaptive and Robust DBSCANを提案する。我々は、AR-DBSCANが、NMIおよびARIメトリクスの最大144.1%と175.3%のクラスタリング精度を向上するだけでなく、支配的なパラメータを確実に見つけることができることを示した。
論文参考訳（メタデータ） (2025-05-07T11:37:23Z)
Categorical Data Clustering via Value Order Estimated Distance Metric Learning [53.28598689867732]
本稿では,分類属性を直感的に表現する新しい順序距離計量学習手法を提案する。新しい共同学習パラダイムが開発され、クラスタリングとオーダー距離メートル法学習の代替となる。提案手法は分類および混合データセットのクラスタリング精度に優れる。
論文参考訳（メタデータ） (2024-11-19T08:23:25Z)
MNIST-Nd: a set of naturalistic datasets to benchmark clustering across dimensions [46.67219141114834]
実世界のデータセットの重要な特性を共有する合成データセットの集合であるMNIST-Ndを提案する。 MNIST-NdはMNIST上で2から64の潜伏次元を持つ混合変分オートエンコーダによって得られる。 MNIST-Ndの予備的な共通クラスタリングアルゴリズムベンチマークは、ライデンが成長する次元に対して最も堅牢であることを示している。
論文参考訳（メタデータ） (2024-10-21T15:51:30Z)
Can an unsupervised clustering algorithm reproduce a categorization system? [1.0485739694839669]
ラベル付きデータセットにおいて、教師なしクラスタリングが真理クラスを再現できるかどうかを検討する。成功は特徴選択と選択した距離測定に依存することを示す。
論文参考訳（メタデータ） (2024-08-19T18:27:14Z)
Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2023-10-30T00:32:47Z)
Mixed-type Distance Shrinkage and Selection for Clustering via Kernel Metric Learning [0.0]
我々は、混合カーネルを用いて異種性を測定するKDSUMと呼ばれる計量を提案する。我々は、KDSUMが既存の混合型メトリクスから均一な異性度メトリクスへの縮小法であることを実証した。
論文参考訳（メタデータ） (2023-06-02T19:51:48Z)
DMS: Differentiable Mean Shift for Dataset Agnostic Task Specific Clustering Using Side Information [0.0]
我々は、サイド情報から直接データをクラスタリングすることを学ぶ新しいアプローチを提案する。クラスタの数、その中心、あるいは類似性に関するあらゆる種類の距離メートル法を知る必要はありません。本手法は,特定のタスクのニーズに応じて,同じデータポイントを様々な方法で分割することができる。
論文参考訳（メタデータ） (2023-05-29T13:45:49Z)
Hard Regularization to Prevent Deep Online Clustering Collapse without Data Augmentation [65.268245109828]
オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。本稿では,データ拡張を必要としない手法を提案する。
論文参考訳（メタデータ） (2023-03-29T08:23:26Z)
Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文参考訳（メタデータ） (2022-02-07T13:08:11Z)
AutoGeoLabel: Automated Label Generation for Geospatial Machine Learning [69.47585818994959]
リモートセンシングデータのためのラベルの自動生成のためのビッグデータ処理パイプラインを評価する。我々は,大規模データプラットフォームであるIBM PAIRSを用いて,密集都市部でそのようなラベルを動的に生成する。
論文参考訳（メタデータ） (2022-01-31T20:02:22Z)
Dominant Set-based Active Learning for Text Classification and its Application to Online Social Media [0.0]
本稿では,最小限のアノテーションコストで大規模未ラベルコーパスのトレーニングを行うための,プールベースのアクティブラーニング手法を提案する。提案手法には調整すべきパラメータが一切ないため,データセットに依存しない。本手法は,最先端のアクティブラーニング戦略と比較して高い性能を実現する。
論文参考訳（メタデータ） (2022-01-28T19:19:03Z)
Robust Trimmed k-means [70.88503833248159]
本稿では,外乱点とクラスタポイントを同時に識別するRobust Trimmed k-means (RTKM)を提案する。 RTKMは他の方法と競合することを示す。
論文参考訳（メタデータ） (2021-08-16T15:49:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。