論文の概要: Exploring dual information in distance metric learning for clustering
- arxiv url: http://arxiv.org/abs/2105.12703v1
- Date: Wed, 26 May 2021 17:33:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-27 15:31:31.119236
- Title: Exploring dual information in distance metric learning for clustering
- Title(参考訳): クラスタリングのための距離メトリック学習における二重情報探索
- Authors: Rodrigo Randel and Daniel Aloise and Alain Hertz
- Abstract要約: 本稿では,半教師付きクラスタリング問題の対の制約に付随する2つの情報を活用することを提案する。
実験により、距離メトリック学習アルゴリズムは、この2つの情報を統合することの利点を明らかに示している。
- 参考スコア(独自算出の注目度): 1.452875650827562
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Distance metric learning algorithms aim to appropriately measure similarities
and distances between data points. In the context of clustering, metric
learning is typically applied with the assist of side-information provided by
experts, most commonly expressed in the form of cannot-link and must-link
constraints. In this setting, distance metric learning algorithms move closer
pairs of data points involved in must-link constraints, while pairs of points
involved in cannot-link constraints are moved away from each other. For these
algorithms to be effective, it is important to use a distance metric that
matches the expert knowledge, beliefs, and expectations, and the
transformations made to stick to the side-information should preserve
geometrical properties of the dataset. Also, it is interesting to filter the
constraints provided by the experts to keep only the most useful and reject
those that can harm the clustering process. To address these issues, we propose
to exploit the dual information associated with the pairwise constraints of the
semi-supervised clustering problem. Experiments clearly show that distance
metric learning algorithms benefit from integrating this dual information.
- Abstract(参考訳): 距離メトリック学習アルゴリズムは、データポイント間の類似性と距離を適切に測定することを目的としている。
クラスタリングの文脈では、メトリックラーニングは一般的に専門家が提供したサイド情報の補助として適用され、最も一般的には「不可能リンク」と「必然的リンク制約」という形で表現される。
この設定では、距離メトリック学習アルゴリズムは、必然的なリンク制約に関連するデータポイントのペアを移動させ、一方、不可能リンク制約に関わるポイントのペアは互いに離れる。
これらのアルゴリズムが効果的であるためには、専門家の知識、信念、期待に合致した距離メトリックを使うことが重要であり、サイド情報に固執する変換はデータセットの幾何学的性質を保存すべきである。
また、専門家が提供した制約をフィルタリングして、最も有用なものだけを保持し、クラスタリングプロセスに害を与えるものだけを拒絶することも興味深い。
これらの問題に対処するため,我々は,半教師付きクラスタリング問題のペアワイズ制約に関連する2つの情報を活用することを提案する。
実験によれば、距離メトリック学習アルゴリズムは、この2つの情報を統合することで恩恵を受ける。
関連論文リスト
- Distribution-Based Trajectory Clustering [14.781854651899705]
軌道クラスタリングは、軌道データの共通パターンの発見を可能にする。
距離測定には高い計算コストと低い忠実度という2つの課題がある。
我々は,最近の分散カーネル(IDK)を3つの課題に対処するための主要なツールとして利用することを提案する。
論文 参考訳(メタデータ) (2023-10-08T11:28:34Z) - On Leave-One-Out Conditional Mutual Information For Generalization [122.2734338600665]
残余条件付き相互情報(loo-CMI)の新しい尺度に基づく教師付き学習アルゴリズムのための情報理論の一般化境界を導出する。
他のCMI境界とは対照的に、我々のloo-CMI境界は容易に計算でき、古典的なout-out-out-cross-validationのような他の概念と関連して解釈できる。
ディープラーニングのシナリオにおいて予測された一般化ギャップを評価することにより,境界の質を実証的に検証する。
論文 参考訳(メタデータ) (2022-07-01T17:58:29Z) - Constrained Clustering and Multiple Kernel Learning without Pairwise
Constraint Relaxation [15.232192645789485]
本稿では,データを協調的にクラスタリングし,利用可能なペアワイズ制約に従ってカーネルを学習する,制約付きクラスタリングアルゴリズムを提案する。
提案手法は,多種多様な公開データセットにおいて,既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-03-23T17:07:53Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Ranking Distance Calibration for Cross-Domain Few-Shot Learning [91.22458739205766]
数ショット学習の最近の進歩は、より現実的なクロスドメイン設定を促進する。
ドメインギャップとソースとターゲットデータセット間のラベル空間の相違により、共有される知識は極めて限られている。
我々は,タスク内の相互k-アネレスト近傍を発見することで,目標距離行列の校正を行う。
論文 参考訳(メタデータ) (2021-12-01T03:36:58Z) - Deep Relational Metric Learning [84.95793654872399]
本稿では,画像クラスタリングと検索のためのディープリレーショナルメトリック学習フレームワークを提案する。
我々は、クラス間分布とクラス内分布の両方をモデル化するために、異なる側面から画像を特徴付ける特徴のアンサンブルを学ぶ。
広く使われているCUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、我々のフレームワークが既存の深層学習方法を改善し、非常に競争力のある結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-08-23T09:31:18Z) - (k, l)-Medians Clustering of Trajectories Using Continuous Dynamic Time
Warping [57.316437798033974]
本研究では,トラジェクトリの集中型クラスタリングの問題について考察する。
我々はDTWの連続バージョンを距離測定として使用することを提案し、これをCDTW(Continuous dynamic time warping)と呼ぶ。
一連の軌道から中心を計算し、その後反復的に改善する実践的な方法を示す。
論文 参考訳(メタデータ) (2020-12-01T13:17:27Z) - Towards Certified Robustness of Distance Metric Learning [53.96113074344632]
我々は,距離学習アルゴリズムの一般化とロバスト性を改善するために,入力空間に逆のマージンを付与することを提唱する。
アルゴリズム的ロバスト性の理論手法を用いることにより,拡張マージンは一般化能力に有益であることを示す。
論文 参考訳(メタデータ) (2020-06-10T16:51:53Z) - Learning Flat Latent Manifolds with VAEs [16.725880610265378]
本稿では、ユークリッド計量がデータポイント間の類似性のプロキシとなる変分自動エンコーダのフレームワークの拡張を提案する。
我々は、変分オートエンコーダで一般的に使用されるコンパクトな以前のものを、最近発表されたより表現力のある階層型に置き換える。
提案手法は,ビデオ追跡ベンチマークを含む,さまざまなデータセットを用いて評価する。
論文 参考訳(メタデータ) (2020-02-12T09:54:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。