論文の概要: Pairwise Adjusted Mutual Information
- arxiv url: http://arxiv.org/abs/2103.12641v1
- Date: Tue, 23 Mar 2021 15:51:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-24 19:13:40.931275
- Title: Pairwise Adjusted Mutual Information
- Title(参考訳): Pairwise Adjusted Mutual Information
- Authors: Denys Lazarenko, Thomas Bonald
- Abstract要約: 完全ラベル順列ではなく,ペアワイズラベル順列に基づく新しい適応法を提案する。
対応する調整されたメトリックは、クラスタリングの品質を評価するための標準調整された相互情報と同様の振る舞いを示す。
- 参考スコア(独自算出の注目度): 9.848252984349603
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A well-known metric for quantifying the similarity between two clusterings is
the adjusted mutual information. Compared to mutual information, a corrective
term based on random permutations of the labels is introduced, preventing two
clusterings being similar by chance. Unfortunately, this adjustment makes the
metric computationally expensive. In this paper, we propose a novel adjustment
based on {pairwise} label permutations instead of full label permutations.
Specifically, we consider permutations where only two samples, selected
uniformly at random, exchange their labels. We show that the corresponding
adjusted metric, which can be expressed explicitly, behaves similarly to the
standard adjusted mutual information for assessing the quality of a clustering,
while having a much lower time complexity. Both metrics are compared in terms
of quality and performance on experiments based on synthetic and real data.
- Abstract(参考訳): 2つのクラスタリング間の類似性を定量化するためのよく知られた計量は、調整された相互情報である。
相互情報と比較し、ラベルのランダムな置換に基づく補正項を導入し、2つのクラスタリングが偶然に類似することを防止する。
残念ながら、この調整は計量を計算的に高価にする。
本稿では,ラベルの完全置換ではなく, {pairwise} ラベルの置換に基づく新しい調整を提案する。
具体的には、ランダムに選択された2つのサンプルだけがラベルを交換する置換を考える。
提案手法では,クラスタの質を評価するための標準調整相互情報と同様に,時間的複雑性をはるかに低減しつつ,対応する調整されたメトリックが振る舞うことを示す。
両方のメトリクスは、合成データと実データに基づく実験における品質と性能の点で比較される。
関連論文リスト
- JointMatch: A Unified Approach for Diverse and Collaborative
Pseudo-Labeling to Semi-Supervised Text Classification [65.268245109828]
半教師付きテキスト分類(SSTC)は、ラベルのないデータを活用する能力によって注目を集めている。
擬似ラベルに基づく既存のアプローチは、擬似ラベルバイアスと誤り蓄積の問題に悩まされる。
我々は、最近の半教師付き学習からアイデアを統一することでこれらの課題に対処する、SSTCの総合的なアプローチであるJointMatchを提案する。
論文 参考訳(メタデータ) (2023-10-23T05:43:35Z) - Semantic Equivariant Mixup [54.734054770032934]
Mixupは、トレーニング分布を拡張し、ニューラルネットワークを正規化する、確立されたデータ拡張テクニックである。
以前のミックスアップの変種はラベル関連の情報に過度に焦点をあてる傾向がある。
入力中のよりリッチな意味情報を保存するための意味的同変混合(sem)を提案する。
論文 参考訳(メタデータ) (2023-08-12T03:05:53Z) - Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - Selective Mixup Helps with Distribution Shifts, But Not (Only) because
of Mixup [26.105340203096596]
本研究では,ペアの非ランダム選択がトレーニング分布に影響を及ぼし,混合とは無関係な手段による一般化が向上することを示す。
選択混合法と再サンプリング法という2つの手法の間に新しい等価性を見出した。
論文 参考訳(メタデータ) (2023-05-26T10:56:22Z) - Normalised clustering accuracy: An asymmetric external cluster validity measure [2.900810893770134]
クラスタリングアルゴリズムは、伝統的に内部または外部の妥当性尺度を用いて評価される。
本稿では、一般的に使われている古典的分割類似度スコアは、いくつかの望ましい性質を欠いていると論じる。
我々は,最適セットマッチング精度のバージョンである新しい尺度を提案し,分析する。
論文 参考訳(メタデータ) (2022-09-07T05:08:34Z) - Regularization for Shuffled Data Problems via Exponential Family Priors
on the Permutation Group [8.40077201352607]
シャッフルデータ(Shuffled data)とは、(X, Y)ペアの正しいペアリングが未知のインデックス置換によって表現されるデータである。
この目的のために、置換群に先立ってフレキシブル指数族を提案する。
推論は、抽出可能なEステップをFisher-Yatesアルゴリズムで近似するEMアルゴリズムに基づいている。
論文 参考訳(メタデータ) (2021-11-02T17:43:28Z) - Label-Occurrence-Balanced Mixup for Long-tailed Recognition [6.482544017574614]
本稿では,各クラスにおけるラベル発生率を統計的にバランスよく保ちながら,データ量を増やすためのラベル・オクレンス・バランサード・ミックスアップを提案する。
長い視力と音声認識のベンチマークで本手法を検証した。
論文 参考訳(メタデータ) (2021-10-11T02:22:02Z) - Predictive K-means with local models [0.028675177318965035]
予測クラスタリングは、2つの世界のベストを獲得しようとします。
この手法を用いて2つの新しいアルゴリズムを提案し、予測性能に競争力があることを様々なデータセットで示す。
論文 参考訳(メタデータ) (2020-12-16T10:49:36Z) - Pointwise Binary Classification with Pairwise Confidence Comparisons [97.79518780631457]
ペアワイズ比較(Pcomp)分類を提案し、ラベルのないデータのペアしか持たない。
我々はPcomp分類をノイズラベル学習に結びつけて、進歩的UREを開発し、一貫性の正則化を課すことにより改善する。
論文 参考訳(メタデータ) (2020-10-05T09:23:58Z) - Improving Face Recognition by Clustering Unlabeled Faces in the Wild [77.48677160252198]
極値理論に基づく新しいアイデンティティ分離法を提案する。
重なり合うラベルノイズによる問題を大幅に低減する。
制御された設定と実際の設定の両方の実験は、我々のメソッドの一貫性のある改善を示している。
論文 参考訳(メタデータ) (2020-07-14T12:26:50Z) - Class2Simi: A Noise Reduction Perspective on Learning with Noisy Labels [98.13491369929798]
そこで我々は,ノイズのあるクラスラベルを持つデータポイントを,ノイズの多い類似ラベルを持つデータペアに変換するClass2Simiというフレームワークを提案する。
Class2Simiは、この変換がミニバッチのオンザフライであるだけでなく、モデル予測上の損失をペアワイズに変化させるため、計算的に効率的である。
論文 参考訳(メタデータ) (2020-06-14T07:55:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。