論文の概要: Normalized mutual information is a biased measure for classification and
community detection
- arxiv url: http://arxiv.org/abs/2307.01282v1
- Date: Mon, 3 Jul 2023 18:12:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-16 04:18:43.035300
- Title: Normalized mutual information is a biased measure for classification and
community detection
- Title(参考訳): 正規化相互情報は、分類とコミュニティ検出のための偏りのある尺度である
- Authors: Maximilian Jerdee, Alec Kirkley, M. E. J. Newman
- Abstract要約: 正規化された相互情報によって返される結果は2つの理由から偏りがあることが示される。
本稿では,どのアルゴリズムが最適かという結論が,従来の相互情報のバイアスに大きく影響されていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Normalized mutual information is widely used as a similarity measure for
evaluating the performance of clustering and classification algorithms. In this
paper, we show that results returned by the normalized mutual information are
biased for two reasons: first, because they ignore the information content of
the contingency table and, second, because their symmetric normalization
introduces spurious dependence on algorithm output. We introduce a modified
version of the mutual information that remedies both of these shortcomings. As
a practical demonstration of the importance of using an unbiased measure, we
perform extensive numerical tests on a basket of popular algorithms for network
community detection and show that one's conclusions about which algorithm is
best are significantly affected by the biases in the traditional mutual
information.
- Abstract(参考訳): 正規化相互情報はクラスタリングと分類アルゴリズムの性能を評価するための類似度尺度として広く利用されている。
本稿では,正規化された相互情報によって返される結果が,一致表の情報内容を無視していること,対称正規化がアルゴリズムの出力に急激な依存をもたらすこと,の2つの理由から偏りがあることを示す。
これら2つの欠点を解消する相互情報の修正版を導入する。
偏りのない尺度を用いることの重要性を実証するため,ネットワークコミュニティ検出のための人気アルゴリズムのバスケット上で広範囲に数値実験を行い,従来の相互情報のバイアスの影響が,どのアルゴリズムが最適かという結論に大きく影響していることを示す。
関連論文リスト
- Mutual information and the encoding of contingency tables [0.4779196219827508]
相互情報は、与えられたオブジェクトの集合のラベル付け間の類似性の尺度として一般的に使用される。
最近論じられたように、相互情報は、いわゆる並行性表の情報コストを無視するため、偏りのある結果を返すことができる。
本稿では,典型的ユースケースにおいて,より優れた境界を付与する並列性テーブルの符号化法について述べる。
論文 参考訳(メタデータ) (2024-05-08T19:49:39Z) - Correcting Underrepresentation and Intersectional Bias for Classification [49.1574468325115]
我々は、表現不足のバイアスによって破損したデータから学習する問題を考察する。
偏りのないデータの少ない場合、グループワイドのドロップアウト率を効率的に推定できることが示される。
本アルゴリズムは,有限VC次元のモデルクラスに対して,効率的な学習を可能にする。
論文 参考訳(メタデータ) (2023-06-19T18:25:44Z) - Beyond Normal: On the Evaluation of Mutual Information Estimators [52.85079110699378]
そこで本研究では,既知の地道的相互情報を用いて,多種多様な分布群を構築する方法について述べる。
本稿では,問題の難易度に適応した適切な推定器の選択方法について,実践者のためのガイドラインを提供する。
論文 参考訳(メタデータ) (2023-06-19T17:26:34Z) - Gacs-Korner Common Information Variational Autoencoder [102.89011295243334]
本稿では,2つの変数間で共有される情報の定量化と分離を可能にする共通情報の概念を提案する。
画像やビデオなどの高次元データでも意味論的に意味のある共通要素や特徴要因を学習できることを実証する。
論文 参考訳(メタデータ) (2022-05-24T17:47:26Z) - Information-Theoretic Bias Reduction via Causal View of Spurious
Correlation [71.9123886505321]
本稿では,スプリアス相関の因果的解釈による情報理論バイアス測定手法を提案する。
本稿では,バイアス正規化損失を含むアルゴリズムバイアスに対する新しいデバイアスフレームワークを提案する。
提案したバイアス測定とデバイアス法は、多様な現実シナリオで検証される。
論文 参考訳(メタデータ) (2022-01-10T01:19:31Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - One-vs.-One Mitigation of Intersectional Bias: A General Method to
Extend Fairness-Aware Binary Classification [0.48733623015338234]
1-vs.ワン・マイティゲーション(英: One-vs. One Mitigation)は、二項分類のためのフェアネス認識機械学習と、センシティブ属性に関連する各サブグループの比較プロセスである。
本手法は,すべての設定において従来の手法よりも交叉バイアスを緩和する。
論文 参考訳(メタデータ) (2020-10-26T11:35:39Z) - Learning Unbiased Representations via Mutual Information Backpropagation [36.383338079229695]
特に、モデルによって学習された場合、データのいくつかの属性(バイアス)が一般化特性を著しく損なう可能性がある場合に直面します。
本稿では,学習した表現とデータ属性の相互情報を同時に推定し,最小化する,新しいエンドツーエンド最適化手法を提案する。
論文 参考訳(メタデータ) (2020-03-13T18:06:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。