論文の概要: Mutual information and the encoding of contingency tables
- arxiv url: http://arxiv.org/abs/2405.05393v1
- Date: Wed, 8 May 2024 19:49:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-15 18:22:42.286244
- Title: Mutual information and the encoding of contingency tables
- Title(参考訳): 共用情報と共用表の符号化
- Authors: Maximilian Jerdee, Alec Kirkley, M. E. J. Newman,
- Abstract要約: 相互情報は、与えられたオブジェクトの集合のラベル付け間の類似性の尺度として一般的に使用される。
最近論じられたように、相互情報は、いわゆる並行性表の情報コストを無視するため、偏りのある結果を返すことができる。
本稿では,典型的ユースケースにおいて,より優れた境界を付与する並列性テーブルの符号化法について述べる。
- 参考スコア(独自算出の注目度): 0.4779196219827508
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mutual information is commonly used as a measure of similarity between competing labelings of a given set of objects, for example to quantify performance in classification and community detection tasks. As argued recently, however, the mutual information as conventionally defined can return biased results because it neglects the information cost of the so-called contingency table, a crucial component of the similarity calculation. In principle the bias can be rectified by subtracting the appropriate information cost, leading to the modified measure known as the reduced mutual information, but in practice one can only ever compute an upper bound on this information cost, and the value of the reduced mutual information depends crucially on how good a bound is established. In this paper we describe an improved method for encoding contingency tables that gives a substantially better bound in typical use cases, and approaches the ideal value in the common case where the labelings are closely similar, as we demonstrate with extensive numerical results.
- Abstract(参考訳): 相互情報は、例えば分類における性能とコミュニティ検出タスクのパフォーマンスを定量化するために、与えられたオブジェクトの集合の競合ラベルの類似性の尺度として一般的に使用される。
しかし、近年議論されているように、類似性計算の重要な要素である「並行性表」の情報コストを無視するため、従来定義されていた相互情報は偏りのある結果を返すことができる。
原則として、適切な情報コストを減らしてバイアスを是正できるため、還元された相互情報として知られる修正された措置が導かれるが、実際には、この情報コストの上限を上限だけ計算することができ、縮小された相互情報の値は、境界がどれだけ良いかに決定的に依存する。
本稿では,典型的ユースケースにおいてかなり優れたバウンダリを与える共振器テーブルの符号化方法の改善について述べるとともに,そのラベリングが密接に類似している場合の理想値にアプローチする。
関連論文リスト
- Optimised Storage for Datalog Reasoning [8.305527776204178]
物質化は、事実とルールのすべての結果を事前計算することで、データログの推論を促進する。
全ての実体化された事実を保管することは、実際には不可能かもしれない。特に規則が複雑で、与えられた事実の集合が大きい場合。
本稿では,このような最適化ストレージスキームを標準物質化アルゴリズムと統合可能な汎用フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-18T15:46:10Z) - Obtaining Explainable Classification Models using Distributionally
Robust Optimization [12.511155426574563]
特徴値規則の集合を用いて構築した一般化線形モデルについて検討する。
ルールセットの間隔と予測精度の間には、固有のトレードオフが存在する。
我々はこれらの競合する要因に同時に対処するルールセットの集合を学習するための新しい定式化を提案する。
論文 参考訳(メタデータ) (2023-11-03T15:45:34Z) - Normalized mutual information is a biased measure for classification and community detection [0.4779196219827508]
我々は、正規化された相互情報によって返される結果は2つの理由により偏りがあると主張している。
本稿では,どのアルゴリズムが最適かという結論が,従来の相互情報のバイアスに大きく影響されていることを示す。
論文 参考訳(メタデータ) (2023-07-03T18:12:32Z) - Beyond Normal: On the Evaluation of Mutual Information Estimators [52.85079110699378]
そこで本研究では,既知の地道的相互情報を用いて,多種多様な分布群を構築する方法について述べる。
本稿では,問題の難易度に適応した適切な推定器の選択方法について,実践者のためのガイドラインを提供する。
論文 参考訳(メタデータ) (2023-06-19T17:26:34Z) - Gacs-Korner Common Information Variational Autoencoder [102.89011295243334]
本稿では,2つの変数間で共有される情報の定量化と分離を可能にする共通情報の概念を提案する。
画像やビデオなどの高次元データでも意味論的に意味のある共通要素や特徴要因を学習できることを実証する。
論文 参考訳(メタデータ) (2022-05-24T17:47:26Z) - Information-Theoretic Bias Reduction via Causal View of Spurious
Correlation [71.9123886505321]
本稿では,スプリアス相関の因果的解釈による情報理論バイアス測定手法を提案する。
本稿では,バイアス正規化損失を含むアルゴリズムバイアスに対する新しいデバイアスフレームワークを提案する。
提案したバイアス測定とデバイアス法は、多様な現実シナリオで検証される。
論文 参考訳(メタデータ) (2022-01-10T01:19:31Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Cost-Based Budget Active Learning for Deep Learning [0.9732863739456035]
予算に制約のある集団における分類の不確実性やインスタンスの多様性を考慮したコストベースのバグデットアクティブラーニング(CBAL)を提案する。
min-maxに基づく原則的アプローチは、選択されたインスタンスのラベル付けと決定コストを最小化すると考えられる。
論文 参考訳(メタデータ) (2020-12-09T17:42:44Z) - Understanding the Extent to which Summarization Evaluation Metrics
Measure the Information Quality of Summaries [74.28810048824519]
ROUGEとBERTScoreのトークンアライメントを分析し、要約を比較する。
それらのスコアは、情報の重複を測定するものとしては解釈できない、と我々は主張する。
論文 参考訳(メタデータ) (2020-10-23T15:55:15Z) - Type-augmented Relation Prediction in Knowledge Graphs [65.88395564516115]
本稿では,タイプ情報とインスタンスレベルの情報の両方を関係予測に適用するタイプ拡張関係予測(TaRP)手法を提案する。
提案手法は,4つのベンチマークデータセット上での最先端手法よりも高い性能を実現する。
論文 参考訳(メタデータ) (2020-09-16T21:14:18Z) - Learning Unbiased Representations via Mutual Information Backpropagation [36.383338079229695]
特に、モデルによって学習された場合、データのいくつかの属性(バイアス)が一般化特性を著しく損なう可能性がある場合に直面します。
本稿では,学習した表現とデータ属性の相互情報を同時に推定し,最小化する,新しいエンドツーエンド最適化手法を提案する。
論文 参考訳(メタデータ) (2020-03-13T18:06:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。