論文の概要: Kendall transformation: a robust representation of continuous data for
information theory
- arxiv url: http://arxiv.org/abs/2006.15991v2
- Date: Mon, 3 Jan 2022 19:54:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 13:46:14.346008
- Title: Kendall transformation: a robust representation of continuous data for
information theory
- Title(参考訳): ケンドール変換 : 情報理論のための連続データの堅牢な表現
- Authors: Miron Bartosz Kursa
- Abstract要約: ケンドール変換 (Kendall transformation) は、順序付けられた特徴を個々の値間のペアの順序関係のベクトルに変換するものである。
このようにして、観測のランキングを保存し、分類形式で表現する。
情報理論の多くのアプローチは、ケンドール変換された連続データに直接適用することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Kendall transformation is a conversion of an ordered feature into a vector of
pairwise order relations between individual values. This way, it preserves
ranking of observations and represents it in a categorical form.
Such transformation allows for generalisation of methods requiring strictly
categorical input, especially in the limit of small number of observations,
when discretisation becomes problematic. In particular, many approaches of
information theory can be directly applied to Kendall-transformed continuous
data without relying on differential entropy or any additional parameters.
Moreover, by filtering information to this contained in ranking, Kendall
transformation leads to a better robustness at a reasonable cost of dropping
sophisticated interactions which are anyhow unlikely to be correctly estimated.
In bivariate analysis, Kendall transformation can be related to popular
non-parametric methods, showing the soundness of the approach. The paper also
demonstrates its efficiency in multivariate problems, as well as provides an
example analysis of a real-world data.
- Abstract(参考訳): ケンドール変換(kendall transformation)は、順序付けられた特徴を個々の値間のペアワイズ次数関係のベクトルに変換するものである。
このようにして、観測のランキングを保存し、分類形式で表現する。
このような変換は、離散化が問題となる場合、厳密な分類的入力を必要とする方法の一般化を可能にする。
特に、情報理論の多くのアプローチは、微分エントロピーや追加のパラメータに依存することなく、ケンドール変換された連続データに直接適用することができる。
さらに、ランキングに含まれる情報にフィルタリングすることで、kendall変換は、正確に見積もられそうにない高度なインタラクションをドロップする合理的なコストで、より堅牢性が向上する。
二変量解析では、ケンドール変換は一般的な非パラメトリック法と関係があり、アプローチの健全性を示す。
また,多変量問題におけるその効率性を実証するとともに,実世界のデータの例を提示する。
関連論文リスト
- Unsupervised Representation Learning from Sparse Transformation Analysis [79.94858534887801]
本稿では,潜在変数のスパース成分への変換を分解し,シーケンスデータから表現を学習することを提案する。
入力データは、まず潜伏活性化の分布として符号化され、その後確率フローモデルを用いて変換される。
論文 参考訳(メタデータ) (2024-10-07T23:53:25Z) - Learning Divergence Fields for Shift-Robust Graph Representations [73.11818515795761]
本研究では,相互依存データに対する問題に対して,学習可能な分散場を持つ幾何学的拡散モデルを提案する。
因果推論によって新たな学習目標が導出され、ドメイン間で無神経な相互依存の一般化可能なパターンを学習するためのモデルが導出される。
論文 参考訳(メタデータ) (2024-06-07T14:29:21Z) - Enriching Disentanglement: From Logical Definitions to Quantitative Metrics [59.12308034729482]
複雑なデータにおける説明的要素を遠ざけることは、データ効率の表現学習にとって有望なアプローチである。
論理的定義と量的指標の関連性を確立し, 理論的に根ざした絡み合いの指標を導出する。
本研究では,非交叉表現の異なる側面を分離することにより,提案手法の有効性を実証的に実証する。
論文 参考訳(メタデータ) (2023-05-19T08:22:23Z) - Bayesian Inference of Transition Matrices from Incomplete Graph Data
with a Topological Prior [1.2891210250935143]
本研究では, 繰り返し相互作用とトポロジカルなトポロジカルな手法を用いて解析的に抽出可能なベイズ法を導出し, 遷移行列をデータ効率よく推論する。
トポロジカル制約の知識が部分的である場合においても, 高い精度で遷移確率を回復し, 頑健であることを示す。
論文 参考訳(メタデータ) (2022-10-27T13:17:47Z) - Equivariance Discovery by Learned Parameter-Sharing [153.41877129746223]
データから解釈可能な等価性を発見する方法について検討する。
具体的には、モデルのパラメータ共有方式に対する最適化問題として、この発見プロセスを定式化する。
また,ガウスデータの手法を理論的に解析し,研究された発見スキームとオラクルスキームの間の平均2乗ギャップを限定する。
論文 参考訳(メタデータ) (2022-04-07T17:59:19Z) - The Role of Mutual Information in Variational Classifiers [47.10478919049443]
クロスエントロピー損失を訓練した符号化に依存する分類器の一般化誤差について検討する。
我々は、一般化誤差が相互情報によって境界付けられた状態が存在することを示す一般化誤差に境界を導出する。
論文 参考訳(メタデータ) (2020-10-22T12:27:57Z) - Information Theory Measures via Multidimensional Gaussianization [7.788961560607993]
情報理論は、データやシステムの不確実性、依存、関連性を測定するための優れたフレームワークである。
現実世界の応用にはいくつかの望ましい性質がある。
しかし,多次元データから情報を取得することは,次元性の呪いによる難題である。
論文 参考訳(メタデータ) (2020-10-08T07:22:16Z) - Quantitative Understanding of VAE as a Non-linearly Scaled Isometric
Embedding [52.48298164494608]
変分オートエンコーダ(VAE)は、各入力データに対応する潜伏変数の後方パラメータを推定する。
本稿では,VAEの微分幾何学的および情報理論的解釈を通じて,VAEの特性を定量的に理解する。
論文 参考訳(メタデータ) (2020-07-30T02:37:46Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - Sparse Generalized Canonical Correlation Analysis: Distributed
Alternating Iteration based Approach [18.93565942407577]
Sparse Canonical correlation analysis (CCA) はスパース構造を用いた潜伏情報検出に有用な統計ツールである。
本稿では,多視点データとスパース構造との潜在関係を検出可能な一般標準相関解析(GCCA)を提案する。
論文 参考訳(メタデータ) (2020-04-23T05:53:48Z) - Learning Discrete Structured Representations by Adversarially Maximizing
Mutual Information [39.87273353895564]
本研究では、構造化潜在変数と対象変数の相互情報を最大化することにより、ラベルのないデータから離散的構造化表現を学習する。
我々の重要な技術的貢献は、クロスエントロピー計算の実現可能性のみを前提として、相互情報を的確に見積もることができる敵の目的である。
文書ハッシュに本モデルを適用し,離散およびベクトル量子化変分オートエンコーダに基づいて,現在の最良ベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-04-08T13:31:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。