論文の概要: The BP Dependency Function: a Generic Measure of Dependence between
Random Variables
- arxiv url: http://arxiv.org/abs/2203.12329v1
- Date: Wed, 23 Mar 2022 11:14:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-24 14:34:44.422486
- Title: The BP Dependency Function: a Generic Measure of Dependence between
Random Variables
- Title(参考訳): bp依存性関数:確率変数間の依存性の一般的な尺度
- Authors: Guus Berkelmans, Joris Pries, Sandjai Bhulai and Rob van der Mei
- Abstract要約: ランダム変数(RV)間の依存関係の測定と定量化は、データセットに対する重要な洞察を与えることができる。
データ分析の一般的な実践は、ほとんどのデータアナリストが、RV間の依存を定量化するためにピアソン相関係数(PCC)を使用していることである。
これらの要件をすべて満たした新しい依存性関数を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Measuring and quantifying dependencies between random variables (RV's) can
give critical insights into a data-set. Typical questions are: `Do underlying
relationships exist?', `Are some variables redundant?', and `Is some target
variable $Y$ highly or weakly dependent on variable $X$?' Interestingly,
despite the evident need for a general-purpose measure of dependency between
RV's, common practice of data analysis is that most data analysts use the
Pearson correlation coefficient (PCC) to quantify dependence between RV's,
while it is well-recognized that the PCC is essentially a measure for linear
dependency only. Although many attempts have been made to define more generic
dependency measures, there is yet no consensus on a standard, general-purpose
dependency function. In fact, several ideal properties of a dependency function
have been proposed, but without much argumentation. Motivated by this, in this
paper we will discuss and revise the list of desired properties and propose a
new dependency function that meets all these requirements. This general-purpose
dependency function provides data analysts a powerful means to quantify the
level of dependence between variables. To this end, we also provide Python code
to determine the dependency function for use in practice.
- Abstract(参考訳): 確率変数(rv)間の依存関係の測定と定量化は、データセットに対する重要な洞察を与える。
典型的な質問は、 `do underlying relations exists?', `are some variable redundant?', `is some target variable $y$ highly or weakly dependent on variable $x$?' である。
興味深いことに、データ分析の一般的な実践は、RV間の依存関係の汎用的な測定が必要であるにもかかわらず、ほとんどのデータアナリストがピアソン相関係数(PCC)を用いてRV間の依存性の定量化を行っている。
より一般的な依存測度を定義するために多くの試みがなされているが、標準で汎用的な依存関数に関するコンセンサスはまだ存在しない。
実際、依存関数のいくつかの理想的な性質が提案されているが、議論はあまり行われていない。
そこで,本稿では,望ましいプロパティのリストを議論し,修正し,これらすべての要件を満たす新しい依存性関数を提案する。
この汎用依存関数は、データ分析者に変数間の依存度を定量化する強力な手段を提供する。
この目的のために、実際に使用する依存関数を決定するためにPythonコードも提供しています。
関連論文リスト
- Empirical Analysis for Unsupervised Universal Dependency Parse Tree Aggregation [9.075353955444518]
依存関係解析はNLPにおいて必須のタスクであり、多くの下流タスクには依存性の品質が不可欠である。
様々なNLPタスクにおいて、アグリゲーション法は後処理のアグリゲーションに使われ、様々な品質の問題に対処することが示されている。
異なる非教師付き後処理アグリゲーション法を比較し、最も適した依存木構造アグリゲーション法を同定する。
論文 参考訳(メタデータ) (2024-03-28T07:27:10Z) - Fed-CVLC: Compressing Federated Learning Communications with
Variable-Length Codes [54.18186259484828]
フェデレートラーニング(FL)パラダイムでは、パラメータサーバ(PS)がモデル収集、更新アグリゲーション、複数のラウンドでのモデル分散のために、分散参加クライアントと同時通信する。
FLの圧縮には可変長が有用であることを示す。
本稿では,Fed-CVLC(Federated Learning Compression with Variable-Length Codes)を提案する。
論文 参考訳(メタデータ) (2024-02-06T07:25:21Z) - Variable Importance in High-Dimensional Settings Requires Grouping [19.095605415846187]
Conditional Permutation Importance (CPI)は、そのような場合のPIの制限をバイパスする。
クラスタリングまたはいくつかの事前知識を介して統計的に変数をグループ化すると、ある程度のパワーバックが得られる。
重み付けにより拡張された手法は,高相関なグループであっても,型Iエラーを制御可能であることを示す。
論文 参考訳(メタデータ) (2023-12-18T00:21:47Z) - RDGCN: Reinforced Dependency Graph Convolutional Network for
Aspect-based Sentiment Analysis [43.715099882489376]
距離と型の両方のビューにおける依存性の重要度を計算するために,新たに強化された依存グラフ畳み込みネットワーク(RDGCN)を提案する。
この基準の下で、重み分布探索と相似性制御に強化学習を利用する距離重要度関数を設計する。
3つの一般的なデータセットに関する総合的な実験は、基準と重要度関数の有効性を示す。
論文 参考訳(メタデータ) (2023-11-08T05:37:49Z) - Statistically Valid Variable Importance Assessment through Conditional
Permutations [19.095605415846187]
Conditional Permutation Importanceは、変数の重要度評価に対する新しいアプローチである。
我々は、$textitCPI$が、正確な型Iエラー制御を提供することで、標準置換の重要性の限界を克服していることを示す。
この結果から,$textitCPI$は置換型メソッドのドロップイン置換として簡単に利用できることが示唆された。
論文 参考訳(メタデータ) (2023-09-14T10:53:36Z) - Multi-Target XGBoostLSS Regression [91.3755431537592]
本稿では,複数の目標とその依存関係を確率論的回帰設定でモデル化するXGBoostLSSの拡張について述べる。
提案手法は,既存のGBMよりも実行時の方が優れており,精度も良好に比較できる。
論文 参考訳(メタデータ) (2022-10-13T08:26:14Z) - Bayesian Kernelised Test of (In)dependence with Mixed-type Variables [1.2691047660244332]
AIの基本課題は、混合型変数(テキスト、画像、音声)間の(独立性)を評価することである。
Dirichletプロセスモデルを用いた(in)依存性のベイジアンカーネル化相関テストを提案する。
このアプローチの特性と、高速な計算のためのアルゴリズムを示します。
論文 参考訳(メタデータ) (2021-05-09T19:21:43Z) - Linguistic dependencies and statistical dependence [76.89273585568084]
文脈における単語の確率を推定するために,事前学習した言語モデルを用いる。
最大CPMI木は非文脈PMI推定値から抽出した木よりも言語的依存関係によく対応していることがわかった。
論文 参考訳(メタデータ) (2021-04-18T02:43:37Z) - Sparse Feature Selection Makes Batch Reinforcement Learning More Sample
Efficient [62.24615324523435]
本稿では,スパース線形関数近似を用いた高次元バッチ強化学習(RL)の統計的解析を行う。
候補となる機能が多数存在する場合,提案手法がバッチRLをより効率的にサンプリングできるという事実に光を当てる。
論文 参考訳(メタデータ) (2020-11-08T16:48:02Z) - Neural Methods for Point-wise Dependency Estimation [129.93860669802046]
我々は,2つの結果が共起する確率を定量的に測定する点依存度(PD)の推定に焦点をあてる。
提案手法の有効性を,1)MI推定,2)自己教師付き表現学習,3)クロスモーダル検索タスクで示す。
論文 参考訳(メタデータ) (2020-06-09T23:26:15Z) - Transformer Hawkes Process [79.16290557505211]
本稿では,長期的依存関係を捕捉する自己認識機構を利用したTransformer Hawkes Process (THP) モデルを提案する。
THPは、有意なマージンによる可能性と事象予測の精度の両方の観点から、既存のモデルより優れている。
本稿では、THPが関係情報を組み込む際に、複数の点過程を学習する際の予測性能の改善を実現する具体例を示す。
論文 参考訳(メタデータ) (2020-02-21T13:48:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。