論文の概要: What makes you unique?
- arxiv url: http://arxiv.org/abs/2105.08013v1
- Date: Mon, 17 May 2021 16:53:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-18 17:34:01.874164
- Title: What makes you unique?
- Title(参考訳): なぜあなたは独特なの?
- Authors: Benjamin B. Seiler, Masayoshi Mase, Art B. Owen
- Abstract要約: この特異度Shapley測度は、条件エントロピーの重み付け和となる対象に集約することができる。
ノースカロライナ州の投票者登録ロールから変数を明らかにすることによる異なる効果と異常な太陽フレアの同定に一意性シャプリーを用いる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a uniqueness Shapley measure to compare the extent to
which different variables are able to identify a subject. Revealing the value
of a variable on subject $t$ shrinks the set of possible subjects that $t$
could be. The extent of the shrinkage depends on which other variables have
also been revealed. We use Shapley value to combine all of the reductions in
log cardinality due to revealing a variable after some subset of the other
variables has been revealed. This uniqueness Shapley measure can be aggregated
over subjects where it becomes a weighted sum of conditional entropies.
Aggregation over subsets of subjects can address questions like how identifying
is age for people of a given zip code. Such aggregates have a corresponding
expression in terms of cross entropies. We use uniqueness Shapley to
investigate the differential effects of revealing variables from the North
Carolina voter registration rolls and in identifying anomalous solar flares. An
enormous speedup (approaching 2000 fold in one example) is obtained by using
the all dimension trees of Moore and Lee (1998) to store the cardinalities we
need.
- Abstract(参考訳): 本稿では,異なる変数が対象を識別できる範囲を比較するために,一意性シェープ測度を提案する。
subject $t$ の変数の値を取得することで、$t$ の可能な対象のセットを縮小する。
縮小の程度は、他の変数も明らかにされているかに依存する。
私たちはShapley値を使って、他の変数のサブセットが明らかにされた後、変数が明らかにされたため、ログの濃度の減少を全て組み合わせます。
この特異度Shapley測度は、条件エントロピーの重み付け和となる対象に集約することができる。
被験者のサブセットに対するアグリゲーションは、与えられたzipコードの人々の年齢の特定など、問題に対処できる。
このような集合は交叉エントロピーの観点から対応する表現を持つ。
ノースカロライナ州の投票者登録ロールから変数を明らかにすることによる異なる効果と異常な太陽フレアの同定に一意性シャプリーを用いる。
ムーアとリー(1998)のすべての次元木を用いて、必要な濃度を保存することにより、巨大なスピードアップ(一例に2000倍)が得られる。
関連論文リスト
- Gower's similarity coefficients with automatic weight selection [0.0]
混合型変数に対する最も一般的な相似性は、ゴーワーの類似性係数の1つを補うものとして導かれる。
重み付けスキームに関する議論は、しばしば非重み付けの「標準」設定が全体の相似性に対する単一の変数の不均衡な寄与を隠すことを無視するので、誤解を招くことがある。
この欠点は、各寄与相違性と結果の重み付け相違との相関関係を最小化する重み付けスキームを導入するという最近の考え方に倣って解決される。
論文 参考訳(メタデータ) (2024-01-30T14:21:56Z) - Causal Layering via Conditional Entropy [85.01590667411956]
因果発見は、生成した観測可能なデータから観測されていない因果グラフに関する情報を回収することを目的としている。
我々は、条件付きエントロピーオラクルを介してデータにアクセスすることによって、グラフの階層化を回復する方法を提供する。
論文 参考訳(メタデータ) (2024-01-19T05:18:28Z) - Causal Discovery from Subsampled Time Series with Proxy Variables [19.699813624529813]
本稿では,サブサンプリング時系列から因果構造全体を同定する制約に基づくアルゴリズムを提案する。
我々のアルゴリズムは非パラメトリックであり、完全な因果同定を実現することができる。
論文 参考訳(メタデータ) (2023-05-09T08:58:02Z) - Is Shapley Explanation for a model unique? [0.0]
特徴の分布とShapley値の関係について検討する。
我々の評価では、特定の特徴に対するShapleyの値は、期待値だけでなく、分散のような他の瞬間にも依存する。
これはモデルの結果(Probability/Log-odds/binary decision、recept/rejectなど)によって異なり、従ってモデルアプリケーションによって異なります。
論文 参考訳(メタデータ) (2021-11-23T15:31:46Z) - Contextuality and dichotomizations of random variables [0.0]
二コトミゼーションを選択する際の主要な考え方は、確率変数の可能な値の集合が前位相 (V-空間) で与えられるならば、許容される二コトミゼーションは可能な値の空間を2つの連結部分集合に分割するということである。
我々は、最も頻繁に遭遇する2種類の確率変数(カテゴリー変数と実数値変数)に焦点をあてる。
論文 参考訳(メタデータ) (2021-05-08T15:26:55Z) - Sample-efficient proper PAC learning with approximate differential
privacy [51.09425023771246]
近似微分プライバシーを持つリトルストーン次元のクラスを適切に学習するサンプル複雑性が$tilde o(d6)$であることを証明し、プライバシーパラメータと精度パラメータを無視する。
この結果は Bun et al の質問に答えます。
(FOCS 2020) サンプルの複雑さに$2O(d)$の上限で改善することによって。
論文 参考訳(メタデータ) (2020-12-07T18:17:46Z) - Discond-VAE: Disentangling Continuous Factors from the Discrete [2.1751359518641364]
連続潜伏変数であるプライベート変数とパブリック変数の2つのセットを導入する。
提案するフレームワークは,プライベート変数をガウス変数と公変数をガウス変数の混合としてモデル化する。
提案するモデルはDiscond-VAEと呼ばれ,離散因子からクラス依存の連続因子をプライベート変数を導入して分離する。
論文 参考訳(メタデータ) (2020-09-17T03:19:03Z) - Interpolation and Learning with Scale Dependent Kernels [91.41836461193488]
非パラメトリックリッジレス最小二乗の学習特性について検討する。
スケール依存カーネルで定義される推定器の一般的な場合を考える。
論文 参考訳(メタデータ) (2020-06-17T16:43:37Z) - Robustly Learning any Clusterable Mixture of Gaussians [55.41573600814391]
本研究では,高次元ガウス混合系の対向ロバスト条件下での効率的な学習性について検討する。
理論的に最適に近い誤り証明である$tildeO(epsilon)$の情報を、$epsilon$-corrupted $k$-mixtureで学習するアルゴリズムを提供する。
我々の主な技術的貢献は、ガウス混合系からの新しい頑健な識別可能性証明クラスターであり、これは正方形の定度証明システムによって捉えることができる。
論文 参考訳(メタデータ) (2020-05-13T16:44:12Z) - Fast and Robust Comparison of Probability Measures in Heterogeneous
Spaces [62.35667646858558]
本稿では, アンカー・エナジー (AE) とアンカー・ワッサースタイン (AW) 距離を紹介する。
我々の主な貢献は、素案実装が立方体となる対数四重項時間でAEを正確に計算するスイープラインアルゴリズムを提案することである。
AE と AW は,一般的な GW 近似の計算コストのごく一部において,様々な実験環境において良好に動作することを示す。
論文 参考訳(メタデータ) (2020-02-05T03:09:23Z) - Towards Efficient Data Valuation Based on the Shapley Value [65.4167993220998]
本稿では,Shapley値を用いたデータ評価の問題点について検討する。
Shapleyの値は、データ値の概念に対して多くのデシダータを満たすユニークなペイオフスキームを定義する。
本稿では,Shapley値を近似する効率的なアルゴリズムのレパートリーを提案する。
論文 参考訳(メタデータ) (2019-02-27T00:22:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。