論文の概要: What makes you unique?
- arxiv url: http://arxiv.org/abs/2105.08013v1
- Date: Mon, 17 May 2021 16:53:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-18 17:34:01.874164
- Title: What makes you unique?
- Title(参考訳): なぜあなたは独特なの?
- Authors: Benjamin B. Seiler, Masayoshi Mase, Art B. Owen
- Abstract要約: この特異度Shapley測度は、条件エントロピーの重み付け和となる対象に集約することができる。
ノースカロライナ州の投票者登録ロールから変数を明らかにすることによる異なる効果と異常な太陽フレアの同定に一意性シャプリーを用いる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a uniqueness Shapley measure to compare the extent to
which different variables are able to identify a subject. Revealing the value
of a variable on subject $t$ shrinks the set of possible subjects that $t$
could be. The extent of the shrinkage depends on which other variables have
also been revealed. We use Shapley value to combine all of the reductions in
log cardinality due to revealing a variable after some subset of the other
variables has been revealed. This uniqueness Shapley measure can be aggregated
over subjects where it becomes a weighted sum of conditional entropies.
Aggregation over subsets of subjects can address questions like how identifying
is age for people of a given zip code. Such aggregates have a corresponding
expression in terms of cross entropies. We use uniqueness Shapley to
investigate the differential effects of revealing variables from the North
Carolina voter registration rolls and in identifying anomalous solar flares. An
enormous speedup (approaching 2000 fold in one example) is obtained by using
the all dimension trees of Moore and Lee (1998) to store the cardinalities we
need.
- Abstract(参考訳): 本稿では,異なる変数が対象を識別できる範囲を比較するために,一意性シェープ測度を提案する。
subject $t$ の変数の値を取得することで、$t$ の可能な対象のセットを縮小する。
縮小の程度は、他の変数も明らかにされているかに依存する。
私たちはShapley値を使って、他の変数のサブセットが明らかにされた後、変数が明らかにされたため、ログの濃度の減少を全て組み合わせます。
この特異度Shapley測度は、条件エントロピーの重み付け和となる対象に集約することができる。
被験者のサブセットに対するアグリゲーションは、与えられたzipコードの人々の年齢の特定など、問題に対処できる。
このような集合は交叉エントロピーの観点から対応する表現を持つ。
ノースカロライナ州の投票者登録ロールから変数を明らかにすることによる異なる効果と異常な太陽フレアの同定に一意性シャプリーを用いる。
ムーアとリー(1998)のすべての次元木を用いて、必要な濃度を保存することにより、巨大なスピードアップ(一例に2000倍)が得られる。
関連論文リスト
- Causal Representation Learning from Multiple Distributions: A General
Setting [23.739425749976082]
本稿では,複数の分布からの因果表現学習の一般的,完全に非パラメトリックな設定について述べる。
本研究は、潜在変数上のグラフの空間的制約の下で、基礎となる有向非巡回グラフのモラル化グラフを復元可能であることを示す。
場合によっては、各潜伏変数はコンポーネントワイド変換まで復元できる。
論文 参考訳(メタデータ) (2024-02-07T17:51:38Z) - Gower's similarity coefficients with automatic weight selection [0.0]
混合型変数に対する最も一般的な相似性は、ゴーワーの類似性係数の1つを補うものとして導かれる。
重み付けスキームに関する議論は、しばしば非重み付けの「標準」設定が全体の相似性に対する単一の変数の不均衡な寄与を隠すことを無視するので、誤解を招くことがある。
この欠点は、各寄与相違性と結果の重み付け相違との相関関係を最小化する重み付けスキームを導入するという最近の考え方に倣って解決される。
論文 参考訳(メタデータ) (2024-01-30T14:21:56Z) - Invariant Causal Prediction with Locally Linear Models [58.6243132840146]
観測データから対象変数の因果親を同定する作業を検討する。
親識別のための仮説テストに基づくLolicaPという実用的な手法を提案する。
我々は,LolicaPの統計的パワーが標本サイズにおいて指数関数的に高速に収束することを示す。
論文 参考訳(メタデータ) (2024-01-10T15:34:42Z) - Causal Discovery from Subsampled Time Series with Proxy Variables [19.699813624529813]
本稿では,サブサンプリング時系列から因果構造全体を同定する制約に基づくアルゴリズムを提案する。
我々のアルゴリズムは非パラメトリックであり、完全な因果同定を実現することができる。
論文 参考訳(メタデータ) (2023-05-09T08:58:02Z) - Shapley Curves: A Smoothing Perspective [0.0]
変数重要性の局所測度としてシェープリー曲線を導入することにより、非パラメトリック(あるいは滑らか化)の視点をとる。
特徴間の独立性と依存の両面において、一貫性と正常性を導出する。
実証的なアプリケーションでは、どの属性が車の価格を駆動するかを分析します。
論文 参考訳(メタデータ) (2022-11-23T20:32:33Z) - Is Shapley Explanation for a model unique? [0.0]
特徴の分布とShapley値の関係について検討する。
我々の評価では、特定の特徴に対するShapleyの値は、期待値だけでなく、分散のような他の瞬間にも依存する。
これはモデルの結果(Probability/Log-odds/binary decision、recept/rejectなど)によって異なり、従ってモデルアプリケーションによって異なります。
論文 参考訳(メタデータ) (2021-11-23T15:31:46Z) - Sample-efficient proper PAC learning with approximate differential
privacy [51.09425023771246]
近似微分プライバシーを持つリトルストーン次元のクラスを適切に学習するサンプル複雑性が$tilde o(d6)$であることを証明し、プライバシーパラメータと精度パラメータを無視する。
この結果は Bun et al の質問に答えます。
(FOCS 2020) サンプルの複雑さに$2O(d)$の上限で改善することによって。
論文 参考訳(メタデータ) (2020-12-07T18:17:46Z) - Interpolation and Learning with Scale Dependent Kernels [91.41836461193488]
非パラメトリックリッジレス最小二乗の学習特性について検討する。
スケール依存カーネルで定義される推定器の一般的な場合を考える。
論文 参考訳(メタデータ) (2020-06-17T16:43:37Z) - Robustly Learning any Clusterable Mixture of Gaussians [55.41573600814391]
本研究では,高次元ガウス混合系の対向ロバスト条件下での効率的な学習性について検討する。
理論的に最適に近い誤り証明である$tildeO(epsilon)$の情報を、$epsilon$-corrupted $k$-mixtureで学習するアルゴリズムを提供する。
我々の主な技術的貢献は、ガウス混合系からの新しい頑健な識別可能性証明クラスターであり、これは正方形の定度証明システムによって捉えることができる。
論文 参考訳(メタデータ) (2020-05-13T16:44:12Z) - Fast and Robust Comparison of Probability Measures in Heterogeneous
Spaces [62.35667646858558]
本稿では, アンカー・エナジー (AE) とアンカー・ワッサースタイン (AW) 距離を紹介する。
我々の主な貢献は、素案実装が立方体となる対数四重項時間でAEを正確に計算するスイープラインアルゴリズムを提案することである。
AE と AW は,一般的な GW 近似の計算コストのごく一部において,様々な実験環境において良好に動作することを示す。
論文 参考訳(メタデータ) (2020-02-05T03:09:23Z) - Towards Efficient Data Valuation Based on the Shapley Value [65.4167993220998]
本稿では,Shapley値を用いたデータ評価の問題点について検討する。
Shapleyの値は、データ値の概念に対して多くのデシダータを満たすユニークなペイオフスキームを定義する。
本稿では,Shapley値を近似する効率的なアルゴリズムのレパートリーを提案する。
論文 参考訳(メタデータ) (2019-02-27T00:22:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。