論文の概要: A Statistical Perspective on Coreset Density Estimation
- arxiv url: http://arxiv.org/abs/2011.04907v2
- Date: Tue, 8 Dec 2020 21:05:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 07:12:55.178653
- Title: A Statistical Perspective on Coreset Density Estimation
- Title(参考訳): コアセット密度推定の統計的展望
- Authors: Paxton Turner, Jingbo Liu, Philippe Rigollet
- Abstract要約: コアセットは、元の観測の小さなサブセットを選択してデータを要約する強力なツールとして登場した。
実効的なコアセットカーネル密度推定器は、H"古いスムース密度の大規模なクラスに対して、極小に近い最適値を示す。
- 参考スコア(独自算出の注目度): 26.023056426554415
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Coresets have emerged as a powerful tool to summarize data by selecting a
small subset of the original observations while retaining most of its
information. This approach has led to significant computational speedups but
the performance of statistical procedures run on coresets is largely
unexplored. In this work, we develop a statistical framework to study coresets
and focus on the canonical task of nonparameteric density estimation. Our
contributions are twofold. First, we establish the minimax rate of estimation
achievable by coreset-based estimators. Second, we show that the practical
coreset kernel density estimators are near-minimax optimal over a large class
of H\"{o}lder-smooth densities.
- Abstract(参考訳): コアセットは、元の観測の小さなサブセットを選択して、その情報のほとんどを保持しながらデータを要約する強力なツールとして登場した。
このアプローチは計算の大幅な高速化につながったが、coresets上で実行される統計処理の性能はほとんど未調査である。
本研究では,コアセットを解析し,非パラメータ密度推定の標準課題に焦点をあてる統計フレームワークを開発する。
私たちの貢献は2倍です。
まず,coresetベースの推定器で実現可能な最小推定速度を定式化する。
第二に、実用的コアセット核密度推定器は、h\"{o}lder-smooth密度の大きなクラスに対してほぼミニマックス最適であることを示す。
関連論文リスト
- Refined Coreset Selection: Towards Minimal Coreset Size under Model
Performance Constraints [69.27190330994635]
コアセットの選択は、計算コストの削減とディープラーニングアルゴリズムのデータ処理の高速化に強力である。
本稿では,モデル性能とコアセットサイズに対する最適化優先順序を維持する革新的な手法を提案する。
実験的に、広範な実験によりその優位性が確認され、しばしばより小さなコアセットサイズでモデル性能が向上する。
論文 参考訳(メタデータ) (2023-11-15T03:43:04Z) - TAKDE: Temporal Adaptive Kernel Density Estimator for Real-Time Dynamic
Density Estimation [16.45003200150227]
時間適応型カーネル密度推定器(TAKDE)と命名する。
TAKDEは最悪のAMISEの点で理論的に最適である。
合成および実世界のデータセットを用いて数値実験を行い、TAKDEが他の最先端の動的密度推定器より優れていることを示す。
論文 参考訳(メタデータ) (2022-03-15T23:38:32Z) - Density Ratio Estimation via Infinitesimal Classification [85.08255198145304]
そこで我々は, DRE-inftyを提案する。 DRE-inftyは, 密度比推定(DRE)を, より簡単なサブプロブレムに還元する手法である。
モンテカルロ法にインスパイアされ、中間ブリッジ分布の無限連続体を介して2つの分布の間を滑らかに補間する。
提案手法は,複雑な高次元データセット上での相互情報推定やエネルギーベースモデリングなどの下流タスクにおいて良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-22T06:26:29Z) - Kernel Density Estimation by Stagewise Algorithm with a Simple
Dictionary [0.0]
本稿では,U-divergenceの簡単な辞書を用いて,ステージワイズアルゴリズムによるカーネル密度推定について検討する。
i.d.サンプルをランダムに2つの非結合集合に分割し,その1つは辞書内のカーネルを構築するためのもので,もう1つは推定器を評価するためのものである。
論文 参考訳(メタデータ) (2021-07-27T17:05:06Z) - Featurized Density Ratio Estimation [82.40706152910292]
本研究では,2つの分布を推定前の共通特徴空間にマッピングするために,可逆生成モデルを活用することを提案する。
この偉業化は、学習された入力空間の密度比が任意に不正確な場合、潜在空間において密度が密接な関係をもたらす。
同時に、特徴写像の可逆性は、特徴空間で計算された比が入力空間で計算された比と同値であることを保証する。
論文 参考訳(メタデータ) (2021-07-05T18:30:26Z) - The Power of Log-Sum-Exp: Sequential Density Ratio Matrix Estimation for
Speed-Accuracy Optimization [0.0]
本稿では,時系列のマルチクラス分類モデルを提案する。
早期分類のためのアーキテクチャ MSPRT-TANDEM は、4つのデータセットのベースラインモデルよりも統計的に有意に優れている。
論文 参考訳(メタデータ) (2021-05-28T07:21:58Z) - Nonparametric Density Estimation from Markov Chains [68.8204255655161]
我々はマルコフ・チェインにインスパイアされた新しい非パラメトリック密度推定器を導入し、よく知られたケルネル密度推定器を一般化する。
我々の推定器は, 通常のものに対していくつかの利点を示し, 全密度アルゴリズムの基盤として容易に利用できる。
論文 参考訳(メタデータ) (2020-09-08T18:33:42Z) - Bayesian Coresets: Revisiting the Nonconvex Optimization Perspective [30.963638533636352]
コアセット選択のための新しいアルゴリズムを提案し,解析する。
本研究では,様々なベンチマークデータセットに対して,明示的な収束率保証と経験的評価を行う。
論文 参考訳(メタデータ) (2020-07-01T19:34:59Z) - Coresets via Bilevel Optimization for Continual Learning and Streaming [86.67190358712064]
濃度制約付き二レベル最適化による新しいコアセット構成を提案する。
我々のフレームワークがディープニューラルネットワークのコアセットを効率的に生成できることを示し、連続学習やストリーミング設定における経験的メリットを示す。
論文 参考訳(メタデータ) (2020-06-06T14:20:25Z) - A Spatio-Temporal Kernel Density Estimation Framework for Predictive
Crime Hotspot Mapping and Evaluation [1.0896567381206714]
一般的なカーネル密度推定(KDE)のような既存の手法では、犯罪の時間次元を考慮していない。
A-temporal kernel density estimation (STKDE) 法を適用し、予測ホットスポットマッピングに時間成分を含める。
複数のアレースケールで予測ホットスポットを評価するために,予測精度指標(PAI)曲線を新たに提案した。
論文 参考訳(メタデータ) (2020-05-30T13:51:05Z) - On Coresets for Support Vector Machines [61.928187390362176]
coresetは、元のデータポイントの小さな、代表的なサブセットである。
我々は,本アルゴリズムを用いて,既製のSVMソルバをストリーミング,分散,動的データ設定に適用可能であることを示す。
論文 参考訳(メタデータ) (2020-02-15T23:25:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。