論文の概要: FunQuant: A R package to perform quantization in the context of rare
events and time-consuming simulations
- arxiv url: http://arxiv.org/abs/2308.10871v1
- Date: Fri, 18 Aug 2023 08:34:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-22 12:29:56.759902
- Title: FunQuant: A R package to perform quantization in the context of rare
events and time-consuming simulations
- Title(参考訳): FunQuant: レアイベントと時間的シミュレーションのコンテキストで量子化を実行するRパッケージ
- Authors: Charlie Sire and Yann Richet and Rodolphe Le Riche and Didier
Rulli\`ere and J\'er\'emy Rohmer and Lucie Pheulpin
- Abstract要約: 量子化は離散近似を計算することによって連続分布を要約する。
データ量子化の広く採用されている方法の1つにロイドのアルゴリズムがあり、このアルゴリズムは空間を「ボロノ」セルに分割し、クラスターとして見ることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quantization summarizes continuous distributions by calculating a discrete
approximation. Among the widely adopted methods for data quantization is
Lloyd's algorithm, which partitions the space into Vorono\"i cells, that can be
seen as clusters, and constructs a discrete distribution based on their
centroids and probabilistic masses. Lloyd's algorithm estimates the optimal
centroids in a minimal expected distance sense, but this approach poses
significant challenges in scenarios where data evaluation is costly, and
relates to rare events. Then, the single cluster associated to no event takes
the majority of the probability mass. In this context, a metamodel is required
and adapted sampling methods are necessary to increase the precision of the
computations on the rare clusters.
- Abstract(参考訳): 量子化は離散近似を計算することによって連続分布を要約する。
データ量子化の手法として広く採用されているのがロイドのアルゴリズムであり、空間をクラスタと見なすことができる vorono\"i 細胞に分割し、その中心体と確率的質量に基づく離散分布を構築する。
ロイドのアルゴリズムは、最小距離感覚で最適なセンチロイドを推定するが、このアプローチは、データ評価がコストがかかり、まれな事象と関連するシナリオにおいて重大な課題をもたらす。
そして、すべての事象に関連する単一のクラスタが確率質量の過半数を取る。
この文脈では、メタモデルが必要であり、まれなクラスタ上の計算の精度を高めるために、適応したサンプリング手法が必要である。
関連論文リスト
- Distributed Markov Chain Monte Carlo Sampling based on the Alternating
Direction Method of Multipliers [143.6249073384419]
本論文では,乗算器の交互方向法に基づく分散サンプリング手法を提案する。
我々は,アルゴリズムの収束に関する理論的保証と,その最先端性に関する実験的証拠の両方を提供する。
シミュレーションでは,線形回帰タスクとロジスティック回帰タスクにアルゴリズムを配置し,その高速収束を既存の勾配法と比較した。
論文 参考訳(メタデータ) (2024-01-29T02:08:40Z) - Spatial Process Approximations: Assessing Their Necessity [5.8666339171606445]
空間統計学と機械学習では、カーネル行列は予測、分類、最大推定において重要な役割を果たす。
大規模な空間データを管理するための現在の手法のレビューでは、この悪条件問題に対処できないものもあることが示されている。
本稿では,様々な最適性基準を導入し,それぞれに解決策を提供する。
論文 参考訳(メタデータ) (2023-11-06T15:46:03Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Bregman Power k-Means for Clustering Exponential Family Data [11.434503492579477]
我々は、ブレグマン発散の下でのハードクラスタリングに関する古典的な研究のアルゴリズム的進歩を橋渡しする。
ブレグマン発散のエレガントな性質は、単純で透明なアルゴリズムで閉形式更新を維持できる。
シミュレーション実験の徹底的な実証分析と降雨データに関するケーススタディを考察し,提案手法はガウス以外の様々なデータ設定において,既存のピア手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2022-06-22T06:09:54Z) - Lattice-Based Methods Surpass Sum-of-Squares in Clustering [98.46302040220395]
クラスタリングは教師なし学習における基本的なプリミティブである。
最近の研究は、低次手法のクラスに対する低い境界を確立している。
意外なことに、この特定のクラスタリングモデルのtextitdoesは、統計的-計算的ギャップを示さない。
論文 参考訳(メタデータ) (2021-12-07T18:50:17Z) - Density Ratio Estimation via Infinitesimal Classification [85.08255198145304]
そこで我々は, DRE-inftyを提案する。 DRE-inftyは, 密度比推定(DRE)を, より簡単なサブプロブレムに還元する手法である。
モンテカルロ法にインスパイアされ、中間ブリッジ分布の無限連続体を介して2つの分布の間を滑らかに補間する。
提案手法は,複雑な高次元データセット上での相互情報推定やエネルギーベースモデリングなどの下流タスクにおいて良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-22T06:26:29Z) - Hyperdimensional Computing for Efficient Distributed Classification with
Randomized Neural Networks [5.942847925681103]
本研究では,データを中央に保存することも共有することもできない状況下で利用できる分散分類について検討する。
ローカルな分類器を他のエージェントと共有する場合に、ロッキーな圧縮アプローチを適用することにより、分散分類のためのより効率的な解を提案する。
論文 参考訳(メタデータ) (2021-06-02T01:33:56Z) - Robust M-Estimation Based Bayesian Cluster Enumeration for Real
Elliptically Symmetric Distributions [5.137336092866906]
データセットにおける最適なクラスタ数のロバストな決定は、広範囲のアプリケーションにおいて必須の要素である。
本稿では任意のReally Symmetric(RES)分散混合モデルで使用できるように一般化する。
サンプルサイズが有限であるデータセットに対して,ロバストな基準を導出するとともに,大規模なサンプルサイズでの計算コスト削減のための近似を提供する。
論文 参考訳(メタデータ) (2020-05-04T11:44:49Z) - Scalable Distributed Approximation of Internal Measures for Clustering
Evaluation [5.144809478361603]
クラスタリング評価のための内部測度はシルエット係数であり、計算には2つの距離計算が必要である。
本稿では,任意の距離に基づいてクラスタリングの評価を行うための厳密な近似を計算した最初のスケーラブルアルゴリズムを提案する。
また,このアルゴリズムは凝集や分離などのクラスタリング品質の他の内部指標の厳密な近似に適応可能であることも証明した。
論文 参考訳(メタデータ) (2020-03-03T10:28:14Z) - A General Method for Robust Learning from Batches [56.59844655107251]
本稿では,バッチから頑健な学習を行う一般的なフレームワークについて考察し,連続ドメインを含む任意の領域に対する分類と分布推定の限界について考察する。
本手法は,一括分節分類,一括分節,単調,対数凹,ガウス混合分布推定のための,最初の頑健な計算効率の学習アルゴリズムを導出する。
論文 参考訳(メタデータ) (2020-02-25T18:53:25Z) - Efficiently Sampling Functions from Gaussian Process Posteriors [76.94808614373609]
高速後部サンプリングのための簡易かつ汎用的なアプローチを提案する。
分離されたサンプルパスがガウス過程の後部を通常のコストのごく一部で正確に表現する方法を実証する。
論文 参考訳(メタデータ) (2020-02-21T14:03:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。