論文の概要: Learning from aggregated data with a maximum entropy model
- arxiv url: http://arxiv.org/abs/2210.02450v1
- Date: Wed, 5 Oct 2022 09:17:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 15:33:41.739126
- Title: Learning from aggregated data with a maximum entropy model
- Title(参考訳): 最大エントロピーモデルを用いた集約データからの学習
- Authors: Alexandre Gilotte, Ahmed Ben Yahmed, David Rohde
- Abstract要約: 我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
- 参考スコア(独自算出の注目度): 73.63512438583375
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Aggregating a dataset, then injecting some noise, is a simple and common way
to release differentially private data.However, aggregated data -- even without
noise -- is not an appropriate input for machine learning classifiers.In this
work, we show how a new model, similar to a logistic regression, may be learned
from aggregated data only by approximating the unobserved feature distribution
with a maximum entropy hypothesis. The resulting model is a Markov Random Field
(MRF), and we detail how to apply, modify and scale a MRF training algorithm to
our setting. Finally we present empirical evidence on several public datasets
that the model learned this way can achieve performances comparable to those of
a logistic model trained with the full unaggregated data.
- Abstract(参考訳): データセットを集約し、次にノイズを注入することは、微分プライベートなデータをリリースするための単純で一般的な方法である。しかしながら、集約されたデータは、ノイズなしでも、機械学習分類器の適切な入力ではない。この研究では、ロジスティック回帰に似た新しいモデルが、観測されていない特徴分布を最大エントロピー仮説で近似することによってのみ、集約されたデータからどのように学習されるかを示す。
得られたモデルはマルコフ確率場 (mrf) であり、我々はmrfトレーニングアルゴリズムを設定に適用し、修正し、スケールする方法を詳述する。
最後に、このモデルが学習したいくつかの公開データセットに実証的な証拠を示し、完全な非集約データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを実現する。
関連論文リスト
- Learning Summary Statistics for Bayesian Inference with Autoencoders [58.720142291102135]
我々は,ディープニューラルネットワークに基づくオートエンコーダの内部次元を要約統計として利用する。
パラメータ関連情報を全て符号化するエンコーダのインセンティブを作成するため,トレーニングデータの生成に使用した暗黙的情報にデコーダがアクセスできるようにする。
論文 参考訳(メタデータ) (2022-01-28T12:00:31Z) - Model-based Clustering with Missing Not At Random Data [0.0]
本研究では,MNAR(Missing Not At Random)データをモデルベースクラスタリングアルゴリズムに直接埋め込む手法を提案する。
意味のあるMNARサブモデルの大規模なセットを導出し,各サブモデルのパラメータの同定可能性について検討した。
論文 参考訳(メタデータ) (2021-12-20T09:52:12Z) - Contrastive Model Inversion for Data-Free Knowledge Distillation [60.08025054715192]
そこで、データ多様性を最適化可能な目的として明示的にモデル化するContrastive Model Inversionを提案します。
我々の主な観察では、同じ量のデータの制約の下では、高いデータの多様性は、通常より強いインスタンス識別を示す。
CIFAR-10, CIFAR-100, Tiny-ImageNetを用いた実験により, 生成したデータを知識蒸留に使用する場合, CMIは極めて優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-05-18T15:13:00Z) - Model-based Policy Optimization with Unsupervised Model Adaptation [37.09948645461043]
本研究では,不正確なモデル推定による実データとシミュレーションデータのギャップを埋めて,より良いポリシ最適化を実現する方法について検討する。
本稿では,教師なしモデル適応を導入したモデルベース強化学習フレームワークAMPOを提案する。
提案手法は,一連の連続制御ベンチマークタスクにおけるサンプル効率の観点から,最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-10-19T14:19:42Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Variational Mixture of Normalizing Flows [0.0]
生成逆数ネットワークオートサイトGAN、変分オートエンコーダオートサイトベイペーパー、およびそれらの変種などの深い生成モデルは、複雑なデータ分布をモデル化するタスクに広く採用されている。
正規化フローはこの制限を克服し、確率密度関数にそのような公式の変更を利用する。
本研究は,混合モデルのコンポーネントとして正規化フローを用い,そのようなモデルのエンドツーエンドトレーニング手順を考案することによって,この問題を克服する。
論文 参考訳(メタデータ) (2020-09-01T17:20:08Z) - Data from Model: Extracting Data from Non-robust and Robust Models [83.60161052867534]
この研究は、データとモデルの関係を明らかにするために、モデルからデータを生成する逆プロセスについて検討する。
本稿では,データ・トゥ・モデル(DtM)とデータ・トゥ・モデル(DfM)を連続的に処理し,特徴マッピング情報の喪失について検討する。
以上の結果から,DtMとDfMの複数シーケンスの後にも,特にロバストモデルにおいて精度低下が制限されることが示唆された。
論文 参考訳(メタデータ) (2020-07-13T05:27:48Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - BayesFlow: Learning complex stochastic models with invertible neural
networks [3.1498833540989413]
可逆ニューラルネットワークに基づく世界規模のベイズ推定手法を提案する。
BayesFlowは、観測されたデータを最大情報的な要約統計に埋め込むよう訓練された要約ネットワークを組み込んでいる。
本研究では, 人口動態, 疫学, 認知科学, 生態学の難易度モデルに対するベイズフローの有用性を実証する。
論文 参考訳(メタデータ) (2020-03-13T13:39:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。