論文の概要: Bayesian Quantile Matching Estimation
- arxiv url: http://arxiv.org/abs/2008.06423v2
- Date: Mon, 11 Apr 2022 12:31:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 17:36:39.304438
- Title: Bayesian Quantile Matching Estimation
- Title(参考訳): ベイズ四面体マッチング推定
- Authors: Rajbir-Singh Nirwan, Nils Bertschinger
- Abstract要約: 医学診断や政策アドバイスなどの研究と科学的理解は、しばしばデータアクセスに依存している。
本稿では,定量的情報からベイズ的学習法を提案する。
- 参考スコア(独自算出の注目度): 4.56877715768796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to increased awareness of data protection and corresponding laws many
data, especially involving sensitive personal information, are not publicly
accessible. Accordingly, many data collecting agencies only release aggregated
data, e.g. providing the mean and selected quantiles of population
distributions. Yet, research and scientific understanding, e.g. for medical
diagnostics or policy advice, often relies on data access. To overcome this
tension, we propose a Bayesian method for learning from quantile information.
Being based on order statistics of finite samples our method adequately and
correctly reflects the uncertainty of empirical quantiles. After outlining the
theory, we apply our method to simulated as well as real world examples. In
addition, we provide a python-based package that implements the proposed model.
- Abstract(参考訳): データ保護と対応する法律に対する意識の高まりにより、多くのデータ、特に機密性の高い個人情報は一般にアクセスできない。
したがって、多くのデータ収集機関は、例えば、平均および選択された人口分布の定量値を提供するような集計データのみをリリースする。
しかし、医学診断や政策アドバイスなどの研究や科学的理解は、しばしばデータアクセスに依存している。
この緊張を克服するため,定量的情報からベイズ的学習法を提案する。
有限サンプルの順序統計に基づいて,本手法は経験的クオンタイルの不確かさを正しく反映する。
理論を概説した後,本手法を実世界の実例と同様にシミュレーションに適用する。
さらに,提案モデルを実装したpythonベースのパッケージも提供する。
関連論文リスト
- Privacy Preserving Data Imputation via Multi-party Computation for Medical Applications [1.7999333451993955]
本研究では,セキュアなマルチパーティ計算を用いた機密データに対するプライバシ保護計算手法について検討する。
患者データの保護の重要性を考慮した医療・医療分野を特に対象とする。
糖尿病データセットの実験では、プライバシ保護の計算手法の正しさが検証され、最大の誤差は10~3ドル(約3万3000円)だった。
論文 参考訳(メタデータ) (2024-05-29T08:36:42Z) - Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Synthetic Census Data Generation via Multidimensional Multiset Sum [7.900694093691988]
我々は、Censusの統計データのみから合成マイクロデータを生成するツールを提供する。
我々は,本手法が実際にうまく機能していることを示し,その性能を説明する理論的議論を行う。
論文 参考訳(メタデータ) (2024-04-15T19:06:37Z) - Mean Estimation with User-level Privacy under Data Heterogeneity [54.07947274508013]
異なるユーザーは、非常に多くの異なるデータポイントを持っているかもしれない。
すべてのユーザが同じディストリビューションからサンプルを採取していると仮定することはできない。
本研究では,データの分布と量の両方でユーザデータが異なる異質なユーザデータの単純なモデルを提案する。
論文 参考訳(メタデータ) (2023-07-28T23:02:39Z) - Beyond Normal: On the Evaluation of Mutual Information Estimators [52.85079110699378]
そこで本研究では,既知の地道的相互情報を用いて,多種多様な分布群を構築する方法について述べる。
本稿では,問題の難易度に適応した適切な推定器の選択方法について,実践者のためのガイドラインを提供する。
論文 参考訳(メタデータ) (2023-06-19T17:26:34Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Achieving Representative Data via Convex Hull Feasibility Sampling
Algorithms [35.29582673348303]
トレーニングデータのバイアスをサンプリングすることは、機械学習システムにおけるアルゴリズムバイアスの主要な原因である。
得られたデータから代表的データセットを収集できるかどうかを高信頼で判断するために,適応的なサンプリング手法を提案する。
論文 参考訳(メタデータ) (2022-04-13T23:14:05Z) - Qimera: Data-free Quantization with Synthetic Boundary Supporting
Samples [8.975667614727652]
人工境界支持試料を生成するために重ね合わせの潜伏埋め込みを用いたQimeraを提案する。
実験結果から,Qimeraはデータフリー量子化における各種設定に対して,最先端の性能を実現することが示された。
論文 参考訳(メタデータ) (2021-11-04T04:52:50Z) - Learning to Count in the Crowd from Limited Labeled Data [109.2954525909007]
我々は,限られた数のラベル付きサンプルから参加者を数えることを学ぶことで,アノテーションの努力を減らすことに重点を置いている。
具体的には,未ラベルデータに対する擬似地下真理推定を含むガウス過程に基づく反復学習機構を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:17:01Z) - Distributed Multivariate Regression Modeling For Selecting Biomarkers
Under Data Protection Constraints [0.0]
本稿では,反復呼び出しにおける集約データに基づく自動変数選択によるバイオマーカー同定のための多変数回帰手法を提案する。
このアプローチは、複数のロケーションに分散したデータを共同で分析するために使用することができる。
シミュレーションでは、局所的な標準化によって引き起こされた情報損失は最小限である。
論文 参考訳(メタデータ) (2018-03-01T15:04:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。