論文の概要: Evaluating utility in synthetic banking microdata applications
- arxiv url: http://arxiv.org/abs/2410.22519v1
- Date: Tue, 29 Oct 2024 20:20:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-31 14:26:24.044937
- Title: Evaluating utility in synthetic banking microdata applications
- Title(参考訳): シンセティックバンキングマイクロデータ応用における有用性の評価
- Authors: Hugo E. Caceres, Ben Moews,
- Abstract要約: 我々は,規制当局の実用性とプライバシ要件を考慮した枠組みを開発し,これを金融利用指標,短期預金利回り曲線,クレジットカード遷移行列に適用する。
パラグアイ中央銀行のデータを用いて、我々は中央銀行の収集した情報を用いた合成銀行用マイクロデータの最初の実装を提供する。
- 参考スコア(独自算出の注目度): 0.5524804393257919
- License:
- Abstract: Financial regulators such as central banks collect vast amounts of data, but access to the resulting fine-grained banking microdata is severely restricted by banking secrecy laws. Recent developments have resulted in mechanisms that generate faithful synthetic data, but current evaluation frameworks lack a focus on the specific challenges of banking institutions and microdata. We develop a framework that considers the utility and privacy requirements of regulators, and apply this to financial usage indices, term deposit yield curves, and credit card transition matrices. Using the Central Bank of Paraguay's data, we provide the first implementation of synthetic banking microdata using a central bank's collected information, with the resulting synthetic datasets for all three domain applications being publicly available and featuring information not yet released in statistical disclosure. We find that applications less susceptible to post-processing information loss, which are based on frequency tables, are particularly suited for this approach, and that marginal-based inference mechanisms to outperform generative adversarial network models for these applications. Our results demonstrate that synthetic data generation is a promising privacy-enhancing technology for financial regulators seeking to complement their statistical disclosure, while highlighting the crucial role of evaluating such endeavors in terms of utility and privacy requirements.
- Abstract(参考訳): 中央銀行などの金融規制当局は膨大な量のデータを集めているが、細粒度の銀行のマイクロデータへのアクセスは銀行秘密法によって厳しく制限されている。
近年の進歩により、忠実な合成データを生成するメカニズムがもたらされているが、現在の評価フレームワークでは、銀行やマイクロデータの具体的な課題に焦点が当てられていない。
我々は,規制当局の実用性とプライバシ要件を考慮した枠組みを開発し,これを金融利用指標,短期預金利回り曲線,クレジットカード遷移行列に適用する。
パラグアイ中央銀行のデータを用いて、我々は、中央銀行の収集した情報を用いて、合成銀行マイクロデータの最初の実装を提供する。
周波数表をベースとした後処理情報損失の影響を受けにくいアプリケーションは,特にこのアプローチに適しており,これらのアプリケーションに対して生成的敵ネットワークモデルより優れた限界型推論機構があることが判明した。
以上の結果から, 合成データ生成は, 統計開示を補完しようとする金融規制当局にとって有望なプライバシー向上技術であり, 実用性とプライバシ要件の観点から評価する上で重要な役割を担っていることが明らかとなった。
関連論文リスト
- DPFedBank: Crafting a Privacy-Preserving Federated Learning Framework for Financial Institutions with Policy Pillars [0.09363323206192666]
本稿では、金融機関が協調して機械学習モデルを開発できるようにする革新的なフレームワークDPFedBankについて述べる。
DPFedBankは、金融データに関連するユニークなプライバシとセキュリティ上の課題に対処するために設計されている。
論文 参考訳(メタデータ) (2024-10-17T16:51:56Z) - The Data Minimization Principle in Machine Learning [61.17813282782266]
データ最小化は、収集、処理、保持されるデータの量を減らすことを目的としている。
様々な国際データ保護規制によって支持されている。
しかし、厳密な定式化が欠如しているため、その実践的な実装は依然として課題である。
論文 参考訳(メタデータ) (2024-05-29T19:40:27Z) - Privacy Amplification for the Gaussian Mechanism via Bounded Support [64.86780616066575]
インスタンスごとの差分プライバシー(pDP)やフィッシャー情報損失(FIL)といったデータ依存のプライバシ会計フレームワークは、固定されたトレーニングデータセット内の個人に対してきめ細かいプライバシー保証を提供する。
本稿では,データ依存会計下でのプライバシ保証を向上することを示すとともに,バウンドサポートによるガウス機構の簡単な修正を提案する。
論文 参考訳(メタデータ) (2024-03-07T21:22:07Z) - Auditing and Generating Synthetic Data with Controllable Trust Trade-offs [54.262044436203965]
合成データセットとAIモデルを包括的に評価する総合監査フレームワークを導入する。
バイアスや差別の防止、ソースデータへの忠実性の確保、実用性、堅牢性、プライバシ保護などに焦点を当てている。
多様なユースケースにまたがる様々な生成モデルを監査することにより,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-21T09:03:18Z) - Breaking the Communication-Privacy-Accuracy Tradeoff with
$f$-Differential Privacy [51.11280118806893]
サーバが複数のユーザの協調的なデータ分析を,プライバシの懸念と限られた通信能力で調整する,フェデレートされたデータ分析問題を考える。
有限出力空間を有する離散値機構の局所的差分プライバシー保証を$f$-differential privacy (DP) レンズを用いて検討する。
より具体的には、様々な離散的評価機構の厳密な$f$-DP保証を導出することにより、既存の文献を前進させる。
論文 参考訳(メタデータ) (2023-02-19T16:58:53Z) - Turning the Tables: Biased, Imbalanced, Dynamic Tabular Datasets for ML
Evaluation [3.737892247639591]
Bank Account Fraud (BAF)は、初めて公開され、プライバシーを保護し、大規模で現実的なグラフデータセットスイートである。
BAFは、時間的ダイナミクスや重要なクラス不均衡など、現実世界のアプリケーションで一般的な課題の集合である。
我々は,新しい手法と既存手法を評価するために,より現実的で完全かつ堅牢なテストベッドを研究コミュニティに提供することを目的としている。
論文 参考訳(メタデータ) (2022-11-24T00:03:29Z) - Heterogeneous Information Network based Default Analysis on Banking
Micro and Small Enterprise Users [18.32345474014549]
バンキングデータのグラフを考察し,その目的のために新しいHIDAMモデルを提案する。
MSEの特徴表現を強化するため,メタパスを通してインタラクティブな情報を抽出し,経路情報を完全に活用する。
実験結果から,HIDAMが現実の銀行データにおいて最先端の競争相手を上回ることが確認された。
論文 参考訳(メタデータ) (2022-04-24T11:26:12Z) - Generating synthetic transactional profiles [0.0]
本稿では,機械学習技術を用いて,合成トランザクショナルプロファイルを生成する。
筆者らは,銀行業界が原データと合成データの両方で用いている共通洞察を計算し,データの有用性を測定した。
論文 参考訳(メタデータ) (2021-10-28T18:52:04Z) - PCAL: A Privacy-preserving Intelligent Credit Risk Modeling Framework
Based on Adversarial Learning [111.19576084222345]
本稿では,PCAL(Adversarial Learning)に基づくプライバシ保護型信用リスクモデリングの枠組みを提案する。
PCALは、ターゲット予測タスクのパフォーマンスの重要なユーティリティ情報を維持しながら、元のデータセット内のプライベート情報を隠蔽することを目的としている。
結果は,PCALがユーザデータから効果的なプライバシフリー表現を学習し,信用リスク分析のためのプライバシ保存機械学習の基盤となることを示唆している。
論文 参考訳(メタデータ) (2020-10-06T07:04:59Z) - Super-App Behavioral Patterns in Credit Risk Models: Financial,
Statistical and Regulatory Implications [110.54266632357673]
従来の官僚データとは対照的に、アプリベースのマーケットプレースから派生した代替データが信用スコアモデルに与える影響を提示する。
2つの国にまたがって検証した結果、これらの新たなデータソースは、低体重者や若年者における金融行動を予測するのに特に有用であることが示された。
論文 参考訳(メタデータ) (2020-05-09T01:32:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。