論文の概要: A Privacy-Preserving Framework Using Remote Data Science for Inter-Institutional Student Retention Prediction
- arxiv url: http://arxiv.org/abs/2606.12845v1
- Date: Thu, 11 Jun 2026 03:18:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.55849
- Title: A Privacy-Preserving Framework Using Remote Data Science for Inter-Institutional Student Retention Prediction
- Title(参考訳): 教育機関間留置予測のためのリモートデータサイエンスを用いたプライバシ保護フレームワーク
- Authors: John Fields, K M Sajjadul Islam, Ruchitha Thota, Victor Chen, Praveen Madiraju,
- Abstract要約: 本研究では、PySyftプラットフォームを用いたプライバシー保護機械学習(PPML)技術について検討する。
我々は,高層サーバと低層サーバからなる半空化アーキテクチャを用いた遠隔データサイエンスフレームワークを開発した。
我々は,3つの合成データ生成手法を評価し,制度間協調による枠組みの検証を行った。
- 参考スコア(独自算出の注目度): 0.8688994028210383
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study explores privacy-preserving machine learning (PPML) techniques using the PySyft platform to enable collaborative prediction of student retention between institutions. We developed a remote data science (RDS) framework with a semi-air-gapped architecture consisting of high-side and low-side servers, allowing researchers from three universities to build predictive models on sensitive student data without direct data access. Using historical data from a small private university (N=720), we evaluated three synthetic data generation approaches and validated the framework through inter-institutional collaboration. The results demonstrate consistent classification performance across institutions (Macro F1: 0.690--0.695) while maintaining strict Family Educational Rights and Privacy Act (FERPA) compliance. We also propose Data-Type-Aware Templates, a novel synthetic data method that prioritizes privacy over distributional fidelity. Our findings confirm that RDS-based PPML is technically feasible for educational settings and offers a practical alternative to federated learning for small-scale inter-institutional collaborations. The code is available at https://github.com/jtfields/NAIRR240195-Privacy-Preserving-Machine-Learning.
- Abstract(参考訳): 本研究では,PySyftプラットフォームを用いたプライバシ保護機械学習(PPML)技術を用いて,学校間における学生の留置の協調予測を実現する。
我々は,高層・低層サーバからなる半空化アーキテクチャを用いたリモートデータサイエンス(RDS)フレームワークを開発した。
小私立大学(N=720)の履歴データを用いて,3つの合成データ生成手法を評価し,機関間協調による枠組みの検証を行った。
結果は、厳格な家族教育権及びプライバシ法(FERPA)を遵守しつつ、機関間で一貫した分類性能(マクロF1: 0.690--0.695)を示した。
また,分散性よりもプライバシを優先する新しい合成データ手法であるData-Type-Aware Templatesを提案する。
本研究は,RTSをベースとしたPPMLが技術的に教育現場で実現可能であり,小規模施設間連携のためのフェデレーション学習の実践的代替手段であることを確認した。
コードはhttps://github.com/jtfields/NAIRR240195-Privacy-Preserving-Machine-Learningで公開されている。
関連論文リスト
- Synthetic Data in Education: Empirical Insights from Traditional Resampling and Deep Generative Models [0.391985484065646]
本研究では,従来の再サンプリング手法と最新のディープラーニング手法を比較した最初の体系的ベンチマークを示す。
我々は3つのディープラーニングモデル(Autoencoder, Variational Autoencoder, Copula-GAN)に対して3つの再サンプリング手法(SMOTE, Bootstrap, Random Oversampling)を評価する。
再サンプリング手法は、ほぼ完全なユーティリティ(TSTR:0.997)を実現するが、完全なプライバシ保護(DCR 0.00)が失敗する一方、ディープラーニングモデルは、大きなユーティリティコストで強力なプライバシ保証(DCR 1.00)を提供する。
論文 参考訳(メタデータ) (2026-04-22T19:23:25Z) - Privacy-Preserving Model Transcription with Differentially Private Synthetic Distillation [67.76456940243294]
プライベートデータセットでトレーニングされたディープラーニングモデルは、プライバシー漏洩のリスクを引き起こす可能性がある。
本稿では,データフリーモデル-モデル変換ソリューションであるエンフェプライシ保存モデル転写について述べる。
論文 参考訳(メタデータ) (2026-01-27T01:51:35Z) - Towards Split Learning-based Privacy-Preserving Record Linkage [49.1574468325115]
ユーザデータのプライバシが要求されるアプリケーションを容易にするために、Split Learningが導入されている。
本稿では,プライバシ保護記録マッチングのための分割学習の可能性について検討する。
論文 参考訳(メタデータ) (2024-09-02T09:17:05Z) - FewFedPIT: Towards Privacy-preserving and Few-shot Federated Instruction Tuning [54.26614091429253]
フェデレーション・インストラクション・チューニング(FedIT)は、複数のデータ所有者間で協調的なトレーニングを統合することで、有望なソリューションである。
FedITは、インストラクショナルデータの不足や、トレーニングデータ抽出攻撃への露出リスクなどの制限に直面している。
本稿では,FewFedPITを提案する。このFewFedPITは,フェデレートされた数ショット学習のプライバシー保護とモデル性能を同時に向上する。
論文 参考訳(メタデータ) (2024-03-10T08:41:22Z) - Federated Learning Empowered by Generative Content [55.576885852501775]
フェデレートラーニング(FL)は、プライバシ保護方法でモデルのトレーニングに分散プライベートデータを活用可能にする。
本稿では,FedGCと呼ばれる新しいFLフレームワークを提案する。
我々は、さまざまなベースライン、データセット、シナリオ、モダリティをカバーする、FedGCに関する体系的な実証的研究を行う。
論文 参考訳(メタデータ) (2023-12-10T07:38:56Z) - Approximate, Adapt, Anonymize (3A): a Framework for Privacy Preserving
Training Data Release for Machine Learning [3.29354893777827]
データリリースフレームワークである3A(Approximate, Adapt, Anonymize)を導入し、機械学習のデータユーティリティを最大化する。
本稿では,実データセットと民生データセットでトレーニングしたモデルの性能指標の相違が最小限に抑えられることを示す実験的な証拠を示す。
論文 参考訳(メタデータ) (2023-07-04T18:37:11Z) - FedLAP-DP: Federated Learning by Sharing Differentially Private Loss Approximations [53.268801169075836]
我々は,フェデレーション学習のための新しいプライバシ保護手法であるFedLAP-DPを提案する。
公式なプライバシー分析は、FedLAP-DPが典型的な勾配共有方式と同じプライバシーコストを発生させることを示している。
提案手法は, 通常の勾配共有法に比べて高速な収束速度を示す。
論文 参考訳(メタデータ) (2023-02-02T12:56:46Z) - Federated Learning and Differential Privacy: Software tools analysis,
the Sherpa.ai FL framework and methodological guidelines for preserving data
privacy [8.30788601976591]
本稿では,フェデレートラーニングと差分プライバシの全体観に基づいて構築されたSherpa.aiフェデレーションラーニングフレームワークを提案する。
本稿では,Sherpa.aiフェデレートラーニングフレームワークで方法論ガイドラインに従う方法について,分類と回帰ユースケースを用いて示す。
論文 参考訳(メタデータ) (2020-07-02T06:47:35Z) - Concentrated Differentially Private and Utility Preserving Federated
Learning [24.239992194656164]
フェデレーション・ラーニング(Federated Learning)とは、エッジデバイスのセットが、中央サーバのオーケストレーションの下でモデルを協調的にトレーニングする、機械学習環境である。
本稿では,モデルユーティリティの劣化を伴わずに,プライバシ問題に対処するフェデレーション学習手法を開発する。
このアプローチのエンドツーエンドのプライバシ保証を厳格に提供し、理論的収束率を分析します。
論文 参考訳(メタデータ) (2020-03-30T19:20:42Z) - User-Level Privacy-Preserving Federated Learning: Analysis and
Performance Optimization [77.43075255745389]
フェデレートラーニング(FL)は、データを有用なモデルにトレーニングしながら、モバイル端末(MT)からプライベートデータを保存することができる。
情報理論の観点からは、MTがアップロードした共有モデルから、好奇心の強いサーバがプライベートな情報を推測することが可能である。
サーバにアップロードする前に、共有モデルに人工ノイズを加えることで、ユーザレベルの差分プライバシー(UDP)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-29T10:13:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。