Fugu-MT 論文翻訳(概要): FedPIT: Towards Privacy-preserving and Few-shot Federated Instruction Tuning

論文の概要: FedPIT: Towards Privacy-preserving and Few-shot Federated Instruction Tuning

arxiv url: http://arxiv.org/abs/2403.06131v1
Date: Sun, 10 Mar 2024 08:41:22 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-13 07:25:56.569770
Title: FedPIT: Towards Privacy-preserving and Few-shot Federated Instruction Tuning
Title（参考訳）: FedPIT:プライバシ保護とFederated Instruction Tuningへの取り組み
Authors: Zhuo Zhang, Jingyuan Zhang, Jintao Huang, Lizhen Qu, Hongzhi Zhang, Zenglin Xu
Abstract要約: フェデレーション・インストラクション・チューニング(FedIT)は、プライバシを保護しながら、複数のデータオーナからのフェデレーション・ラーニングを活用するソリューションとして登場した。我々は,LLMのコンテキスト内学習機能を利用して,タスク固有の合成データを自己生成して自律的に学習する,新しいフェデレーションアルゴリズムであるFedPITを提案する。本手法では,データ抽出攻撃を効果的に抑えるため,パラメータ分離学習を用いて,合成データと拡張局所データで訓練された局所パラメータのグローバルパラメータを維持できる。
参考スコア（独自算出の注目度）: 39.348555094457474
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Instruction tuning has proven essential for enhancing the performance of large language models (LLMs) in generating human-aligned responses. However, collecting diverse, high-quality instruction data for tuning poses challenges, particularly in privacy-sensitive domains. Federated instruction tuning (FedIT) has emerged as a solution, leveraging federated learning from multiple data owners while preserving privacy. Yet, it faces challenges due to limited instruction data and vulnerabilities to training data extraction attacks. To address these issues, we propose a novel federated algorithm, FedPIT, which utilizes LLMs' in-context learning capability to self-generate task-specific synthetic data for training autonomously. Our method employs parameter-isolated training to maintain global parameters trained on synthetic data and local parameters trained on augmented local data, effectively thwarting data extraction attacks. Extensive experiments on real-world medical data demonstrate the effectiveness of FedPIT in improving federated few-shot performance while preserving privacy and robustness against data heterogeneity.
Abstract（参考訳）: 大規模言語モデル(LLM)の性能向上には,インストラクションチューニングが不可欠であることが証明されている。しかし、特にプライバシーに敏感なドメインにおいて、チューニングのための多様で高品質な命令データを集めることは課題となる。フェデレーション命令チューニング(federated instruction tuning, fedit)は、プライバシを維持しながら、複数のデータ所有者からのフェデレーション学習を活用するソリューションとして登場した。しかし、データ抽出攻撃のトレーニングに限られた命令データと脆弱性があるため、課題に直面している。これらの課題に対処するために,LLMのインコンテキスト学習機能を利用してタスク固有の合成データを自律的に生成するフェデレーションアルゴリズムであるFedPITを提案する。本手法では,データ抽出攻撃を効果的に抑えるため,パラメータ分離学習を用いて,合成データと拡張局所データで訓練された局所パラメータのグローバルパラメータを維持できる。実世界の医療データに対する大規模な実験は、フェデレートされた数ショットのパフォーマンスを改善する上でFedPITの有効性を示し、プライバシーとデータ不均一性に対する堅牢性を保っている。

関連論文リスト

Improving Noise Efficiency in Privacy-preserving Dataset Distillation [59.57846442477106]
本稿では,最適化からサンプリングを分離してコンバージェンスを向上し,信号品質を向上させる新しいフレームワークを提案する。 CIFAR-10では,従来の最先端手法の蒸留セットサイズを5分の1に減らして,クラス毎50イメージでtextbf10.0%,クラス毎50イメージで textbf8.3%向上した。
論文参考訳（メタデータ） (2025-08-03T13:15:52Z)
Federated Learning for Cross-Domain Data Privacy: A Distributed Approach to Secure Collaboration [13.206587690640147]
本稿では,フェデレート学習に基づくデータプライバシ保護フレームワークを提案する。分散学習によるデータプライバシの確保を前提として、効果的なクロスドメインデータコラボレーションを実現することを目的としている。
論文参考訳（メタデータ） (2025-03-31T23:04:45Z)
Differential Privacy Personalized Federated Learning Based on Dynamically Sparsified Client Updates [12.373620724244475]
本稿では,動的に分散化されたクライアント更新を利用する個人個人化学習手法を提案する。 EMNIST, CIFAR-10, CIFAR-100の実験結果から, 提案手法が優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2025-03-12T09:34:05Z)
Federated Knowledge Recycling: Privacy-Preserving Synthetic Data Sharing [5.0243930429558885]
フェデレーション・ナレッジ・リサイクリング(FedKR)は、組織間のコラボレーションを促進するために、局所的に生成された合成データを利用するクロスサイロ・フェデレーション・ラーニング・アプローチである。 FedKRは、高度なデータ生成技術と動的な集約プロセスを組み合わせることで、既存の方法よりも高いセキュリティを提供する。
論文参考訳（メタデータ） (2024-07-30T13:56:26Z)
Personalized Federated Learning with Attention-based Client Selection [57.71009302168411]
我々は,意図に基づくクライアント選択機構を備えた新しいPFLアルゴリズムであるFedACSを提案する。 FedACSは、類似したデータ分散を持つクライアント間のコラボレーションを強化するためのアテンションメカニズムを統合している。 CIFAR10とFMNISTの実験は、FedACSの優位性を検証する。
論文参考訳（メタデータ） (2023-12-23T03:31:46Z)
Federated Learning Empowered by Generative Content [55.576885852501775]
フェデレートラーニング(FL)は、プライバシ保護方法でモデルのトレーニングに分散プライベートデータを活用可能にする。本稿では,FedGCと呼ばれる新しいFLフレームワークを提案する。我々は、さまざまなベースライン、データセット、シナリオ、モダリティをカバーする、FedGCに関する体系的な実証的研究を行う。
論文参考訳（メタデータ） (2023-12-10T07:38:56Z)
PrivacyMind: Large Language Models Can Be Contextual Privacy Protection Learners [81.571305826793]
コンテキストプライバシ保護言語モデル(PrivacyMind)を紹介する。我々の研究はモデル設計に関する理論的分析を提供し、様々な手法をベンチマークする。特に、肯定的な例と否定的な例の両方による命令チューニングは、有望な方法である。
論文参考訳（メタデータ） (2023-10-03T22:37:01Z)
Approximate, Adapt, Anonymize (3A): a Framework for Privacy Preserving Training Data Release for Machine Learning [3.29354893777827]
データリリースフレームワークである3A(Approximate, Adapt, Anonymize)を導入し、機械学習のデータユーティリティを最大化する。本稿では,実データセットと民生データセットでトレーニングしたモデルの性能指標の相違が最小限に抑えられることを示す実験的な証拠を示す。
論文参考訳（メタデータ） (2023-07-04T18:37:11Z)
PS-FedGAN: An Efficient Federated Learning Framework Based on Partially Shared Generative Adversarial Networks For Data Privacy [56.347786940414935]
分散計算のための効果的な学習パラダイムとして、フェデレートラーニング(FL)が登場した。本研究は,部分的なGANモデル共有のみを必要とする新しいFLフレームワークを提案する。 PS-FedGANと名付けられたこの新しいフレームワークは、異種データ分散に対処するためのGANリリースおよびトレーニングメカニズムを強化する。
論文参考訳（メタデータ） (2023-05-19T05:39:40Z)
Differentially Private Language Models for Secure Data Sharing [19.918137395199224]
本稿では,生成言語モデルを個別に学習し,その結果を抽出する方法について述べる。自然言語のプロンプトと新しいプロンプトミスマッチの損失を用いることで、高度に正確で流動的なテキストデータセットを作成できる。我々は、我々の合成データセットが元のデータから情報を漏らさず、言語質が高いことを示す徹底的な実験を行う。
論文参考訳（メタデータ） (2022-10-25T11:12:56Z)
Federated Learning in Non-IID Settings Aided by Differentially Private Synthetic Data [20.757477553095637]
Federated Learning(FL)は、クライアントが機械学習モデルを協調的にトレーニングすることを可能にする、プライバシプロモーティングフレームワークである。連合学習における大きな課題は、局所データが不均一であるときに生じる。我々は、クライアントが変動自動エンコーダをデプロイして、遅延データ表現の微分プライベートな手段を用いて、ローカルデータセットを合成するFLアルゴリズムであるFedDPMSを提案する。
論文参考訳（メタデータ） (2022-06-01T18:00:48Z)
Scotch: An Efficient Secure Computation Framework for Secure Aggregation [0.0]
フェデレーション学習は、複数のデータ所有者がプライベートデータセットを公開せずに、機械学習モデルを共同でトレーニングすることを可能にする。悪意のある集約サーバは、モデルパラメータを使用して、使用したトレーニングデータセットに関する機密情報を導き出すことができる。フェデレーションアグリゲーションのための分散化テキストitm-partyセキュア計算フレームワークであるtextscScotch を提案する。
論文参考訳（メタデータ） (2022-01-19T17:16:35Z)
Differentially Private Federated Learning with Laplacian Smoothing [72.85272874099644]
フェデレートラーニングは、ユーザ間でプライベートデータを共有せずに、協調的にモデルを学習することで、データのプライバシを保護することを目的としている。敵は、リリースしたモデルを攻撃することによって、プライベートトレーニングデータを推測することができる。差別化プライバシは、トレーニングされたモデルの正確性や実用性を著しく低下させる価格で、このような攻撃に対する統計的保護を提供する。
論文参考訳（メタデータ） (2020-05-01T04:28:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。