Fugu-MT 論文翻訳(概要): Model Inversion in Split Learning for Personalized LLMs: New Insights from Information Bottleneck Theory

論文の概要: Model Inversion in Split Learning for Personalized LLMs: New Insights from Information Bottleneck Theory

arxiv url: http://arxiv.org/abs/2501.05965v1
Date: Fri, 10 Jan 2025 13:47:13 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-13 18:34:15.256088
Title: Model Inversion in Split Learning for Personalized LLMs: New Insights from Information Bottleneck Theory
Title（参考訳）: パーソナライズされたLLMのための分割学習におけるモデルインバージョン:インフォメーション・ボトルネック理論からの新しい視点
Authors: Yunmeng Shu, Shaofeng Li, Tian Dong, Yan Meng, Haojin Zhu,
Abstract要約: この研究は、パーソナライズされたLLMのための分割学習フレームワークにおいて、モデル反転攻撃を識別する最初のものである。本稿では,第1部が埋め込み空間に表現を投影する2段階攻撃システムを提案し,第2部は生成モデルを用いて埋め込み空間からテキストを復元する。
参考スコア（独自算出の注目度）: 11.83473842859642
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Personalized Large Language Models (LLMs) have become increasingly prevalent, showcasing the impressive capabilities of models like GPT-4. This trend has also catalyzed extensive research on deploying LLMs on mobile devices. Feasible approaches for such edge-cloud deployment include using split learning. However, previous research has largely overlooked the privacy leakage associated with intermediate representations transmitted from devices to servers. This work is the first to identify model inversion attacks in the split learning framework for LLMs, emphasizing the necessity of secure defense. For the first time, we introduce mutual information entropy to understand the information propagation of Transformer-based LLMs and assess privacy attack performance for LLM blocks. To address the issue of representations being sparser and containing less information than embeddings, we propose a two-stage attack system in which the first part projects representations into the embedding space, and the second part uses a generative model to recover text from these embeddings. This design breaks down the complexity and achieves attack scores of 38%-75% in various scenarios, with an over 60% improvement over the SOTA. This work comprehensively highlights the potential privacy risks during the deployment of personalized LLMs on the edge side.
Abstract（参考訳）: パーソナライズされた大規模言語モデル(LLM)はますます普及し、GPT-4のようなモデルの印象的な能力を示している。この傾向は、モバイルデバイスにLLMをデプロイするための広範な研究を触媒にもしている。このようなエッジクラウドデプロイメントの可能なアプローチには、スプリットラーニングの利用がある。しかし、以前の研究では、デバイスからサーバに送信される中間表現に関連するプライバシーの漏洩をほとんど見落としていた。この研究は、LLMのスプリットラーニングフレームワークにおけるモデル反転攻撃を初めて特定し、セキュアな防御の必要性を強調した。トランスフォーマーをベースとしたLLMの情報伝達を理解し,LLMブロックのプライバシ攻撃性能を評価するために,初めて相互情報エントロピーを導入する。埋め込みよりも少ない情報を含むスペーサー表現の問題に対処するため,第1部が埋め込み空間に表現を投影する2段階攻撃システムを提案し,第2部は生成モデルを用いて埋め込みからテキストを復元する。この設計は複雑さを分解し、様々なシナリオで38%-75%の攻撃スコアを達成し、SOTAよりも60%以上改善されている。この作業は、エッジにパーソナライズされたLDMをデプロイする際の潜在的なプライバシーリスクを包括的に強調する。

関連論文リスト

VFLAIR-LLM: A Comprehensive Framework and Benchmark for Split Learning of LLMs [8.920340856412087]
VFLAIR-LLMは、大規模言語モデルのための軽量な分割学習フレームワークである。 LLM(SL-LLM)設定の各種スプリットラーニングにおける5つの攻撃と9つの防御のベンチマークを行った。
論文参考訳（メタデータ） (2025-08-05T05:20:33Z)
Model Inversion Attacks on Llama 3: Extracting PII from Large Language Models [0.0]
大規模言語モデル(LLM)は自然言語処理を変革しているが、トレーニングデータを記憶する能力は、重大なプライバシーリスクをもたらす。本稿ではメタによって開発された多言語LLMであるLlama 3.2モデルに対するモデル反転攻撃について検討する。
論文参考訳（メタデータ） (2025-07-06T17:24:17Z)
PLM: Efficient Peripheral Language Models Hardware-Co-Designed for Ubiquitous Computing [48.30406812516552]
我々は、モデルアーキテクチャとエッジシステムの制約を協調的に最適化する共同設計プロセスを通じて開発された、周辺言語モデルであるPLMを紹介する。 PLMはMulti-head Latent Attentionメカニズムを採用し、正方形ReLUアクティベーション機能を採用してスパーシティを促進し、ピークメモリフットプリントを減少させる。評価の結果, PLMは, 公開されているデータに基づいて訓練された既存の小言語モデルよりも優れていた。
論文参考訳（メタデータ） (2025-03-15T15:11:17Z)
Prompt Inference Attack on Distributed Large Language Model Inference Frameworks [22.787604216912257]
現代の大規模言語モデル(LLM)の推論プロセスでは、計算資源の禁止が要求され、コンシューマグレードのデバイスへのデプロイでは不可能である。近年,資源制約のあるハードウェア上での協調LLM推論を実現するために,分割学習原理を用いた分散LLM推論フレームワークが提案されている。しかし、LDM層を参加者に分散させるには中間出力の送信が必要であるため、元の入力プロンプトにプライバシーリスクが生じる可能性がある。
論文参考訳（メタデータ） (2025-03-12T11:36:29Z)
Unveiling the Vulnerability of Private Fine-Tuning in Split-Based Frameworks for Large Language Models: A Bidirectionally Enhanced Attack [20.727726850786386]
BiSRは、スプリットラーニング(SL)の前方および後方伝播プロセスの両方をターゲットにした最初のデータ再構成攻撃である。 SLの前方および後方伝播過程を標的とした最初のデータ再構成攻撃(DRA)であるBiSRを提案する。
論文参考訳（メタデータ） (2024-09-02T06:01:20Z)
LLM-PBE: Assessing Data Privacy in Large Language Models [111.58198436835036]
大規模言語モデル(LLM)は多くのドメインに不可欠なものとなり、データ管理、マイニング、分析におけるアプリケーションを大幅に進歩させた。この問題の批判的な性質にもかかわらず、LLMにおけるデータプライバシのリスクを総合的に評価する文献は存在しない。本稿では,LLMにおけるデータプライバシリスクの体系的評価を目的としたツールキットであるLLM-PBEを紹介する。
論文参考訳（メタデータ） (2024-08-23T01:37:29Z)
Evaluating LLM-based Personal Information Extraction and Countermeasures [63.91918057570824]
大規模言語モデル(LLM)に基づく個人情報抽出をベンチマークすることができる。 LLMは攻撃者によって誤用され、個人プロファイルから様々な個人情報を正確に抽出する。プロンプトインジェクションは強力なLDMベースの攻撃に対して防御し、攻撃をより効果的でない従来の攻撃に還元する。
論文参考訳（メタデータ） (2024-08-14T04:49:30Z)
Alpaca against Vicuna: Using LLMs to Uncover Memorization of LLMs [61.04246774006429]
本稿では,攻撃者によるLSMエージェントを用いたブラックボックスプロンプト最適化手法を提案する。ベースラインプレフィックス・サフィックス測定と比較すると,命令ベースのプロンプトは,トレーニングデータと23.7%のオーバラップで出力を生成する。以上の結果から,命令調整モデルでは,ベースモデルと同等に事前学習データを公開することが可能であり,他のLSMが提案する命令を用いることで,新たな自動攻撃の道を開くことが可能であることが示唆された。
論文参考訳（メタデータ） (2024-03-05T19:32:01Z)
Pandora's White-Box: Precise Training Data Detection and Extraction in Large Language Models [4.081098869497239]
我々は,大規模言語モデル(LLM)に対する最先端のプライバシ攻撃を開発する。事前訓練されたLLMに対する新たなメンバーシップ推論攻撃(MIA)は、ベースライン攻撃の数百倍の精度で実行される。微調整では, ベースモデルと微調整モデルとの損失率に基づく単純な攻撃により, ほぼ完全なMIA性能が得られることがわかった。
論文参考訳（メタデータ） (2024-02-26T20:41:50Z)
Knowledge Fusion of Large Language Models [73.28202188100646]
本稿では,大規模言語モデル(LLM)における知識融合の概念を紹介する。我々は、それらの集合的知識と独特な強みを外部化し、それによってターゲットモデルの能力が、どのソースLLMよりも高められるようにします。この結果から,LLMの融合により,推論やコモンセンス,コード生成など,対象モデルの性能が向上することが確認された。
論文参考訳（メタデータ） (2024-01-19T05:02:46Z)
Pushing Large Language Models to the 6G Edge: Vision, Challenges, and Opportunities [32.035405009895264]
大規模言語モデル(LLM)はAI開発に革命をもたらし、私たちの未来を形作る可能性がある。 1) 長時間の応答時間、2) 帯域幅のコスト、3) データプライバシの侵害。 6Gモバイルエッジコンピューティング(MEC)システムは、これらのプレス問題を解決できるかもしれない。本稿は,6GエッジにおけるLCMのモチベーション,課題,経路を徹底的に特定するためのポジションペーパーとして機能する。
論文参考訳（メタデータ） (2023-09-28T06:22:59Z)
Identifying and Mitigating Privacy Risks Stemming from Language Models: A Survey [43.063650238194384]
大規模言語モデル(LLM)は,近年,大規模化と広範囲なトレーニングデータによるパフォーマンス向上を図っている。機械学習モデルのトレーニングデータ記憶は、特にLLMに関して、モデルサイズに合わせてスケールする。記憶されたテキストシーケンスは、LSMから直接リークされる可能性があり、データのプライバシに深刻な脅威をもたらす。
論文参考訳（メタデータ） (2023-09-27T15:15:23Z)
LLM-Pruner: On the Structural Pruning of Large Language Models [65.02607075556742]
大規模言語モデル(LLM)は、言語理解と生成において顕著な能力を示している。タスク非依存であり、元のトレーニングデータセットへの依存を最小限に抑えるという2つの制約の範囲内でLLMの圧縮に取り組む。 LLM-Prunerという名前のこの手法は、非臨界結合構造を選択的に除去する構造プルーニングを採用する。
論文参考訳（メタデータ） (2023-05-19T12:10:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。