Fugu-MT 論文翻訳(概要): Multi-step Jailbreaking Privacy Attacks on ChatGPT

論文の概要: Multi-step Jailbreaking Privacy Attacks on ChatGPT

arxiv url: http://arxiv.org/abs/2304.05197v1
Date: Tue, 11 Apr 2023 13:05:04 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-12 14:53:36.348983
Title: Multi-step Jailbreaking Privacy Attacks on ChatGPT
Title（参考訳）: chatgptにおけるマルチステップ脱獄プライバシー攻撃
Authors: Haoran Li, Dadi Guo, Wei Fan, Mingshi Xu, Yangqiu Song
Abstract要約: 本稿では,ChatGPTによって強化されたOpenAIのモデルAPIとNew Bingのプライバシー上の脅威について検討する。我々は、当社の主張を裏付ける広範な実験を行い、LLMのプライバシーへの影響について論じる。
参考スコア（独自算出の注目度）: 34.33934274571435
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: With the rapid progress of large language models (LLMs), many downstream NLP tasks can be well solved given good prompts. Though model developers and researchers work hard on dialog safety to avoid generating harmful content from LLMs, it is still challenging to steer AI-generated content (AIGC) for the human good. As powerful LLMs are devouring existing text data from various domains (e.g., GPT-3 is trained on 45TB texts), it is natural to doubt whether the private information is included in the training data and what privacy threats can these LLMs and their downstream applications bring. In this paper, we study the privacy threats from OpenAI's model APIs and New Bing enhanced by ChatGPT and show that application-integrated LLMs may cause more severe privacy threats ever than before. To this end, we conduct extensive experiments to support our claims and discuss LLMs' privacy implications.
Abstract（参考訳）: 大規模言語モデル(LLM)の急速な進歩により、多くの下流のNLPタスクが適切なプロンプトによってうまく解決できる。モデル開発者や研究者は、LDMから有害なコンテンツを生成するのを避けるためにダイアログ安全性に懸命に取り組んでいますが、AIGC(AIGC)を人間の利益のために活用することは依然として困難です。強力なLLMは、様々なドメインからの既存のテキストデータ(例えば、GPT-3は45TBのテキストで訓練されている)を盗んでいるため、プライベート情報がトレーニングデータに含まれるかどうか、これらのLLMとその下流アプリケーションが提供するプライバシー上の脅威を疑うのは当然である。本稿では,ChatGPTによって強化されたOpenAIのモデルAPIとNew Bingのプライバシ脅威を調査し,アプリケーション統合LDMがこれまで以上に深刻なプライバシ脅威を引き起こす可能性があることを示す。この目的のために,我々の主張を裏付ける広範な実験を行い,LLMのプライバシーへの影響について論じる。

関連論文リスト

Beyond Data Privacy: New Privacy Risks for Large Language Models [37.95953819924652]
大規模言語モデル(LLM)は、自然言語理解、推論、自律的な意思決定において顕著な進歩を遂げている。これらの進歩には、重要なプライバシー上の懸念も伴っている。 LLMを広く使われているアプリケーションに統合し、その自律能力の武器化によって、新たなプライバシ脆弱性が生まれている。
論文参考訳（メタデータ） (2025-09-16T09:46:09Z)
SoK: The Privacy Paradox of Large Language Models: Advancements, Privacy Risks, and Mitigation [9.414685411687735]
大型言語モデル(LLM)は、機械が顕著な精度で人間に似たテキストを生成することができる高度な人工知能システムである。本稿では, LLMにおけるプライバシーの包括的分析を行い, 課題を4つの主要領域に分類する。提案するプライバシ課題を対象として,既存の緩和メカニズムの有効性と限界を評価し,さらなる研究を行うための領域を特定する。
論文参考訳（メタデータ） (2025-06-15T03:14:03Z)
PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action [54.11479432110771]
PrivacyLensは、プライバシに敏感な種子を表現的なヴィグネットに拡張し、さらにエージェントの軌跡に拡張するために設計された新しいフレームワークである。プライバシの文献とクラウドソーシングされたシードに基づいて、プライバシの規範のコレクションをインスタンス化する。 GPT-4やLlama-3-70Bのような最先端のLMは、プライバシー強化の指示が出されたとしても、機密情報を25.68%、38.69%のケースでリークしている。
論文参考訳（メタデータ） (2024-08-29T17:58:38Z)
LLM-PBE: Assessing Data Privacy in Large Language Models [111.58198436835036]
大規模言語モデル(LLM)は多くのドメインに不可欠なものとなり、データ管理、マイニング、分析におけるアプリケーションを大幅に進歩させた。この問題の批判的な性質にもかかわらず、LLMにおけるデータプライバシのリスクを総合的に評価する文献は存在しない。本稿では,LLMにおけるデータプライバシリスクの体系的評価を目的としたツールキットであるLLM-PBEを紹介する。
論文参考訳（メタデータ） (2024-08-23T01:37:29Z)
On Protecting the Data Privacy of Large Language Models (LLMs): A Survey [35.48984524483533]
LLM(Large Language Model)は、人間の言語を理解し、生成し、翻訳できる複雑な人工知能システムである。 LLMは大量のデータを処理して生成し、データプライバシを脅かす可能性がある。
論文参考訳（メタデータ） (2024-03-08T08:47:48Z)
The Good and The Bad: Exploring Privacy Issues in Retrieval-Augmented Generation (RAG) [56.67603627046346]
Retrieval-augmented Generation (RAG)は、プロプライエタリおよびプライベートデータによる言語モデルを容易にする強力な技術である。本研究では,プライベート検索データベースの漏洩に対するRAGシステムの脆弱性を実証する,新たな攻撃手法による実証的研究を行う。
論文参考訳（メタデータ） (2024-02-23T18:35:15Z)
A Survey on Large Language Model (LLM) Security and Privacy: The Good, the Bad, and the Ugly [21.536079040559517]
大規模言語モデル(LLM)は、自然言語の理解と生成に革命をもたらした。本稿では,LLMとセキュリティとプライバシの交わりについて考察する。
論文参考訳（メタデータ） (2023-12-04T16:25:18Z)
Can LLMs Keep a Secret? Testing Privacy Implications of Language Models via Contextual Integrity Theory [82.7042006247124]
私たちは、最も有能なAIモデルでさえ、人間がそれぞれ39%と57%の確率で、プライベートな情報を公開していることを示しています。我々の研究は、推論と心の理論に基づいて、新しい推論時プライバシー保護アプローチを即時に探求する必要性を浮き彫りにしている。
論文参考訳（メタデータ） (2023-10-27T04:15:30Z)
Privacy in Large Language Models: Attacks, Defenses and Future Directions [84.73301039987128]
大規模言語モデル(LLM)を対象とした現在のプライバシ攻撃を分析し、敵の想定能力に応じて分類する。本稿では、これらのプライバシー攻撃に対抗するために開発された防衛戦略について概説する。
論文参考訳（メタデータ） (2023-10-16T13:23:54Z)
Beyond Memorization: Violating Privacy Via Inference with Large Language Models [2.9373912230684565]
本稿では,テキストから個人属性を推測する事前学習言語モデルの能力に関する,最初の総合的研究について述べる。以上の結果から,現在のLCMでは,従来は達成不可能な規模で個人データを推測することが可能であることが示唆された。
論文参考訳（メタデータ） (2023-10-11T08:32:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。