Fugu-MT 論文翻訳(概要): Position: It's Time to Act on the Risk of Efficient Personalized Text Generation

論文の概要: Position: It's Time to Act on the Risk of Efficient Personalized Text Generation

arxiv url: http://arxiv.org/abs/2502.06560v2
Date: Mon, 02 Jun 2025 08:49:20 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-03 16:22:43.057268
Title: Position: It's Time to Act on the Risk of Efficient Personalized Text Generation
Title（参考訳）: 位置:効率的な個人化テキスト生成のリスクに対処する時が来た
Authors: Eugenia Iofinova, Andrej Jovanovic, Dan Alistarh,
Abstract要約: 我々は、特定の個人を偽装する可能性もまた、新しい安全リスクをもたらすと論じている。例えば、この技術はフィッシングメールや不正なソーシャルメディアアカウントの作成を可能にする。これらのリスクは、他の偽装攻撃の非常に疑わしいリスクと相補的であり、異なるものである、と我々は主張する。
参考スコア（独自算出の注目度）: 34.46326274747647
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The recent surge in high-quality open-source Generative AI text models (colloquially: LLMs), as well as efficient finetuning techniques, have opened the possibility of creating high-quality personalized models that generate text attuned to a specific individual's needs and are capable of credibly imitating their writing style by refining an open-source model with that person's own data. The technology to create such models is accessible to private individuals, and training and running such models can be done cheaply on consumer-grade hardware. While these advancements are a huge gain for usability and privacy, this position paper argues that the practical feasibility of impersonating specific individuals also introduces novel safety risks. For instance, this technology enables the creation of phishing emails or fraudulent social media accounts, based on small amounts of publicly available text, or by the individuals themselves to escape AI text detection. We further argue that these risks are complementary to - and distinct from - the much-discussed risks of other impersonation attacks such as image, voice, or video deepfakes, and are not adequately addressed by the larger research community, or the current generation of open- and closed-source models.
Abstract（参考訳）: 近年の高品質なオープンソースジェネレーティブAIテキストモデル(LLM)の急増は、効率的な微調整技術とともに、特定の個人のニーズに合わせたテキストを生成する高品質なパーソナライズされたモデルを作成する可能性を開放し、その人のデータでオープンソースモデルを精査することで、彼らの書き込みスタイルを確実に模倣することができる。このようなモデルを作成する技術は個人でも利用でき、そのようなモデルのトレーニングと実行は、コンシューマグレードのハードウェアで安価に行うことができる。これらの進歩は、ユーザビリティとプライバシにとって大きな進歩であるが、このポジションペーパーは、特定の個人を偽装する現実的な実現可能性もまた、新しい安全リスクをもたらすと主張している。例えば、この技術は、少量の公開テキストに基づいたフィッシングメールや不正なソーシャルメディアアカウントの作成、あるいは個人によるAIテキスト検出の回避を可能にする。さらに、これらのリスクは、画像、音声、ビデオのディープフェイクといった他の偽造攻撃の非常に議論の的になっているリスクと相補的であり、より大きな研究コミュニティや、現在のオープンソースモデルやクローズドソースモデルによって適切に対処されていないことを議論する。

関連論文リスト

Automated Profile Inference with Language Model Agents [67.32226960040514]
自動プロファイル推論(Automatic Profile Inference)と呼ばれる,LLMがオンラインの偽名にもたらす新たな脅威について検討する。相手は、LDMに対して、疑似プラットフォーム上で公開されているユーザアクティビティから、機密性の高い個人属性を自動的に取り除き、抽出するように指示することができる。実世界のシナリオにおけるこのような脅威の可能性を評価するために,AutoProfilerという自動プロファイリングフレームワークを導入する。
論文参考訳（メタデータ） (2025-05-18T13:05:17Z)
Personalized Risks and Regulatory Strategies of Large Language Models in Digital Advertising [5.250286096386298]
本稿では,デジタル広告における大規模言語モデルのパーソナライズされたリスクと規制戦略について検討する。実験の結果,BERTベースの広告プッシュは,広告のクリックスルー率と変換率を効果的に向上させることができることがわかった。
論文参考訳（メタデータ） (2025-05-07T04:25:41Z)
On the Privacy Risk of In-context Learning [36.633860818454984]
我々は、プロンプトモデルがプロンプト内で使用されるデータに対して、重大なプライバシーリスクを示すことを示した。また、トリガーモデルのプライバシリスクが、同じユーティリティレベルで微調整されたモデルを超えることも観察します。
論文参考訳（メタデータ） (2024-11-15T17:11:42Z)
Forget to Flourish: Leveraging Machine-Unlearning on Pretrained Language Models for Privacy Leakage [12.892449128678516]
下流アプリケーション用のプライベートデータ上の微調整言語モデルは、重大なプライバシーリスクを生じさせる。いくつかの人気のあるコミュニティプラットフォームが、様々な事前訓練されたモデルの便利な配布を提供している。本稿では,モデル学習を攻撃ツールとして利用する新しい毒殺手法を提案する。
論文参考訳（メタデータ） (2024-08-30T15:35:09Z)
Adversarial Robustness of Open-source Text Classification Models and Fine-Tuning Chains [11.379606061113348]
オープンソースのAIモデルと微調整チェーンは、敵攻撃のような新たなセキュリティリスクに直面している。本稿では,超微調整による上流-下流関係によって形成される,オープンソースのAIモデルとそのチェーンの対角的堅牢性を検討することを目的とする。
論文参考訳（メタデータ） (2024-08-06T05:17:17Z)
Robust Utility-Preserving Text Anonymization Based on Large Language Models [80.5266278002083]
テキストの匿名化は、プライバシーを維持しながら機密データを共有するために重要である。既存の技術は、大規模言語モデルの再識別攻撃能力の新たな課題に直面している。本稿では,3つのLCMベースコンポーネント – プライバシ評価器,ユーティリティ評価器,最適化コンポーネント – で構成されるフレームワークを提案する。
論文参考訳（メタデータ） (2024-07-16T14:28:56Z)
Anonymization Prompt Learning for Facial Privacy-Preserving Text-to-Image Generation [56.46932751058042]
我々は、テキストから画像への拡散モデルのための学習可能なプロンプトプレフィックスをトレーニングし、匿名化された顔のアイデンティティを生成するよう強制する。実験では,非同一性固有の画像生成の品質を損なうことなく,特定の個人を匿名化するAPLの匿名化性能を実証した。
論文参考訳（メタデータ） (2024-05-27T07:38:26Z)
Privacy Backdoors: Enhancing Membership Inference through Poisoning Pre-trained Models [112.48136829374741]
本稿では、プライバシーバックドア攻撃という新たな脆弱性を明らかにします。被害者がバックドアモデルに微調整を行った場合、トレーニングデータは通常のモデルに微調整された場合よりも大幅に高い速度でリークされる。我々の発見は、機械学習コミュニティにおける重要なプライバシー上の懸念を浮き彫りにし、オープンソースの事前訓練モデルの使用における安全性プロトコルの再評価を求めている。
論文参考訳（メタデータ） (2024-04-01T16:50:54Z)
Membership Inference Attacks and Privacy in Topic Modeling [3.503833571450681]
トレーニングデータのメンバーを確実に識別できるトピックモデルに対する攻撃を提案する。本稿では,DP語彙選択を前処理ステップとして組み込んだプライベートトピックモデリングフレームワークを提案する。
論文参考訳（メタデータ） (2024-03-07T12:43:42Z)
Fortifying Ethical Boundaries in AI: Advanced Strategies for Enhancing Security in Large Language Models [3.9490749767170636]
大規模言語モデル(LLM)は、テキスト生成、翻訳、質問応答タスクに革命をもたらした。広く使われているにもかかわらず、LLMはモデルに不適切な反応を強いられる場合の倫理的ジレンマのような課題を提示している。本稿では,1)ユーザ入力からセンシティブな語彙をフィルタリングして非倫理的応答を防ぐ,2)"プライソンブレイク"シナリオにつながる可能性のあるインタラクションを停止するロールプレイングを検出する,4)マルチモデル大規模言語モデル(MLLM)のような様々なLLM派生語に拡張する,という課題に対処する。
論文参考訳（メタデータ） (2024-01-27T08:09:33Z)
PrivacyMind: Large Language Models Can Be Contextual Privacy Protection Learners [81.571305826793]
コンテキストプライバシ保護言語モデル(PrivacyMind)を紹介する。我々の研究はモデル設計に関する理論的分析を提供し、様々な手法をベンチマークする。特に、肯定的な例と否定的な例の両方による命令チューニングは、有望な方法である。
論文参考訳（メタデータ） (2023-10-03T22:37:01Z)
BAGM: A Backdoor Attack for Manipulating Text-to-Image Generative Models [54.19289900203071]
テキストから画像への生成人工知能の普及は、大衆の関心を集めている。ユーザを微妙に操作するコンテンツを生成するために,この技術を攻撃できることを実証する。テキストから画像生成モデル(BAGM)に対するバックドアアタックを提案する。我々の攻撃は、生成過程の3段階にわたる3つの一般的なテキスト・画像生成モデルをターゲットにした最初の攻撃である。
論文参考訳（メタデータ） (2023-07-31T08:34:24Z)
Synthetic Text Generation with Differential Privacy: A Simple and Practical Recipe [32.63295550058343]
テキスト領域におけるシンプルで実用的なレシピは、強力なプライバシー保護を備えた有用な合成テキストを生成するのに有効であることを示す。提案手法は,非私的テキストと実用性で競合する合成テキストを生成する。
論文参考訳（メタデータ） (2022-10-25T21:21:17Z)
Membership Inference Attacks Against Text-to-image Generation Models [23.39695974954703]
本稿では,メンバシップ推論のレンズを用いたテキスト・画像生成モデルの最初のプライバシ解析を行う。本稿では,メンバーシップ情報に関する3つの重要な直観と,それに応じて4つの攻撃手法を設計する。提案した攻撃はいずれも大きな性能を達成でき、場合によっては精度が1に近い場合もあり、既存のメンバーシップ推論攻撃よりもはるかに深刻なリスクとなる。
論文参考訳（メタデータ） (2022-10-03T14:31:39Z)
Just Fine-tune Twice: Selective Differential Privacy for Large Language Models [69.66654761324702]
本稿では,大規模なトランスフォーマーベース言語モデルのためのSDPを実現するための,シンプルで効果的なジャストファイントゥンツースプライバシ機構を提案する。実験により, カナリア挿入攻撃に対して頑健でありながら, 高い性能が得られた。
論文参考訳（メタデータ） (2022-04-15T22:36:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。