論文の概要: Prompt injections as a tool for preserving identity in GAI image descriptions
- arxiv url: http://arxiv.org/abs/2510.16128v1
- Date: Fri, 17 Oct 2025 18:11:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:38.860082
- Title: Prompt injections as a tool for preserving identity in GAI image descriptions
- Title(参考訳): GAI画像記述におけるアイデンティティの保存ツールとしてのプロンプト注入
- Authors: Kate Glazko, Jennifer Mankoff,
- Abstract要約: ジェネレーティブAIは、GAIシステムと直接対話しないが、コンテンツに影響を及ぼすリスクがある。
間接的ユーザに対する害を軽減するためのいくつかのアプローチが説明されているが、ほとんどの場合、トップダウンまたは外部介入が必要である。
新たな戦略であるプロンプトインジェクションは、権限のある代替手段を提供する。間接的なユーザは、自身のコンテンツ内から、彼らに対する害を軽減できる。
- 参考スコア(独自算出の注目度): 10.072459389969788
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative AI risks such as bias and lack of representation impact people who do not interact directly with GAI systems, but whose content does: indirect users. Several approaches to mitigating harms to indirect users have been described, but most require top down or external intervention. An emerging strategy, prompt injections, provides an empowering alternative: indirect users can mitigate harm against them, from within their own content. Our approach proposes prompt injections not as a malicious attack vector, but as a tool for content/image owner resistance. In this poster, we demonstrate one case study of prompt injections for empowering an indirect user, by retaining an image owner's gender and disabled identity when an image is described by GAI.
- Abstract(参考訳): バイアスや表現の欠如といったジェネレーティブAIのリスクは、GAIシステムと直接対話しない人々に影響を与えるが、そのコンテンツは間接的ユーザに影響を与える。
間接的ユーザに対する害を軽減するためのいくつかのアプローチが説明されているが、ほとんどの場合、トップダウンまたは外部介入が必要である。
新たな戦略であるプロンプトインジェクションは、権限のある代替手段を提供する。間接的なユーザは、自身のコンテンツ内から、彼らに対する害を軽減できる。
本手法では,攻撃ベクトルとしてではなく,コンテンツ/イメージの所有者抵抗のためのツールとして,プロンプトインジェクションを提案する。
本稿では、画像がGAIによって記述された際に、画像所有者の性別と障害者のアイデンティティを保持することにより、間接的なユーザを力づけるためのプロンプトインジェクションのケーススタディを示す。
関連論文リスト
- CommandSans: Securing AI Agents with Surgical Precision Prompt Sanitization [17.941502260254673]
本稿では,データに実行可能命令を含まないという,コンピュータセキュリティの基本原理に着想を得た新しいアプローチを提案する。
サンプルレベルの分類の代わりに,ツール出力からAIシステムに指示された指示を外科的に除去するトークンレベルの衛生プロセスを提案する。
このアプローチは非ブロッキングであり、キャリブレーションを必要とせず、ツール出力のコンテキストに依存しない。
論文 参考訳(メタデータ) (2025-10-09T21:32:02Z) - WAInjectBench: Benchmarking Prompt Injection Detections for Web Agents [34.909802797979324]
本稿では,Webエージェントを標的としたインジェクション攻撃を検出するための総合的なベンチマーク研究を行う。
悪意のあるサンプルと良心的なサンプルの両方を含むデータセットを構築します。
次に、テキストベースと画像ベースの両方の検出方法を体系化する。
論文 参考訳(メタデータ) (2025-10-01T18:34:06Z) - PromptFlare: Prompt-Generalized Defense via Cross-Attention Decoy in Diffusion-Based Inpainting [25.24109316946351]
PromptFlareは,拡散型塗布モデルによる悪質な修正から画像を保護するために設計された,新たな敵対的保護手法である。
提案手法は, 急速埋め込みの固有特性を利用して, 対向ノイズを注入し, サンプリング過程を抑える。
EditBenchデータセットを用いた実験により,本手法が各種メトリクスの最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2025-08-22T08:42:46Z) - TopicAttack: An Indirect Prompt Injection Attack via Topic Transition [92.26240528996443]
大規模言語モデル(LLM)は間接的なインジェクション攻撃に対して脆弱である。
提案するTopicAttackは,LLMに生成した遷移プロンプトを生成し,徐々にトピックをインジェクション命令にシフトさせる。
提案手法は, インジェクトからオリジナルへのアテンション比が高く, 成功確率が高く, ベースライン法よりもはるかに高い比を達成できることがわかった。
論文 参考訳(メタデータ) (2025-07-18T06:23:31Z) - Doppelganger Method: Breaking Role Consistency in LLM Agent via Prompt-based Transferable Adversarial Attack [9.157546000159979]
本稿では,ハイジャックされているエージェントのリスクを実証するために,システム命令と内部情報を公開する「Doppelganger method」を提案する。
また,ドッペルガンガー法に対抗するための「CAT(Caution for Adversarial Transfer)」も提案する。
論文 参考訳(メタデータ) (2025-06-17T14:01:39Z) - EVA: Red-Teaming GUI Agents via Evolving Indirect Prompt Injection [14.83331240126743]
マルチモーダルエージェントは、グラフィカルユーザインタフェース(GUI)を操作してユーザタスクを完了するように、ますます訓練されている。
本稿では,攻撃をループ最適化に変換する間接的プロンプトインジェクションのフレームワークであるEVAを提案する。
EVAは、ポップアップ操作、チャットベースのフィッシング、支払い、電子メール合成などの現実的な設定において、広く使われている6つのジェネラリストおよび専門的なGUIエージェントに対して評価する。
論文 参考訳(メタデータ) (2025-05-20T12:41:05Z) - Can Indirect Prompt Injection Attacks Be Detected and Removed? [94.67980597764245]
間接的インジェクション攻撃の検出・除去の可能性について検討した。
検出のために,既存のLCMとオープンソースの検出モデルの性能を評価する。
そこで本研究では,(1) インジェクション命令を含む部分をセグメント化して除去するセグメンテーション除去法,(2) 抽出モデルを訓練してインジェクション命令を識別・除去する抽出除去法,の2つの直感的手法を評価する。
論文 参考訳(メタデータ) (2025-02-23T14:02:16Z) - CGUA: Context-Guided and Unpaired-Assisted Weakly Supervised Person
Search [54.106662998673514]
本稿では,コンテキストガイドとアンペア支援(CGUA)を弱教師付き人物検索フレームワークとして導入する。
具体的には、クラスタリングプロセスにおけるコンテキスト情報を活用する新しいコンテキストガイドクラスタ(CGC)アルゴリズムを提案する。
本手法は,より多様なラベル付きデータを活用することにより,最先端の教師付き手法に匹敵する,あるいは優れた性能を実現する。
論文 参考訳(メタデータ) (2022-03-27T13:57:30Z) - Discriminator-Free Generative Adversarial Attack [87.71852388383242]
生成的ベースの敵攻撃は、この制限を取り除くことができる。
ASymmetric Saliency-based Auto-Encoder (SSAE) は摂動を生成する。
SSAEが生成した敵の例は、広く使われているモデルを崩壊させるだけでなく、優れた視覚的品質を実現する。
論文 参考訳(メタデータ) (2021-07-20T01:55:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。