Fugu-MT 論文翻訳(概要): FIGURA: A Modular Prompt Engineering Method for Artistic Figure Photography in Safety-Filtered Text-to-Image Models

論文の概要: FIGURA: A Modular Prompt Engineering Method for Artistic Figure Photography in Safety-Filtered Text-to-Image Models

arxiv url: http://arxiv.org/abs/2603.20201v1
Date: Fri, 20 Feb 2026 15:16:41 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-06 02:36:12.880203
Title: FIGURA: A Modular Prompt Engineering Method for Artistic Figure Photography in Safety-Filtered Text-to-Image Models
Title（参考訳）: FIGURA:安全フィルタ型テキスト・画像モデルにおける図像撮影のためのモジュラー・プロンプト・エンジニアリング手法
Authors: Luca Cazzaniga,
Abstract要約: 商業用テキスト・トゥ・イメージ(T2I)モデルの安全フィルタは、人間の人物を含む合法的な芸術的コンテンツを体系的にブロックする。 8つの相互接続した知識ファイルからなるモジュール型プロンプトエンジニアリングシステムであるFIGURA法を提案する。提案システムは5つの構造化されたプロンプトテンプレートに対して80%から90%の文書化成功率を達成することを示す。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Safety filters in commercial text-to-image (T2I) models systematically block legitimate artistic content involving the human figure, treating classical nude photography with the same restrictiveness as explicit material. While prior research has documented this problem extensively, no operational system exists that enables professional artists to generate artistic figure photography within the constraints of active safety filters. We present the FIGURA Method (Framework for Intelligent Generation of Unrestricted Artistic Results), a modular prompt engineering system comprising eight interconnected knowledge files, empirically validated through 200+ documented generation tests on FLUX 2 Pro (Cloud) with active safety filters at the default tolerance level. Our systematic testing reveals several previously undocumented findings: (1) safety filters primarily detect absence descriptions (references to missing clothing) rather than presence descriptions (references to body form), which we formalize as the Golden Rule; (2) artistic references to painters function simultaneously as aesthetic guides and as safety anchors that alter filter behavior; (3) spatial context operates as an independent filter variable, with documented success rate hierarchies; and (4) geometric vocabulary for body description bypasses pattern recognition in silhouette contexts. The system achieves documented success rates between 80% and 90% across five structured prompt templates, demonstrating that the artistic censorship problem identified in recent literature admits practical, systematic solutions that work with active safety mechanisms rather than circumventing them.
Abstract（参考訳）: 商業用テキスト・トゥ・イメージ(T2I)モデルの安全フィルタは、人間の人物を含む合法的な芸術的コンテンツを体系的にブロックし、古典的なヌード写真は明示的な素材と同じ制約で扱う。これまでの研究では、この問題を広く文書化してきたが、プロのアーティストが能動型安全フィルタの制約の中で芸術的なフィギュア写真を作成することができるような運用システムはない。 FLUX 2 Pro (クラウド) 上の200以上の文書化生成テストを通じて, 既定耐久レベルにアクティブな安全フィルタを付加した, 8つの相互接続された知識ファイルからなるモジュール型プロンプトエンジニアリングシステムであるFIGURA法を提案する。本研究の体系化試験では,(1)ゴールデンルールを定式化した存在記述(身体形態への言及)ではなく,不在記述(衣服への言及)を主に検出する安全性フィルタ,(2)美的ガイドとフィルタの振る舞いを変える安全アンカーとして機能する画家への芸術的参照,(3)成功率階層を文書化した独立したフィルタ変数として機能する空間的コンテキスト,(4)シルエットコンテキストのパターン認識をバイパスする身体記述のための幾何学的語彙など,これまでに報告されていないいくつかの知見が明らかになった。このシステムは、5つの構造化されたプロンプトテンプレートに対して80%から90%の成功率の文書化を達成し、最近の文献で特定されている芸術検閲問題は、それを回避するのではなく、アクティブな安全メカニズムを扱う実践的で体系的な解決策を認めることを実証している。

関連論文リスト

Low-Effort Jailbreak Attacks Against Text-to-Image Safety Filters [17.105244809853907]
現代のテキスト・ツー・イメージモデルは、自然言語のプロンプトのみを必要とする低便なジェイルブレイク攻撃に対して脆弱なままであることを示す。本稿では,モデルアクセスや最適化,対向訓練を伴わずに安全フィルタを回避できるプロンプトベースの戦略の体系的研究を行う。我々はこれらの攻撃を最先端のテキスト・ツー・イメージシステムで評価し、単純な言語修正が既存の安全対策を確実に回避できることを実証した。
論文参考訳（メタデータ） (2026-04-02T10:51:58Z)
SynthID-Image: Image watermarking at internet scale [55.5714762895087]
本稿では,AI生成画像の透かしを行うディープラーニングシステムであるSynthID-Imageを紹介する。本稿では,このようなシステムをインターネット規模で展開する上での技術的デシラタ,脅威モデル,実践的課題について述べる。
論文参考訳（メタデータ） (2025-10-10T11:03:31Z)
Multimodal Prompt Decoupling Attack on the Safety Filters in Text-to-Image Models [73.43013217318965]
マルチモーダル・プロンプト・デカップリング・アタック(MPDA) MPDAは画像モダリティを使用して、元の安全でないプロンプトの有害なセマンティックコンポーネントを分離する。ビジュアル言語モデルは、生成したNSFW画像と元の安全でないプロンプトとのセマンティック一貫性を確保するために画像キャプションを生成する。
論文参考訳（メタデータ） (2025-09-21T11:22:32Z)
VCE: Safe Autoregressive Image Generation via Visual Contrast Exploitation [57.36681904639463]
自己回帰的テキスト・画像モデルを保護する方法はまだ未検討のままである。コンテンツセマンティクスから安全でない概念を正確に分離する新しいフレームワークであるVisual Contrast Exploitation (VCE)を提案する。提案手法は,安全でない概念を消去し,無関係な概念の整合性を保ちながら,最先端の成果を効果的に確保できることを実証する。
論文参考訳（メタデータ） (2025-09-21T09:00:27Z)
PromptGuard: Soft Prompt-Guided Unsafe Content Moderation for Text-to-Image Models [38.45239843869313]
テキスト・ツー・イメージ(T2I)モデルは、テキスト記述から高品質な画像を生成する際、顕著な性能を示した。 T2Iモデルは、特にNSFW(Not-safe-for-work)コンテンツを生成する誤用に対して脆弱である。本稿では,大規模言語モデルにおけるシステムプロンプト機構からインスピレーションを得る新しいコンテンツモデレーション手法であるPromptGuardを紹介する。
論文参考訳（メタデータ） (2025-01-07T05:39:21Z)
Safety Without Semantic Disruptions: Editing-free Safe Image Generation via Context-preserving Dual Latent Reconstruction [88.18235230849554]
大規模で未処理のデータセットでマルチモーダル生成モデルをトレーニングすることで、ユーザは有害で安全でない、議論の余地のない、文化的に不適切なアウトプットにさらされる可能性がある。我々は、安全な埋め込みと、より安全な画像を生成するために、潜伏空間の重み付け可能な総和による修正拡散プロセスを活用する。安全と検閲のトレードオフを特定し、倫理的AIモデルの開発に必要な視点を提示します。
論文参考訳（メタデータ） (2024-11-21T09:47:13Z)
Growth Inhibitors for Suppressing Inappropriate Image Concepts in Diffusion Models [35.2881940850787]
テキストと画像の拡散モデルは、広範かつ未フィルタリングのトレーニングデータから不適切な概念を不適切な方法で学習する。本手法は,画像レベルでの微妙な単語の出現を効果的に捉え,ターゲット概念の直接的かつ効率的な消去を可能にする。
論文参考訳（メタデータ） (2024-08-02T05:17:14Z)
SneakyPrompt: Jailbreaking Text-to-image Generative Models [20.645304189835944]
我々は,最初の自動攻撃フレームワークであるSneakyPromptをジェイルブレイクテキスト画像生成モデルに提案する。安全フィルタによってブロックされるプロンプトを与えられたSneakyPromptは、テキスト・ツー・イメージ生成モデルを繰り返しクエリし、クエリ結果に基づいてプロンプト内のトークンを戦略的に摂動させ、安全フィルタをバイパスする。評価の結果,SneakyPromptはNSFW画像の生成に成功しているだけでなく,jailbreakテキスト・画像生成モデルに拡張された場合,既存のテキスト敵攻撃よりも優れていた。
論文参考訳（メタデータ） (2023-05-20T03:41:45Z)
Taming Encoder for Zero Fine-tuning Image Customization with Text-to-Image Diffusion Models [55.04969603431266]
本稿では,ユーザが指定したカスタマイズされたオブジェクトの画像を生成する手法を提案する。この手法は、従来のアプローチで要求される長大な最適化をバイパスする一般的なフレームワークに基づいている。提案手法は, 出力品質, 外観の多様性, 被写体忠実度を考慮した画像合成が可能であることを示す。
論文参考訳（メタデータ） (2023-04-05T17:59:32Z)
Semantic-aware Occlusion Filtering Neural Radiance Fields in the Wild [10.066261691282016]
本稿では,制約のない観光写真からニューラルシーン表現を再構築するための学習フレームワークを提案する。 SF-NeRFは,静的成分と過渡成分を少数の画像で切り離すことを目的としている。フィルタモジュールの曖昧な分解とノイズを防止できる2つの手法を提案する。
論文参考訳（メタデータ） (2023-03-05T11:50:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。