Fugu-MT 論文翻訳(概要): One-Prompt Censorship Evasion via Generative Diffusion Models

論文の概要: One-Prompt Censorship Evasion via Generative Diffusion Models

arxiv url: http://arxiv.org/abs/2606.22717v1
Date: Sun, 21 Jun 2026 23:28:58 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-25 05:09:28.891613
Title: One-Prompt Censorship Evasion via Generative Diffusion Models
Title（参考訳）: 生成拡散モデルによるワンプロンプトセンサシップの伝播
Authors: Shiyi Ling, Yuhang Gan, Chen Qian,
Abstract要約: FlowPaintは、ネットワークフローで画像間のセマンティックな編集を行うための新しいフレームワークである。本研究では,大規模な拡散モデルの「世界知識」を活用して,検閲されたトラフィックを良質なパターンに自動変換する新たな生成フレームワークを提案する。
参考スコア（独自算出の注目度）: 9.151383048946803
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The escalating arms race between Internet censorship and evasion has driven censors to evolve from static rule-based filtering to sophisticated deep learning-based traffic analysis. While recent automated evasion tools have attempted to counter this by leveraging stochastic search and programmable heuristics, they continue to suffer from insufficient evasion robustness across diverse censorship modalities and poor usability due to complex, mechanism-specific configurations that require manual fitness tuning or domain-specific languages. In this paper, we propose a paradigm shift that reframes censorship evasion as a semantic image-to-image editing task, allowing users to execute it with a single prompt. We introduce FlowPaint, a novel generative framework that leverages the "world knowledge" of large diffusion models to automatically reshape censored traffic into benign patterns. FlowPaint utilizes an instruction-tuned diffusion architecture to perform semantic editing on network flows. Evaluations against both industrial-grade rule-based middleboxes and learning-based classifiers demonstrate that FlowPaint outperforms existing censorship evasion baselines, enabling users to counter diverse censorship paradigms solely by varying natural language instructions
Abstract（参考訳）: インターネット検閲と回避のエスカレートする武器競争は、静的なルールベースのフィルタリングから高度なディープラーニングベースのトラフィック分析へと、検閲を進化させてきた。最近の自動回避ツールは、確率的探索とプログラム可能なヒューリスティックを活用してこれを対処しようとするが、手動のフィットネスチューニングやドメイン固有言語を必要とする複雑なメカニズム固有の構成のため、多様な検閲のモダリティとユーザビリティの欠如に悩まされ続けている。本稿では,検閲回避をセマンティック・イメージ・ツー・イメージの編集タスクとして再編成し,ユーザがひとつのプロンプトで実行できるようにするパラダイムシフトを提案する。本研究では,大規模拡散モデルの「世界知識」を活用して,検閲されたトラフィックを自動的に良質なパターンに変換する新しい生成フレームワークであるFlowPaintを紹介する。 FlowPaintは、命令調整された拡散アーキテクチャを使用して、ネットワークフローのセマンティックな編集を行う。業界グレードのルールベースのミドルボックスと学習ベースの分類器の両方に対する評価は、FlowPaintが既存の検閲回避ベースラインより優れており、ユーザーは自然言語の指示によってのみ多様な検閲パラダイムに対処できることを示している。

関連論文リスト

Low-Effort Jailbreak Attacks Against Text-to-Image Safety Filters [17.105244809853907]
現代のテキスト・ツー・イメージモデルは、自然言語のプロンプトのみを必要とする低便なジェイルブレイク攻撃に対して脆弱なままであることを示す。本稿では,モデルアクセスや最適化,対向訓練を伴わずに安全フィルタを回避できるプロンプトベースの戦略の体系的研究を行う。我々はこれらの攻撃を最先端のテキスト・ツー・イメージシステムで評価し、単純な言語修正が既存の安全対策を確実に回避できることを実証した。
論文参考訳（メタデータ） (2026-04-02T10:51:58Z)
SafeRedir: Prompt Embedding Redirection for Robust Unlearning in Image Generation Models [67.84174763413178]
我々はSafeRedirを紹介した。SafeRedirは、迅速な埋め込みリダイレクトによる堅牢なアンラーニングのための軽量な推論時フレームワークである。 SafeRedirは,効果的な非学習能力,意味的・知覚的保存能力,堅牢な画像品質,対人攻撃に対する耐性の向上を実現している。
論文参考訳（メタデータ） (2026-01-13T15:01:38Z)
ControlThinker: Unveiling Latent Semantics for Controllable Image Generation through Visual Reasoning [76.2503352325492]
ControlThinkerは、"Comprehend-then-generate"パラダイムを採用した、新しいフレームワークである。制御画像からの潜在セマンティクスは、テキストプロンプトを豊かにするためにマイニングされる。このリッチなセマンティック理解は、追加の複雑な修正を必要とせずに、画像生成をシームレスに支援する。
論文参考訳（メタデータ） (2025-06-04T05:56:19Z)
Decoding Diffusion: A Scalable Framework for Unsupervised Analysis of Latent Space Biases and Representations Using Natural Language Prompts [68.48103545146127]
本稿では拡散潜在空間の教師なし探索のための新しい枠組みを提案する。我々は、自然言語のプロンプトと画像キャプションを直接利用して、遅延方向をマップする。本手法は,拡散モデルに符号化された意味的知識をよりスケーラブルで解釈可能な理解を提供する。
論文参考訳（メタデータ） (2024-10-25T21:44:51Z)
Instruct2Attack: Language-Guided Semantic Adversarial Attacks [76.83548867066561]
Instruct2Attack (I2A) は、自由形式の言語命令に従って意味のある摂動を生成する言語誘導セマンティックアタックである。我々は最先端の潜伏拡散モデルを用いて、逆拡散過程を逆ガイドし、入力画像とテキスト命令に条件付けされた逆潜伏符号を探索する。 I2Aは、強い敵の防御の下でも最先端のディープニューラルネットワークを破ることができることを示す。
論文参考訳（メタデータ） (2023-11-27T05:35:49Z)
Amoeba: Circumventing ML-supported Network Censorship via Adversarial Reinforcement Learning [8.788469979827484]
近年の機械学習の進歩により,交通流に隠された統計的パターンを学習することで,様々な反検閲システムの検出が可能になった。本稿では,検閲を回避する手段として,フロー分類器に対する現実的な攻撃戦略を定式化する。我々は,アメーバが,MLアルゴリズムに対して平均94%の攻撃成功率を有する敵流を効果的に形成可能であることを示す。
論文参考訳（メタデータ） (2023-10-31T14:01:24Z)
Augmenting Rule-based DNS Censorship Detection at Scale with Machine Learning [38.00013408742201]
ドメイン名システム(DNS)の検閲は、異なる国で使用される重要なメカニズムである。本稿では,機械学習(ML)モデルが検出プロセスの合理化にどのように役立つかを検討する。検閲されていないインスタンスのみに基づいてトレーニングされた教師なしモデルは、既存のプローブが見逃した新しいインスタンスと検閲のバリエーションを特定することができる。
論文参考訳（メタデータ） (2023-02-03T23:36:30Z)
Countering Malicious Content Moderation Evasion in Online Social Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文参考訳（メタデータ） (2022-12-27T16:08:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。