論文の概要: EDGE-Shield: Efficient Denoising-staGE Shield for Violative Content Filtering via Scalable Reference-Based Matching
- arxiv url: http://arxiv.org/abs/2604.06063v1
- Date: Sat, 04 Apr 2026 08:32:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.934364
- Title: EDGE-Shield: Efficient Denoising-staGE Shield for Violative Content Filtering via Scalable Reference-Based Matching
- Title(参考訳): EDGE-Shield:スケーラブルな参照ベースマッチングによる暴力的コンテンツフィルタリングのための効率的なDenoising-staGE Shield
- Authors: Takara Taniguchi, Ryohei Shimizu, Minh-Duc Vo, Kota Izumi, Shiqi Yang, Teppei Suzuki,
- Abstract要約: EDGE-Shieldはデノナイジングプロセスにおけるスケーラブルなコンテンツフィルタである。
我々は,効率的な参照比較のために埋め込み型マッチングを利用する。
2つの生成モデルに対して、違反コンテンツフィルタリングの実験を行う。
- 参考スコア(独自算出の注目度): 9.24276249908675
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: The advent of Text-to-Image generative models poses significant risks of copyright violation and deepfake generation. Since the rapid proliferation of new copyrighted works and private individuals constantly emerges, reference-based training-free content filters are essential for providing up-to-date protection without the constraints of a fixed knowledge cutoff. However, existing reference-based approaches often lack scalability when handling numerous references and require waiting for finishing image generation. To solve these problems, we propose EDGE-Shield, a scalable content filter during the denoising process that maintains practical latency while effectively blocking violative content. We leverage embedding-based matching for efficient reference comparison. Additionally, we introduce an \textit{$x$}-pred transformation that converts the model's noisy intermediate latent into the pseudo-estimated clean latent at the later stage, enhancing classification accuracy of violative content at earlier denoising stages. We conduct experiments of violative content filtering against two generative models including Z-Image-Turbo and Qwen-Image. EDGE-Shield significantly outperforms traditional reference-based methods in terms of latency; it achieves an approximate $79\%$ reduction in processing time for Z-Image-Turbo and approximate $50\%$ reduction for Qwen-Image, maintaining the filtering accuracy across different model architectures.
- Abstract(参考訳): テキスト・ツー・イメージ生成モデルの出現は、著作権侵害とディープフェイク生成の重大なリスクをもたらす。
新しい著作権作品や個人が急速に普及するにつれて、基準ベースのトレーニングフリーコンテンツフィルタは、一定の知識遮断の制約なしに、最新の保護を提供するために不可欠である。
しかし、既存の参照ベースのアプローチは、多くの参照を扱う際にスケーラビリティを欠くことが多く、画像生成の完了を待つ必要がある。
これらの問題を解決するために, EDGE-Shieldという拡張性のあるコンテンツフィルタを提案する。
我々は,効率的な参照比較のために埋め込み型マッチングを利用する。
さらに,後段の擬似推定クリーン潜水器にモデルをノイズのある中間潜水器を変換し,初期の復調段階における違反内容の分類精度を向上する,textit{$x$}-pred変換を導入する。
本研究では,Z-Image-Turbo と Qwen-Image の2つの生成モデルに対して,違反コンテンツのフィルタリング実験を行った。
EDGE-Shieldは、Z-Image-Turboの処理時間を約79.%削減し、Qwen-Imageの約50.%削減し、異なるモデルアーキテクチャにおけるフィルタリング精度を維持する。
関連論文リスト
- Provably Contractive and High-Quality Denoisers for Convergent Restoration [4.912983462300839]
既存の畳み込みと注意に基づくネットワークは、入力の小さなシフトの下での安定性の保証を欠いている。
我々は、このギャップを著しく減少させる、証明可能な契約性(グロバル・リプシッツ$1$)デノイザーネットワークを開発する。
以上の結果から,厳密なリプシッツ制御は出力品質を本質的に低下させるものではないことが示唆された。
論文 参考訳(メタデータ) (2026-03-27T08:35:55Z) - TIP: Resisting Gradient Inversion via Targeted Interpretable Perturbation in Federated Learning [8.156452885913108]
フェデレートラーニング(FL)は、データの局所性を維持しながら協調的なモデルトレーニングを促進する。
勾配の交換により、システムはグラディエント・インバージョン・アタック(GIAs)に弱い。
本稿では、モデル解釈可能性と周波数領域解析を統合する新しい防御フレームワークTIPを提案する。
論文 参考訳(メタデータ) (2026-02-12T06:32:49Z) - SSG: Scaled Spatial Guidance for Multi-Scale Visual Autoregressive Generation [10.295970926059812]
視覚自己回帰モデル(VAR)は次のスケールの予測を通じて画像を生成する。
実際には、この階層はキャパシティの制限と累積誤差によってモデルが粗いから細かい性質から逸脱してしまうため、推論時にドリフトすることができる。
本研究では,グローバルなコヒーレンスを維持しつつ,意図した階層に向けて生成を行うためのトレーニング不要な推論時間ガイダンスであるスケールド空間ガイダンス(SSG)を提案する。
論文 参考訳(メタデータ) (2026-02-05T10:48:58Z) - BADiff: Bandwidth Adaptive Diffusion Model [55.10134744772338]
従来の拡散モデルは、下流の伝送制限によらず、一定数のデノナイジングステップを実行することで、高忠実度画像を生成する。
実際のクラウド・ツー・デバイス・シナリオでは、帯域幅の制限はしばしば重い圧縮を必要とし、微妙なテクスチャや無駄な計算が失われる。
使用可能な帯域幅から導かれる目標品質レベルに拡散モデルを条件付けする,共同エンドツーエンドのトレーニング戦略を導入する。
論文 参考訳(メタデータ) (2025-10-24T11:50:03Z) - SODiff: Semantic-Oriented Diffusion Model for JPEG Compression Artifacts Removal [50.90827365790281]
SODiffはJPEGアーティファクト削除のためのセマンティック指向のワンステップ拡散モデルである。
我々の中核的な考え方は、効果的な復元ヒンジは、事前訓練された拡散モデルに対する意味指向的なガイダンスを提供することである。
SAIPEは、低品質(LQ)画像からリッチな特徴を抽出し、テキストエンコーダとセマンティックに整合した埋め込み空間に投影する。
論文 参考訳(メタデータ) (2025-08-10T13:48:07Z) - Representation Entanglement for Generation: Training Diffusion Transformers Is Much Easier Than You Think [63.25744258438214]
REPAとその変種は、事前訓練されたモデルから外部の視覚表現を取り入れることで、拡散モデルのトレーニング課題を効果的に軽減する。
偏見推論過程全体において欠落している外部アライメントは、識別的表現の可能性を完全に活用するに足らないと我々は主張する。
本稿では,事前学習した基礎モデルから,低レベル画像ラテントを1つの高レベルクラストークンで絡み合わせるRepresentation Entanglement for Generation (REG)を提案する。
論文 参考訳(メタデータ) (2025-07-02T08:29:18Z) - SPEED: Scalable, Precise, and Efficient Concept Erasure for Diffusion Models [56.83154571623655]
モデルパラメータを直接編集する効率的な概念消去手法であるSPEEDを導入する。
Speedyは、パラメータ更新がターゲット以外の概念に影響しないモデル編集スペースであるnullスペースを検索する。
たった5秒で100のコンセプトを消去しました。
論文 参考訳(メタデータ) (2025-03-10T14:40:01Z) - NFIG: Multi-Scale Autoregressive Image Generation via Frequency Ordering [47.442844594442455]
NextFrequency Image Generation (NFIG)は、画像生成プロセスを複数の周波数誘導段階に分解する新しいフレームワークである。
NFIGは生成過程を自然な画像構造と整合させる。
これは最初に低周波成分を生成し、トークンを著しく少なくして効率的にグローバル構造を捉え、その後、徐々に高周波の細部を付加することで実現している。
論文 参考訳(メタデータ) (2025-03-10T08:59:10Z) - HIR-Diff: Unsupervised Hyperspectral Image Restoration Via Improved
Diffusion Models [38.74983301496911]
ハイパースペクトル画像(HSI)の復元は、劣化した観察からクリーンなイメージを復元することを目的としている。
既存のモデルに基づく手法は、複雑な画像の特徴を正確にモデル化するのに限界がある。
本稿では,事前学習拡散モデル(HIR-Diff)を用いた教師なしHSI復元フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-24T17:15:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。