論文の概要: From Unlearning to UNBRANDING: A Benchmark for Trademark-Safe Text-to-Image Generation
- arxiv url: http://arxiv.org/abs/2512.13953v1
- Date: Mon, 15 Dec 2025 23:15:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.52012
- Title: From Unlearning to UNBRANDING: A Benchmark for Trademark-Safe Text-to-Image Generation
- Title(参考訳): UnlearningからUNBRANdingへ: 商標安全なテキスト・画像生成のためのベンチマーク
- Authors: Dawid Malarz, Artur Kasymov, Filip Manjak, Maciej Zięba, Przemysław Spurek,
- Abstract要約: ブランド認識は多次元であり、明示的なロゴを超えて独特の構造的特徴を包含する。
商標のきめ細かい除去と微妙な構造的ブランド機能のための新しいタスクであるunbrandingを紹介します。
我々のVision Language Modelsのメトリクスによって検証された結果、アンブランディングははっきりした、実際に関係のある問題であることを確認した。
- 参考スコア(独自算出の注目度): 0.7798283447125206
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid progress of text-to-image diffusion models raises significant concerns regarding the unauthorized reproduction of trademarked content. While prior work targets general concepts (e.g., styles, celebrities), it fails to address specific brand identifiers. Crucially, we note that brand recognition is multi-dimensional, extending beyond explicit logos to encompass distinctive structural features (e.g., a car's front grille). To tackle this, we introduce unbranding, a novel task for the fine-grained removal of both trademarks and subtle structural brand features, while preserving semantic coherence. To facilitate research, we construct a comprehensive benchmark dataset. Recognizing that existing brand detectors are limited to logos and fail to capture abstract trade dress (e.g., the shape of a Coca-Cola bottle), we introduce a novel evaluation metric based on Vision Language Models (VLMs). This VLM-based metric uses a question-answering framework to probe images for both explicit logos and implicit, holistic brand characteristics. Furthermore, we observe that as model fidelity increases, with newer systems (SDXL, FLUX) synthesizing brand identifiers more readily than older models (Stable Diffusion), the urgency of the unbranding challenge is starkly highlighted. Our results, validated by our VLM metric, confirm unbranding is a distinct, practically relevant problem requiring specialized techniques. Project Page: https://gmum.github.io/UNBRANDING/.
- Abstract(参考訳): テキスト・画像拡散モデルの急速な進歩は、商標付きコンテンツの未承認再生に関する重要な懸念を提起する。
事前の作業は一般的な概念(スタイル、有名人など)をターゲットにしているが、特定のブランド識別子には対処できない。
重要なことに、ブランド認識は多次元であり、明示的なロゴを超えて、独特の構造的特徴(例えば、車のフロントグリル)を包含するように拡張されている。
これを解決するために,意味的コヒーレンスを維持しつつ,商標と微妙な構造的ブランド特徴のきめ細かい除去を行う新しいタスクであるunbrandingを導入する。
研究を容易にするため,包括的なベンチマークデータセットを構築した。
既存のブランド検出器はロゴに限られており、抽象的なトレードドレス(例えば、コカコーラのボトルの形)をキャプチャできないことを認識して、視覚言語モデル(VLM)に基づいた新しい評価基準を導入する。
このVLMベースのメトリクスは、明示的なロゴと暗黙的な全体的ブランド特性の両方のイメージを探索するために、質問応答フレームワークを使用する。
さらに,新しいシステム (SDXL, FLUX) が古いモデル (Stable Diffusion) よりも容易にブランド識別子を合成し, モデルの忠実度が向上するにつれて, 未ブランド課題の緊急性が著しく強調される。
我々のVLM測定によって検証された結果、アンブランディングは専門的な技術を必要とする、はっきりした、実用的な問題であることを確認した。
Project Page: https://gmum.github.io/UNBRANDING/.com
関連論文リスト
- Logo-VGR: Visual Grounded Reasoning for Open-world Logo Recognition [25.658499211854153]
我々は,製品モデレーションにおける中核的な課題である,オープンワールドのロゴ認識ベンチマークを導入する。
数万のブランドを記憶する従来のロゴ認識手法とは異なり,Logo-VGRを提案する。
OOD設定では,Logo-VGRが10ポイント近く,強いベースラインを上回ります。
論文 参考訳(メタデータ) (2025-09-30T05:35:10Z) - CIDER: A Causal Cure for Brand-Obsessed Text-to-Image Models [8.256738887166089]
テキスト・トゥ・イメージ(T2I)モデルは、まだ探索されていない重要な「ブランドバイアス」を示す
そこで我々はCIDERを提案する。CIDERは推論時のバイアスを軽減するためのモデルに依存しないフレームワークである。
論文 参考訳(メタデータ) (2025-09-19T09:30:37Z) - Seeing the Undefined: Chain-of-Action for Generative Semantic Labels [6.553242735096595]
本稿では,画像のセマンティックラベルの集合を包括的に予測することを目的とした新しいタスクであるジェネリックセマンティックラベル(GSL)を紹介する。
GSLはオブジェクト、シーン、属性、関係を含む複数の意味レベルラベルを生成する。
本稿では,GSL タスクに対処する革新的な手法である Chain-of-Action (CoA) を提案する。
論文 参考訳(メタデータ) (2024-11-26T13:09:14Z) - LogoSticker: Inserting Logos into Diffusion Models for Customized Generation [73.59571559978278]
テキスト・ツー・イメージ・モデルにロゴを挿入する作業を導入する。
我々の目標は、ロゴのアイデンティティを拡散モデルに挿入し、様々な状況下でシームレスに合成できるようにすることです。
この課題に対処するために,新しい2相パイプラインLogoStickerを提案する。
論文 参考訳(メタデータ) (2024-07-18T17:54:49Z) - A Generative Approach for Wikipedia-Scale Visual Entity Recognition [56.55633052479446]
与えられたクエリ画像をWikipediaにある600万の既存エンティティの1つにマッピングするタスクに対処する。
本稿では,対象エンティティを識別する「意味的・識別的コード」の自動復号化を学習する,新しい生成エンティティ認識フレームワークを紹介する。
論文 参考訳(メタデータ) (2024-03-04T13:47:30Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Discriminative Semantic Feature Pyramid Network with Guided Anchoring
for Logo Detection [52.36825190893928]
我々は,DSFP-GAを用いた識別的セマンティック特徴ピラミッドネットワークという新しい手法を提案する。
我々のアプローチは主に差別的セマンティック特徴ピラミッド(DSFP)とガイドアンコリング(GA)から構成される。
論文 参考訳(メタデータ) (2021-08-31T11:59:00Z) - The Open Brands Dataset: Unified brand detection and recognition at
scale [33.624955564405425]
Open Brands」は、リッチなアノテーションによるブランド検出と認識のための最大のデータセットです。
ブランドネット」はブランド認識を扱う「ブランドネット」と呼ばれるネットワークである。
論文 参考訳(メタデータ) (2020-12-14T09:06:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。