論文の概要: Verify Claimed Text-to-Image Models via Boundary-Aware Prompt Optimization
- arxiv url: http://arxiv.org/abs/2603.26328v1
- Date: Fri, 27 Mar 2026 11:46:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.476948
- Title: Verify Claimed Text-to-Image Models via Boundary-Aware Prompt Optimization
- Title(参考訳): 境界認識型プロンプト最適化によるテキスト・画像モデルの検証
- Authors: Zidong Zhao, Yihao Huang, Qing Guo, Tianlin Li, Anran Li, Kailong Wang, Jin Song Dong, Geguang Pu,
- Abstract要約: 公式モデルを使用したという偽の主張は、ユーザーを誤解させ、モデル所有者の評判を傷つける可能性がある。
既存のメソッドは、オフィシャルモデルオーナによって生成された検証プロンプトを使用して、この問題に対処する。
本稿では,境界認識型Prompt Optimizationと呼ばれる参照不要なT2Iモデル検証手法を提案する。
- 参考スコア(独自算出の注目度): 29.365081306586237
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As Text-to-Image (T2I) generation becomes widespread, third-party platforms increasingly integrate multiple model APIs for convenient image creation. However, false claims of using official models can mislead users and harm model owners' reputations, making model verification essential to confirm whether an API's underlying model matches its claim. Existing methods address this by using verification prompts generated by official model owners, but the generation relies on multiple reference models for optimization, leading to high computational cost and sensitivity to model selection. To address this problem, we propose a reference-free T2I model verification method called Boundary-aware Prompt Optimization (BPO). It directly explores the intrinsic characteristics of the target model. The key insight is that although different T2I models produce similar outputs for normal prompts, their semantic boundaries in the embedding space (transition zones between two concepts such as "corgi" and "bagel") are distinct. Prompts near these boundaries generate unstable outputs (e.g., sometimes a corgi and sometimes a bagel) on the target model but remain stable on other models. By identifying such boundary-adjacent prompts, BPO captures model-specific behaviors that serve as reliable verification cues for distinguishing T2I models. Experiments on five T2I models and four baselines demonstrate that BPO achieves superior verification accuracy.
- Abstract(参考訳): テキスト・ツー・イメージ(T2I)生成が普及するにつれて、サードパーティプラットフォームはより便利な画像作成のために複数のモデルAPIを統合するようになっている。
しかしながら、公式モデルを使用するという誤った主張は、ユーザを誤解させ、モデル所有者の評判を害する可能性がある。
既存の手法では、公式モデル所有者が生成した検証プロンプトを使用してこの問題に対処するが、生成は最適化のために複数の参照モデルに依存しており、高い計算コストとモデル選択に対する感度をもたらす。
この問題に対処するため,BPO(Boundary-aware Prompt Optimization)と呼ばれる参照不要なT2Iモデル検証手法を提案する。
対象モデルの本質的な特性を直接探索する。
重要な洞察は、異なるT2Iモデルは通常のプロンプトに対して同様の出力を生成するが、埋め込み空間におけるそれらの意味的境界("corgi" や "bagel" のような2つの概念間の遷移ゾーン)は異なることである。
これらの境界付近の確率は、ターゲットモデル上で不安定な出力(例えば、コーギーやベーグル)を生成するが、他のモデルでは安定である。
このような境界に隣接したプロンプトを識別することで、BPOはT2Iモデルを識別するための信頼性の高い検証手段として機能するモデル固有の振る舞いをキャプチャする。
5つのT2Iモデルと4つのベースラインの実験は、BPOがより優れた検証精度を達成することを示す。
関連論文リスト
- Every Step Counts: Decoding Trajectories as Authorship Fingerprints of dLLMs [63.82840470917859]
本稿では,dLLMの復号化機構をモデル属性の強力なツールとして利用できることを示す。
本稿では、デコードステップ間の構造的関係を捉え、モデル固有の振る舞いをよりよく明らかにする、DDM(Directed Decoding Map)と呼ばれる新しい情報抽出手法を提案する。
論文 参考訳(メタデータ) (2025-10-02T06:25:10Z) - DMM: Building a Versatile Image Generation Model via Distillation-Based Model Merging [32.97010533998294]
スタイルベクトルの制御の下で任意のスタイルの画像を正確に生成できる、スタイルプロンプタブルな画像生成パイプラインを提案する。
この設計に基づいて,複数のモデルを1つの汎用T2Iモデルに圧縮する,スコア蒸留に基づくモデルマージパラダイム(DMM)を提案する。
実験により、DMMは複数の教師モデルからの知識をコンパクトに再構成し、制御可能な任意のスタイルの生成を実現することができることを示した。
論文 参考訳(メタデータ) (2025-04-16T15:09:45Z) - SleeperMark: Towards Robust Watermark against Fine-Tuning Text-to-image Diffusion Models [77.80595722480074]
SleeperMarkは、回復力のある透かしをT2I拡散モデルに埋め込むように設計されたフレームワークである。
学習したセマンティックな概念から透かし情報を切り離すようモデルに誘導する。
各種拡散モデルにおけるSleeperMarkの有効性について実験を行った。
論文 参考訳(メタデータ) (2024-12-06T08:44:18Z) - One Prompt to Verify Your Models: Black-Box Text-to-Image Models Verification via Non-Transferable Adversarial Attacks [8.616538774420812]
ブラックボックス対象モデルが与えられたホワイトボックス参照T2Iモデルと同一であるかどうかを判定することを目的としたT2Iモデル検証を提案する。
イントレピッドプロンプト(Intrepid prompt)は、他のモデルに対する転送可能性のないターゲットモデルの逆プロンプトである。
IntrepidPromptは、様々なT2Iモデルで90%以上の精度を実現している。
論文 参考訳(メタデータ) (2024-10-30T06:17:20Z) - Truncated Consistency Models [57.50243901368328]
トレーニング一貫性モデルは、PF ODE 軌道に沿ったすべての中間点を対応するエンドポイントにマッピングする学習を必要とする。
このトレーニングパラダイムが一貫性モデルの1ステップ生成性能を制限することを実証的に見出した。
整合性関数の新しいパラメータ化と2段階の訓練手順を提案し,時間外学習が崩壊することを防ぐ。
論文 参考訳(メタデータ) (2024-10-18T22:38:08Z) - Direct Consistency Optimization for Robust Customization of Text-to-Image Diffusion Models [67.68871360210208]
テキスト・ツー・イメージ(T2I)拡散モデルは、いくつかの個人画像に微調整された場合、高い一貫性で視覚を生成することができる。
本稿では,微調整モデルと事前学習モデルとの偏差を制御し,直接整合性最適化(Direct Consistency Optimization)と呼ばれる新たな微調整対象を提案する。
提案手法は, 通常の微調整モデルとのマージに最適化したモデルよりも, 高速な忠実度と主観的忠実度が得られることを示す。
論文 参考訳(メタデータ) (2024-02-19T09:52:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。