論文の概要: When Style Similarity Scores Fail: Diagnosing Raw CSD Cosine in Artist-Style Evaluation
- arxiv url: http://arxiv.org/abs/2605.09030v1
- Date: Sat, 09 May 2026 16:15:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.030906
- Title: When Style Similarity Scores Fail: Diagnosing Raw CSD Cosine in Artist-Style Evaluation
- Title(参考訳): アーティスト・スタイル評価におけるCSDコサインの診断
- Authors: Jörg Frochte,
- Abstract要約: 本稿では,コーパス内,プロトタイプフリー,しきい値フリーの診断を行う識別ギャップについて紹介する。
1799年のアートワーク、91アーティストのパブリックドメインコーパスでは、生のCSDコサインは2つのレベルで23/91ドルのアーティストに対して負のポイント推定ギャップを生じる。
CLIP-ViT-L/14、SigLIP-large、DINOv2-Largeのクロスバックチェックは、同じ共有トラフィック障害パターンを再現する。
- 参考スコア(独自算出の注目度): 0.1923695645342299
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Raw cosine in the 768-dimensional output space of the Contrastive Style Descriptor (CSD) is now widely read as an absolute, calibrated style-fidelity score for text-to-image and style-imitation evaluation. We introduce the discrimination gap, a corpus-internal, prototype-free and threshold-free diagnostic that tests whether contrastive style cosines admit an absolute same-versus-different interpretation on a candidate artist corpus. On a 1799-artwork, 91-artist public-domain corpus, raw CSD cosine yields negative point-estimate gaps for $23/91$ artists at the pairwise level ($2/91$ robust under bootstrap) and for $15/91$ in the aggregated-pool scoring regime style-fidelity evaluations typically use. CSLS readout on the frozen backbone reduces the aggregated negative-gap count to $4/91$; combined with positional-embedding interpolation to $336$ pixels it raises unsupervised pair-verification AUC from $0.883$ to $0.905$ across $25$ artist-disjoint splits. We refer to this diagnostic-driven readout protocol on the frozen backbone (CSLS as default, pos-interp $336$ as the stronger optional setting) as CSD+, not a new encoder.A cross-backbone check on CLIP-ViT-L/14, SigLIP-large and DINOv2-Large reproduces the same shared-tradition failure pattern, providing evidence that the residual reflects a shared limitation of the four backbones we tested rather than a CSD-specific artefact. Practical implication: before reporting CSD cosine as an absolute style-fidelity score, run the diagnostic on the candidate corpus; CSLS is the minimal correction when it fails.
- Abstract(参考訳): Contrastive Style Descriptor (CSD) の768次元出力空間における原コサインは、テキスト・ツー・イモージョンとスタイル・イミテーション評価のための絶対的、校正されたスタイル・フィデリティスコアとして広く読まれている。
コントラスト型コサインが絶対対向差の解釈を許容するかどうかを検査する,コーパス内在型,プロトタイプフリー型,しきい値フリーな診断法である識別ギャップを導入する。
1799年のアートワークでは、91アートのパブリックドメインコーパスである生のCSDコサインは、ペアレベルで23/91ドルのアーティスト(ブートストラップで2/91ドルのロバスト)と15/91ドルのアグリッドプールスコアリング方式のスタイルフィデリティ評価において、負のポイント推定ギャップを生じる。
凍結したバックボーン上のCSLS読み出しは、集約された負のギャップ数を4/91$に減らし、位置埋め込みの補間を336ドルのピクセルに組み合わせることで、教師なしのペア検証AUCを25ドルの分割で0.883$から0.905$に引き上げる。
CSD+は新たなエンコーダではない。CLIP-ViT-L/14, SigLIP-large, DINOv2-Largeのクロスバックチェックでは、同じ共有トラフィック障害パターンを再現し、残余がCSD固有のアーティファクトではなくテストした4つのバックボーンの共有制限を反映していることを示す。
実用上の意味: CSDコサインを絶対的なスタイル忠実度スコアとして報告する前に、候補コーパスで診断を実行する。
関連論文リスト
- MEMSAD: Gradient-Coupled Anomaly Detection for Memory Poisoning in Retrieval-Augmented Agents [0.0]
検索強化エージェントに対するメモリ中毒攻撃を,統合評価フレームワークを用いたStackelbergゲームとして定式化する。
ASR-R: 0.25〜1.00$) による攻撃成功度を4倍に向上させる。
私たちの主な貢献は、勾配結合に接地したキャリブレーションに基づく防御であるMEMSADである。
論文 参考訳(メタデータ) (2026-05-05T08:15:41Z) - Why Training-Free Token Reduction Collapses: The Inherent Instability of Pairwise Scoring Signals [0.0]
ビジョントランスフォーマーのトレーニング不要なトークン削減方法は異なるスコアリング機構を用いるが、高い圧縮で密に一致した崖のような崩壊を共有できる。
我々は,(1)信号非依存のエラー増幅器に分解する2つのツールを用いて,一貫性のランキング $_s$ と非対角相関 $_textoff$ を作成した。
我々はCATISを構成的検証として構築し、単一信号はトリガー閾値を上昇させ、トリアージは利得を抑制する。
論文 参考訳(メタデータ) (2026-04-17T23:26:27Z) - Spectral Sentinel: Scalable Byzantine-Robust Decentralized Federated Learning via Sketched Random Matrix Theory on Blockchain [0.0]
ビザンチンのクライアントは、不均一な(Non-IID)データの下での濃度勾配を中毒する。
本稿では,ビザンチン検出・集約フレームワークであるSpectral Sentinelを提案する。
Polygonネットワーク上でブロックチェーンを統合することで,完全なシステムを実現しています。
論文 参考訳(メタデータ) (2025-12-14T09:43:03Z) - A Privacy-Preserving Federated Learning Framework for Generalizable CBCT to Synthetic CT Translation in Head and Neck [0.0]
Cone-beam CT(CBCT)は画像誘導放射線療法(IGRT)において広く採用されている。
頭頸部領域におけるCBCT-to-sCT合成のためのクロスサイロ水平フェデレーションラーニング(FL)手法を提案する。
論文 参考訳(メタデータ) (2025-06-10T10:10:56Z) - Convergence Rate Analysis of LION [54.28350823319057]
LION は、勾配カルシュ=クーン=T (sqrtdK-)$で測定された $cal(sqrtdK-)$ の反復を収束する。
従来のSGDと比較して,LIONは損失が小さく,性能も高いことを示す。
論文 参考訳(メタデータ) (2024-11-12T11:30:53Z) - Expressive Losses for Verified Robustness via Convex Combinations [67.54357965665676]
本研究では, 過近似係数と異なる表現的損失に対する性能分布の関係について検討した。
表現性が不可欠である一方で、最悪の場合の損失のより良い近似は、必ずしも優れた堅牢性-正確性トレードオフに結びついていないことを示す。
論文 参考訳(メタデータ) (2023-05-23T12:20:29Z) - Batch-Size Independent Regret Bounds for Combinatorial Semi-Bandits with Probabilistically Triggered Arms or Independent Arms [59.8188496313214]
半帯域 (CMAB) について検討し, 半帯域 (CMAB) におけるバッチサイズ (K$) の依存性の低減に着目した。
まず,確率的に引き起こされるアーム(CMAB-T)を用いたCMABの設定に対して,分散を考慮した信頼区間を持つBCUCB-Tアルゴリズムを提案する。
次に,独立アームを用いた非トリガ型CMABの設定に対して,TPVM条件の非トリガ型を利用したSESCBアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-31T13:09:39Z) - LSDAT: Low-Rank and Sparse Decomposition for Decision-based Adversarial
Attack [74.5144793386864]
LSDATは、入力サンプルのスパース成分と対向サンプルのスパース成分によって形成される低次元部分空間における摂動を加工する。
LSDは画像ピクセル領域で直接動作し、スパース性などの非$ell$制約が満たされることを保証します。
論文 参考訳(メタデータ) (2021-03-19T13:10:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。