論文の概要: ColorConceptBench: A Benchmark for Probabilistic Color-Concept Understanding in Text-to-Image Models
- arxiv url: http://arxiv.org/abs/2601.16836v1
- Date: Fri, 23 Jan 2026 15:36:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.747777
- Title: ColorConceptBench: A Benchmark for Probabilistic Color-Concept Understanding in Text-to-Image Models
- Title(参考訳): ColorConceptBench: テキスト・画像モデルにおける確率的色概念理解のためのベンチマーク
- Authors: Chenxi Ruan, Yu Xiao, Yihan Hou, Guosheng Hu, Wei Zeng,
- Abstract要約: そこで本研究では,カラーコンセプション関連性を評価するための新しい人間アノテーション付きベンチマークであるColorConceptBenchを紹介する。
7つの主要なテキスト・ツー・イメージ(T2I)モデルについて評価した結果,現在のモデルでは抽象的意味論に対する感受性が欠如していることが判明した。
これは、人間のような色のセマンティクスを達成するには、より大きなモデル以上のものが必要であることを示している。
- 参考スコア(独自算出の注目度): 20.130253460357547
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: While text-to-image (T2I) models have advanced considerably, their capability to associate colors with implicit concepts remains underexplored. To address the gap, we introduce ColorConceptBench, a new human-annotated benchmark to systematically evaluate color-concept associations through the lens of probabilistic color distributions. ColorConceptBench moves beyond explicit color names or codes by probing how models translate 1,281 implicit color concepts using a foundation of 6,369 human annotations. Our evaluation of seven leading T2I models reveals that current models lack sensitivity to abstract semantics, and crucially, this limitation appears resistant to standard interventions (e.g., scaling and guidance). This demonstrates that achieving human-like color semantics requires more than larger models, but demands a fundamental shift in how models learn and represent implicit meaning.
- Abstract(参考訳): テキスト・ツー・イメージ(T2I)モデルはかなり進歩しているが、暗黙的な概念と色を関連付ける能力はいまだ未定である。
このギャップに対処するために、確率的な色分布のレンズを通して、色-概念関連を体系的に評価する新しい人手によるベンチマークであるColorConceptBenchを紹介する。
ColorConceptBenchは、6,369人のアノテーションの基礎を使って、モデルが1,281の暗黙的な色の概念を翻訳する方法を探索することによって、明示的な色名やコードを超えた。
7つの主要なT2Iモデルを評価すると、現在のモデルは抽象的意味論に対する感受性に欠けており、この制限は標準的な介入(例えば、スケーリングとガイダンス)に耐性があることがわかる。
これは、人間のような色のセマンティクスを達成するには、より大きなモデル以上のものが必要であることを示しているが、モデルがどのように学習し、暗黙の意味を表現するかという根本的な変化を要求する。
関連論文リスト
- GenColorBench: A Color Evaluation Benchmark for Text-to-Image Generation Models [61.786094845872576]
GenColorBenchは、テキストから画像までのカラー生成のための、最初の総合的なベンチマークである。
I SCC-NBS や CSS3/X11 などのカラーシステムにも採用されている。
400以上の色をカバーする44K色のプロンプトによって、知覚的および自動評価を通じてモデルの真の能力を明らかにする。
論文 参考訳(メタデータ) (2025-10-23T14:12:55Z) - Color Names in Vision-Language Models [48.847573209643265]
視覚言語モデル(VLM)におけるカラー命名機能の最初の体系的評価について述べる。
以上の結果から,VLMは古典的な研究から色に対して高い精度が得られる一方で,拡張された非原型カラーセットでは性能が著しく低下することが示唆された。
我々は、すべてのモデルに一貫して現れる21の共通色項を特定し、2つの異なるアプローチを明らかにした。
論文 参考訳(メタデータ) (2025-09-26T16:04:18Z) - COLIBRI Fuzzy Model: Color Linguistic-Based Representation and Interpretation [0.0]
本稿では,人間の知覚に基づくファジィカラーモデル(COLIBRI)を導入し,計算色表現と人間の視覚知覚のギャップを埋める。
提案モデルはファジィ集合と論理を用いて色分類のためのフレームワークを作成する。
我々の発見は、デザイン、人工知能、マーケティング、人間とコンピュータの相互作用といった分野において重要である。
論文 参考訳(メタデータ) (2025-07-15T17:01:45Z) - Leveraging Semantic Attribute Binding for Free-Lunch Color Control in Diffusion Models [53.73253164099701]
拡散モデルにおいて、微調整なしで正確なRGBレベルの色制御を実現する、トレーニング不要なアプローチであるColorWaveを導入する。
我々は、カラーウェーブが、構造化された、色一貫性の拡散に基づく画像合成のための新しいパラダイムを確立することを実証した。
論文 参考訳(メタデータ) (2025-03-12T21:49:52Z) - ColorFlow: Retrieval-Augmented Image Sequence Colorization [65.93834649502898]
産業用途における画像シーケンスのカラー化に適した3段階拡散に基づくフレームワークを提案する。
IDごとの微調整や明示的なID埋め込み抽出を必要とする既存の手法とは異なり、我々は新たにRetrieval Augmented Colorization Pipelineを提案する。
パイプラインには、カラーアイデンティティ抽出のためのブランチと、カラー化のためのブランチという、デュアルブランチ設計も備えています。
論文 参考訳(メタデータ) (2024-12-16T14:32:49Z) - Improved Diffusion-based Image Colorization via Piggybacked Models [19.807766482434563]
既存の強力なT2I拡散モデルに基づく色付けモデルを提案する。
拡散誘導器は、潜伏拡散モデルの事前訓練された重みを組み込むように設計されている。
次に、輝度認識VQVAEは、所定のグレースケール画像に画素完全アライメントされた色付き結果を生成する。
論文 参考訳(メタデータ) (2023-04-21T16:23:24Z) - PalGAN: Image Colorization with Palette Generative Adversarial Networks [51.59276436217957]
そこで本研究では,パレット推定とカラーアテンションを統合した新しいGANベースのカラー化手法PalGANを提案する。
PalGANは、定量的評価と視覚比較において最先端の成果を上げ、顕著な多様性、コントラスト、およびエッジ保存の外観を提供する。
論文 参考訳(メタデータ) (2022-10-20T12:28:31Z) - Semantic-driven Colorization [78.88814849391352]
最近の着色は、白黒画像の着色を学習しながら意味情報を暗黙的に予測する。
そこで本研究では,まず,人間の動作をシミュレートして,画像の理解を学習し,色づけする。
論文 参考訳(メタデータ) (2020-06-13T08:13:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。