論文の概要: Creative4U: MLLMs-based Advertising Creative Image Selector with Comparative Reasoning
- arxiv url: http://arxiv.org/abs/2508.12628v1
- Date: Mon, 18 Aug 2025 05:11:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.974994
- Title: Creative4U: MLLMs-based Advertising Creative Image Selector with Comparative Reasoning
- Title(参考訳): Creative4U: MLLMsベースの広告Creative Image Selectorの比較推論
- Authors: Yukang Lin, Xiang Zhang, Shichang Jia, Bowen Wan, Chenghan Fu, Xudong Ren, Yueran Liu, Wanxian Guan, Pengji Wang, Jian Xu, Bo Zheng, Baolin Liu,
- Abstract要約: 本稿では,創造的評価と選択のための第1のパラダイムを提案する。
マルチモーダル大規模言語モデル(MLLM)を用いて,創造的画像の評価と選択を自然言語タスクに統合する。
私たちのコードとデータセットは、研究と産業の応用を進めるために公開されます。
- 参考スコア(独自算出の注目度): 17.0088513334658
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Creative image in advertising is the heart and soul of e-commerce platform. An eye-catching creative image can enhance the shopping experience for users, boosting income for advertisers and advertising revenue for platforms. With the advent of AIGC technology, advertisers can produce large quantities of creative images at minimal cost. However, they struggle to assess the creative quality to select. Existing methods primarily focus on creative ranking, which fails to address the need for explainable creative selection. In this work, we propose the first paradigm for explainable creative assessment and selection. Powered by multimodal large language models (MLLMs), our approach integrates the assessment and selection of creative images into a natural language generation task. To facilitate this research, we construct CreativePair, the first comparative reasoning-induced creative dataset featuring 8k annotated image pairs, with each sample including a label indicating which image is superior. Additionally, we introduce Creative4U (pronounced Creative for You), a MLLMs-based creative selector that takes into account users' interests. Through Reason-to-Select RFT, which includes supervised fine-tuning with Chain-of-Thought (CoT-SFT) and Group Relative Policy Optimization (GRPO) based reinforcement learning, Creative4U is able to evaluate and select creative images accurately. Both offline and online experiments demonstrate the effectiveness of our approach. Our code and dataset will be made public to advance research and industrial applications.
- Abstract(参考訳): 広告における創造的なイメージは、Eコマースプラットフォームの心臓と魂である。
目を引く創造的なイメージは、ユーザーのショッピング体験を高め、広告主の収入を高め、プラットフォームに対する広告収入を増大させる。
AIGC技術の出現により、広告主は最小限のコストで大量のクリエイティブイメージを作成できる。
しかし、彼らは選択する創造的な品質を評価するのに苦労しています。
既存の手法は主に創造的ランキングに焦点を当てており、説明可能な創造的選択の必要性に対処できない。
本研究では,創造的評価と選択を説明できる最初のパラダイムを提案する。
マルチモーダル大規模言語モデル(MLLM)を用いて,創造的画像の評価と選択を自然言語生成タスクに統合する。
本研究では、8kの注釈付き画像対を特徴とする最初の比較推論による創造的データセットであるCreativePairを構築し、各サンプルには、どの画像が優れているかを示すラベルが含まれている。
さらに,MLLMをベースとしたクリエイティブセレクタであるCreative4U(Creative for You)を紹介した。
Reason-to-Select RFTは、Chain-of-Thought (CoT-SFT) と Group Relative Policy Optimization (GRPO) をベースとした強化学習によって、クリエイティブなイメージを正確に評価し、選択することができる。
オフラインとオンラインの両方の実験は、私たちのアプローチの有効性を示しています。
私たちのコードとデータセットは、研究と産業の応用を進めるために公開されます。
関連論文リスト
- Cooking Up Creativity: A Cognitively-Inspired Approach for Enhancing LLM Creativity through Structured Representations [53.950760059792614]
大きな言語モデル(LLM)は数え切れないほど多くのタスクで優れていますが、創造性に苦慮しています。
我々は、LLMと構造化表現を結合し、より創造的で多様なアイデアを生み出すために認知的にインスピレーションを与える新しいアプローチを導入する。
我々は、創造的なレシピを生成するモデルであるDishCOVERを用いて、料理分野における我々のアプローチを実証する。
論文 参考訳(メタデータ) (2025-04-29T11:13:06Z) - Creation-MMBench: Assessing Context-Aware Creative Intelligence in MLLM [58.42678619252968]
Creation-MMBenchはマルチモーダル大言語モデルの創造性を評価するために設計されたベンチマークである。
ベンチマークは、51のきめ細かいタスクにまたがる765のテストケースで構成されている。
実験結果から,オープンソースのMLLMは,クリエイティブタスクにおけるプロプライエタリなモデルに比べて著しく性能が劣っていることが明らかとなった。
論文 参考訳(メタデータ) (2025-03-18T17:51:34Z) - CTR-Driven Advertising Image Generation with Multimodal Large Language Models [53.40005544344148]
本稿では,Click-Through Rate (CTR) を主目的とし,マルチモーダル大言語モデル(MLLM)を用いた広告画像の生成について検討する。
生成した画像のCTRをさらに改善するため、強化学習(RL)を通して事前学習したMLLMを微調整する新たな報酬モデルを提案する。
本手法は,オンラインとオフラインの両方で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-02-05T09:06:02Z) - Empowering Visual Creativity: A Vision-Language Assistant to Image Editing Recommendations [109.65267337037842]
IER(Image Editing Recommendation)の課題を紹介する。
IERは、入力画像から多様なクリエイティブな編集命令を自動生成し、ユーザの未指定の編集目的を表すシンプルなプロンプトを作成することを目的としている。
本稿では,Creative-Vision Language Assistant(Creativity-VLA)を紹介する。
論文 参考訳(メタデータ) (2024-05-31T18:22:29Z) - A New Creative Generation Pipeline for Click-Through Rate with Stable
Diffusion Model [8.945197427679924]
従来のAIベースのアプローチは、デザイナーからの美的知識を限定しながら、ユーザー情報を考慮しないという同じ問題に直面している。
結果を最適化するために、従来の方法で生成されたクリエイティブは、クリエイティブランキングモデルと呼ばれる別のモジュールによってランク付けされる。
本稿では,クリエイティビティ生成段階においてCTRを改善することを目的とした,Click-Through Rate (CG4CTR) のための新しいCreative Generationパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-17T03:27:39Z) - Parallel Ranking of Ads and Creatives in Real-Time Advertising Systems [20.78133992969317]
広告とクリエイティビティランキングのオンライン並列推定のための新しいアーキテクチャを初めて提案する。
オンラインアーキテクチャは、全体的なレイテンシを低減しつつ、洗練されたパーソナライズされたクリエイティブモデリングを可能にする。
CTR推定のためのオフラインジョイントモデルは、広告とクリエイティブの相互認識と協調最適化を可能にする。
論文 参考訳(メタデータ) (2023-12-20T04:05:21Z) - Cross-Element Combinatorial Selection for Multi-Element Creative in
Display Advertising [16.527943807941856]
本稿では,複数の創造的要素を対象としたクロスエレメント・コンビネーション・セレクション・フレームワークを提案する。
エンコーダプロセスでは、単一の創造的要素の表現を動的に調整するために、クロスエレメント相互作用を採用する。
実世界のデータセットの実験では、CECSがオフラインメトリクスのSOTAスコアを達成した。
論文 参考訳(メタデータ) (2023-07-04T09:32:39Z) - Towards Creativity Characterization of Generative Models via Group-based
Subset Scanning [64.6217849133164]
創造的プロセスを特定し,定量化し,特徴付けるグループベースサブセットスキャンを提案する。
創造的なサンプルは、データセット全体にわたる通常のサンプルや非創造的なサンプルよりも大きな異常のサブセットを生成する。
論文 参考訳(メタデータ) (2022-03-01T15:07:14Z) - Efficient Optimal Selection for Composited Advertising Creatives with
Tree Structure [24.13017090236483]
視覚的に楽しめる広告クリエイティビティは、製品のクリックスルーレート(CTR)を増加させる可能性がある。
ツリー構造に基づいたアダプティブで効率的な広告クリエイティブセレクションフレームワークを提案します。
ツリー構造に基づいて、トンプソンサンプリングは動的プログラミングに適応され、最大のCTRを持つ潜在的な広告クリエイティブの効率的な探索につながります。
論文 参考訳(メタデータ) (2021-03-02T03:39:41Z) - Learning to Create Better Ads: Generation and Ranking Approaches for Ad
Creative Refinement [26.70647666598025]
i)新しい広告テキストを生成すること、(ii)新しい広告テキストにキーフレーズを推奨すること、(iii)画像タグ(画像中のオブジェクト)を推奨すること。
複数の広告主が実施したA/Bテストに基づいて、劣悪な広告クリエイティブと優良な広告クリエイティブのペアワイズな例を作成します。
また、Yahoo Geminiの広告プラットフォームからのデータを使って、実験から広く適用可能な洞察を共有しています。
論文 参考訳(メタデータ) (2020-08-17T16:46:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。