論文の概要: Staging E-Commerce Products for Online Advertising using Retrieval
Assisted Image Generation
- arxiv url: http://arxiv.org/abs/2307.15326v1
- Date: Fri, 28 Jul 2023 06:04:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-31 13:30:43.291568
- Title: Staging E-Commerce Products for Online Advertising using Retrieval
Assisted Image Generation
- Title(参考訳): 検索支援画像生成を用いたオンライン広告用ステージングeコマース製品
- Authors: Yueh-Ning Ku, Mikhail Kuznetsov, Shaunak Mishra and Paloma de Juan
- Abstract要約: 本稿では,非ステージ製品画像の背景生成にGAN(Generative Adversarial Network)を用いた手法を提案する。
当社のステージングアプローチは,製品イメージからビデオ広告に導かれる商品のアニメーションを,どのように実現できるかを示す。
- 参考スコア(独自算出の注目度): 11.03803158931361
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Online ads showing e-commerce products typically rely on the product images
in a catalog sent to the advertising platform by an e-commerce platform. In the
broader ads industry such ads are called dynamic product ads (DPA). It is
common for DPA catalogs to be in the scale of millions (corresponding to the
scale of products which can be bought from the e-commerce platform). However,
not all product images in the catalog may be appealing when directly
re-purposed as an ad image, and this may lead to lower click-through rates
(CTRs). In particular, products just placed against a solid background may not
be as enticing and realistic as a product staged in a natural environment. To
address such shortcomings of DPA images at scale, we propose a generative
adversarial network (GAN) based approach to generate staged backgrounds for
un-staged product images. Generating the entire staged background is a
challenging task susceptible to hallucinations. To get around this, we
introduce a simpler approach called copy-paste staging using retrieval assisted
GANs. In copy paste staging, we first retrieve (from the catalog) staged
products similar to the un-staged input product, and then copy-paste the
background of the retrieved product in the input image. A GAN based in-painting
model is used to fill the holes left after this copy-paste operation. We show
the efficacy of our copy-paste staging method via offline metrics, and human
evaluation. In addition, we show how our staging approach can enable animations
of moving products leading to a video ad from a product image.
- Abstract(参考訳): eコマース製品を示すオンライン広告は、通常、eコマースプラットフォームによって広告プラットフォームに送られたカタログの製品イメージに依存する。
幅広い広告業界では、このような広告は動的製品広告(DPA)と呼ばれる。
DPAカタログは数百万の規模(eコマースプラットフォームから購入できる製品の規模に対応する)で販売されることが一般的である。
しかし、カタログ内のすべての製品イメージが広告画像として直接利用された場合に魅力的であるとは限らないため、クリックスルー率(ctr)が低下する可能性がある。
特に、固い背景に置かれた製品は、自然の環境で実行される製品ほど魅力的で現実的ではないかもしれない。
大規模dpa画像の欠点に対処するため,製品画像の段階的背景を生成するためのgan(generative adversarial network)アプローチを提案する。
ステージ化された背景全体を生成することは幻覚に影響を受けやすい課題です。
これを回避するために,検索支援ganを用いたコピーペーストステージングというシンプルなアプローチを導入する。
コピーペースト・ステージングでは、まず、未段階の入力製品に似た(カタログから)ステージ製品を取得し、その後、検索された製品の背景を入力画像にコピー・ペーストする。
このコピーペースト操作後に残った穴を埋めるためにganベースのインペインティングモデルが使用される。
オフラインメトリクスによるコピー・ペースト・ステージング手法の有効性と人的評価を示す。
さらに,当社のステージングアプローチによって,製品イメージからビデオ広告に至る製品のアニメーション化が可能になることを示す。
関連論文リスト
- Automated Virtual Product Placement and Assessment in Images using Diffusion Models [1.63075356372232]
本稿では,新しい3段階完全自動化VPPシステムを提案する。
第1段階では、言語誘導画像セグメンテーションモデルにより、製品塗布のための画像内の最適な領域を特定する。
第2段階では、いくつかの製品イメージを微調整した安定拡散(SD)を使用して、以前に特定された候補領域に製品を塗布する。
最終段階では、低画質の画像を効果的に取り出すために設計された「アライメントモジュール」が導入されている。
論文 参考訳(メタデータ) (2024-05-02T09:44:13Z) - Iteratively Prompting Multimodal LLMs to Reproduce Natural and AI-Generated Images [45.302905684461905]
本稿では,DALL-E 3 や Midjourney などのプラットフォームの出力を模倣するために,視覚的理解を充実したマルチモーダルモデルを採用する可能性について検討する。
私たちは、マーケットプレースやプレミアムストックイメージプロバイダで利用可能なものに似た画像を生成するプロンプトを作成していますが、著しくコストを削減しています。
自動測定と人的評価の両方で支持された我々の研究結果は、市場価格のごく一部で、同等のビジュアルコンテンツを生成できることを明らかにした。
論文 参考訳(メタデータ) (2024-04-21T21:30:17Z) - Transformer-empowered Multi-modal Item Embedding for Enhanced Image
Search in E-Commerce [20.921870288665627]
マルチモーダルアイテム埋め込みモデル(MIEM)は、製品に関するテキスト情報と複数の画像の両方を利用して、意味のある製品機能を構築することができる。
MIEMはShopeeイメージ検索プラットフォームの一部となっている。
論文 参考訳(メタデータ) (2023-11-29T08:09:50Z) - Cross-Domain Product Representation Learning for Rich-Content E-Commerce [16.418118040661646]
本稿では,ROPEと呼ばれる大規模cRoss-dOmain製品認識データセットを提案する。
ROPEは幅広い製品カテゴリーをカバーし、数百万のショートビデオとライブストリームに対応する180,000以上の製品を含んでいる。
プロダクトページ、ショートビデオ、ライブストリームを同時にカバーする最初のデータセットであり、異なるメディアドメイン間で統一された製品表現を確立する基盤を提供する。
論文 参考訳(メタデータ) (2023-08-10T13:06:05Z) - Unified Vision-Language Representation Modeling for E-Commerce
Same-Style Products Retrieval [12.588713044749177]
電子商取引プラットフォームでは,同種の商品検索が重要な役割を担っている。
電子商取引同型商品検索のための統合視覚言語モデリング手法を提案する。
クロスモーダルな製品間検索、スタイル転送、ユーザ対話型検索が可能である。
論文 参考訳(メタデータ) (2023-02-10T07:24:23Z) - Unposed: Unsupervised Pose Estimation based Product Image
Recommendations [4.467248776406006]
そこで本研究では,不在者に対する製品のイメージセットをスキャンするためのヒューマン・ポース検出に基づく教師なし手法を提案する。
教師なしのアプローチは、いかなるバイアスにも拘わらず、製品とカテゴリーに基づいて販売者に対して公平なアプローチを示唆している。
200の製品を手動で調査し,その大部分に1回の反復画像や欠落画像があり,その中から3K製品(20K画像)を採取した。
論文 参考訳(メタデータ) (2023-01-19T05:02:55Z) - Boost CTR Prediction for New Advertisements via Modeling Visual Content [55.11267821243347]
広告の視覚的内容を利用してCTR予測モデルの性能を向上させる。
過去に蓄積された履歴的ユーザ・アドインタラクションに基づいて,各ビジュアルIDの埋め込みを学習する。
Baiduオンライン広告のCTR予測モデルにビジュアルIDを埋め込んだ後、広告の平均CTRは1.46%改善し、総料金は1.10%増加した。
論文 参考訳(メタデータ) (2022-09-23T17:08:54Z) - SImProv: Scalable Image Provenance Framework for Robust Content
Attribution [80.25476792081403]
我々は、クエリ画像を元の信頼できるデータベースにマッチングするフレームワークであるSImProvを提示する。
SimProvは3つのステージで構成されている。トップkの最も類似した画像を検索するためのスケーラブルな検索ステージと、候補の中からオリジナルを識別するための再ランク付けとほぼ重複した検出ステージである。
1億画像のデータセット上での効率的な検索と操作の検出を実証する。
論文 参考訳(メタデータ) (2022-06-28T18:42:36Z) - Automatic Generation of Product-Image Sequence in E-commerce [46.06263129000091]
MUIsC(Multi-modality Unified Imagesequence)は、ルール違反を学習することで、すべてのカテゴリを同時に検出できる。
2021年12月までに、当社の AGPIS フレームワークは、約150万製品の高規格画像を生成し、13.6%の拒絶率を達成した。
論文 参考訳(メタデータ) (2022-06-26T23:38:42Z) - Main Product Detection with Graph Networks for Fashion [44.09686303429833]
主要製品検出は、ビジョンベースのファッション製品フィード解析パイプラインの重要なステップである。
グラフ畳み込みネットワーク(GCN)を組み込んだモデルを提案する。
論文 参考訳(メタデータ) (2022-01-25T16:26:04Z) - Poet: Product-oriented Video Captioner for E-commerce [124.9936946822493]
電子商取引では、製品プロモーションにユーザ生成ビデオが増えている。このビデオで表されるユーザ優先の製品特性を物語るビデオ記述をどうやって生成するかは、プロモーションを成功させる上で不可欠である。
本稿では,製品指向の動画キャプタフレームワークであるPoetを提案する。
Poetは、生成品質、製品面のキャプチャ、語彙の多様性に関する従来の手法よりも一貫した性能向上を実現していることを示す。
論文 参考訳(メタデータ) (2020-08-16T10:53:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。