Fugu-MT 論文翻訳(概要): Brand Label Albedo Extraction of eCommerce Products using Generative Adversarial Network

論文の概要: Brand Label Albedo Extraction of eCommerce Products using Generative Adversarial Network

arxiv url: http://arxiv.org/abs/2109.02929v1
Date: Tue, 7 Sep 2021 08:30:15 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-08 14:47:02.119986
Title: Brand Label Albedo Extraction of eCommerce Products using Generative Adversarial Network
Title（参考訳）: ジェネレーティブ・ディバイサル・ネットワークを用いたeコマース商品のブランドラベルアルベド抽出
Authors: Suman Sapkota, Manish Juneja, Laurynas Keleras, Pranav Kotwal, Binod Bhattarai
Abstract要約: 我々は,eコマース製品のブランドラベルのアルベドを抽出するソリューションを提案する。我々は,アルベド抽出のための大規模写真リアル合成データセットを生成し,その後,様々な照明条件の画像をアルベドに変換する生成モデルを訓練した。
参考スコア（独自算出の注目度）: 6.422262171968397
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper we present our solution to extract albedo of branded labels for e-commerce products. To this end, we generate a large-scale photo-realistic synthetic data set for albedo extraction followed by training a generative model to translate images with diverse lighting conditions to albedo. We performed an extensive evaluation to test the generalisation of our method to in-the-wild images. From the experimental results, we observe that our solution generalises well compared to the existing method both in the unseen rendered images as well as in the wild image.
Abstract（参考訳）: 本稿では,eコマース製品のブランドラベルからアルベドを抽出する手法を提案する。そこで我々は,アルベド抽出のための大規模写真リアリスティック合成データセットを生成し,様々な照明条件の画像をアルベドに変換する生成モデルを訓練した。本手法の一般化をテストするために,本手法を広範に評価した。実験結果から,未認識のレンダリング画像と野生画像の両方において,既存の手法と比較して解の一般化が良好であることを確認した。

関連論文リスト

SAIL: Self-supervised Albedo Estimation from Real Images with a Latent Diffusion Model [4.015354837450373]
内在的な画像分解は、イメージを根底にあるアルベドとシェーディングコンポーネントに分離することを目的としている。本研究では,一視点実世界の画像からアルベド様の表現を推定する手法であるSAILを提案する。
論文参考訳（メタデータ） (2025-05-26T09:31:56Z)
Preserving Product Fidelity in Large Scale Image Recontextualization with Diffusion Models [1.8606057023042066]
本稿では,テキスト・ツー・イメージ拡散モデルと新しいデータ拡張パイプラインを用いた高忠実度製品画像再構成のためのフレームワークを提案する。本手法は,生成画像の品質と多様性を,製品表現を分離し,モデルによる製品特性の理解を深めることによって改善する。
論文参考訳（メタデータ） (2025-03-11T01:24:39Z)
GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing [60.101097709212716]
本稿では、一般化可能なプロンプト誘導型生成データ拡張手法であるGenMixを紹介する。本手法は、画像編集を利用して、カスタム条件付きプロンプトに基づく拡張画像を生成する。提案手法は、非現実的な画像とラベルの曖昧さを緩和し、結果のモデルの性能と対角的堅牢性を向上する。
論文参考訳（メタデータ） (2024-12-03T10:45:34Z)
Dynamic Product Image Generation and Recommendation at Scale for Personalized E-commerce [0.07499722271664144]
遅延拡散に基づく画像生成とコンテキスト帯域の結合により、大規模にアイキャッチされたパーソナライズされた製品イメージを作成することができる。本稿では,電子商取引のオンラインキャンペーンにおけるレコメンデーションによるユーザエンゲージメントを高めるために,これらの技術をどのように活用したかを紹介する。
論文参考訳（メタデータ） (2024-08-22T13:37:30Z)
Heavy Labels Out! Dataset Distillation with Label Space Lightening [69.67681224137561]
HeLlOは、合成画像から直接合成ラベルをオンラインで生成できる効果的な画像-ラベルプロジェクタを目指している。ソフトラベルの完全なセットに必要な元のストレージの0.003%しか必要とせず、大規模データセット上での現在の最先端データセット蒸留法と同等のパフォーマンスを達成できることを実証した。
論文参考訳（メタデータ） (2024-08-15T15:08:58Z)
FreeCompose: Generic Zero-Shot Image Composition with Diffusion Prior [50.0535198082903]
我々は,複数の入力イメージを単一のコヒーレントなイメージに統合する,新しい画像合成手法を提案する。本稿では, 大規模事前学習拡散モデルに内在する強力な生成的前駆体を利用して, 汎用画像合成を実現する可能性を示す。
論文参考訳（メタデータ） (2024-07-06T03:35:43Z)
Descanning: From Scanned to the Original Images with a Color Correction Diffusion Model [11.179584649698134]
我々はDESCAN-18Kという,高品質で大規模なデータセットを新たに導入する。これは、複数の複雑な劣化を含む野生で収集された18K対の原画像とスキャンされた画像を含んでいる。本研究では,大域的な色劣化を補正するカラーエンコーダと,局所的な劣化を除去する条件付き拡散確率モデル(DDPM)からなる,DescanDiffusionと呼ばれる新しい画像復元モデルを提案する。
論文参考訳（メタデータ） (2024-02-08T02:11:52Z)
Intrinsic Image Diffusion for Indoor Single-view Material Estimation [55.276815106443976]
室内シーンの外観分解のための生成モデルIntrinsic Image Diffusionを提案する。 1つの入力ビューから、アルベド、粗さ、および金属地図として表される複数の材料説明をサンプリングする。提案手法は,PSNRで1.5dB$,アルベド予測で45%のFIDスコアを達成し,よりシャープで,より一貫性があり,より詳細な資料を生成する。
論文参考訳（メタデータ） (2023-12-19T15:56:19Z)
Perceptual Artifacts Localization for Image Synthesis Tasks [59.638307505334076]
我々は10,168個の画像からなる新しいデータセットを導入し,それぞれに知覚的アーティファクトラベルを付加した。提案したデータセットに基づいてトレーニングされたセグメンテーションモデルは、さまざまなタスクにまたがるアーティファクトを効果的にローカライズする。生成した画像の知覚的アーティファクトをシームレスに修正する,革新的なズームイン・インペインティングパイプラインを提案する。
論文参考訳（メタデータ） (2023-10-09T10:22:08Z)
Watermarking Images in Self-Supervised Latent Spaces [75.99287942537138]
我々は,自己教師型アプローチに照らして,事前学習した深層ネットワークに基づく透かし手法を再検討する。我々は、マーク時間におけるデータの増大を利用して、マークとバイナリのメッセージをその潜在空間に埋め込む方法を提案する。
論文参考訳（メタデータ） (2021-12-17T15:52:46Z)
Factorisation-based Image Labelling [0.9319432628663639]
本稿では,潜在変数を持つ生成モデルに基づくパッチベースのラベル伝搬手法を提案する。提案したモデルを,MICCAI 2012 Grand Challenge and Workshop on Multi-Atlas Labelingのデータを用いて,最先端のモデルと比較した。
論文参考訳（メタデータ） (2021-11-19T17:10:54Z)
Exploiting Web Images for Fine-Grained Visual Recognition by Eliminating Noisy Samples and Utilizing Hard Ones [60.07027312916081]
トレーニング中に実世界のWeb画像から無関係なサンプルを除去するための新しいアプローチを提案します。私達のアプローチはよりよい性能を達成するために無関係な騒々しいWebイメージおよび堅い例の有害な影響を緩和できます。
論文参考訳（メタデータ） (2021-01-23T03:58:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。