論文の概要: Brand Label Albedo Extraction of eCommerce Products using Generative
Adversarial Network
- arxiv url: http://arxiv.org/abs/2109.02929v1
- Date: Tue, 7 Sep 2021 08:30:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-08 14:47:02.119986
- Title: Brand Label Albedo Extraction of eCommerce Products using Generative
Adversarial Network
- Title(参考訳): ジェネレーティブ・ディバイサル・ネットワークを用いたeコマース商品のブランドラベルアルベド抽出
- Authors: Suman Sapkota, Manish Juneja, Laurynas Keleras, Pranav Kotwal, Binod
Bhattarai
- Abstract要約: 我々は,eコマース製品のブランドラベルのアルベドを抽出するソリューションを提案する。
我々は,アルベド抽出のための大規模写真リアル合成データセットを生成し,その後,様々な照明条件の画像をアルベドに変換する生成モデルを訓練した。
- 参考スコア(独自算出の注目度): 6.422262171968397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we present our solution to extract albedo of branded labels for
e-commerce products. To this end, we generate a large-scale photo-realistic
synthetic data set for albedo extraction followed by training a generative
model to translate images with diverse lighting conditions to albedo. We
performed an extensive evaluation to test the generalisation of our method to
in-the-wild images. From the experimental results, we observe that our solution
generalises well compared to the existing method both in the unseen rendered
images as well as in the wild image.
- Abstract(参考訳): 本稿では,eコマース製品のブランドラベルからアルベドを抽出する手法を提案する。
そこで我々は,アルベド抽出のための大規模写真リアリスティック合成データセットを生成し,様々な照明条件の画像をアルベドに変換する生成モデルを訓練した。
本手法の一般化をテストするために,本手法を広範に評価した。
実験結果から,未認識のレンダリング画像と野生画像の両方において,既存の手法と比較して解の一般化が良好であることを確認した。
関連論文リスト
- Descanning: From Scanned to the Original Images with a Color Correction
Diffusion Model [11.179584649698134]
我々はDESCAN-18Kという,高品質で大規模なデータセットを新たに導入する。
これは、複数の複雑な劣化を含む野生で収集された18K対の原画像とスキャンされた画像を含んでいる。
本研究では,大域的な色劣化を補正するカラーエンコーダと,局所的な劣化を除去する条件付き拡散確率モデル(DDPM)からなる,DescanDiffusionと呼ばれる新しい画像復元モデルを提案する。
論文 参考訳(メタデータ) (2024-02-08T02:11:52Z) - Intrinsic Image Diffusion for Single-view Material Estimation [0.0]
室内シーンの外観分解のための生成モデルIntrinsic Image Diffusionを提案する。
1つの入力ビューから、アルベド、粗さ、および金属地図として表される複数の材料説明をサンプリングする。
提案手法は,PSNRで1.5dB$,アルベド予測で45%のFIDスコアを達成し,よりシャープで,より一貫性があり,より詳細な資料を生成する。
論文 参考訳(メタデータ) (2023-12-19T15:56:19Z) - Perceptual Artifacts Localization for Image Synthesis Tasks [59.638307505334076]
我々は10,168個の画像からなる新しいデータセットを導入し,それぞれに知覚的アーティファクトラベルを付加した。
提案したデータセットに基づいてトレーニングされたセグメンテーションモデルは、さまざまなタスクにまたがるアーティファクトを効果的にローカライズする。
生成した画像の知覚的アーティファクトをシームレスに修正する,革新的なズームイン・インペインティングパイプラインを提案する。
論文 参考訳(メタデータ) (2023-10-09T10:22:08Z) - Markup-to-Image Diffusion Models with Scheduled Sampling [111.30188533324954]
画像生成の最近の進歩に基づき,画像にマークアップを描画するためのデータ駆動型アプローチを提案する。
このアプローチは拡散モデルに基づいており、デノナイジング操作のシーケンスを用いてデータの分布をパラメータ化する。
数式(La)、テーブルレイアウト(HTML)、シート音楽(LilyPond)、分子画像(SMILES)の4つのマークアップデータセットの実験を行った。
論文 参考訳(メタデータ) (2022-10-11T04:56:12Z) - Designing An Illumination-Aware Network for Deep Image Relighting [69.750906769976]
本稿では、階層的なサンプリングから1つの画像からシーンを段階的にリライトするためのガイダンスに従うイルミネーション・アウェア・ネットワーク(IAN)を提案する。
さらに、物理レンダリングプロセスの近似として、イルミネーション・アウェア・残留ブロック(IARB)が設計されている。
実験の結果,提案手法は従来の最先端手法よりも定量的,定性的な照準結果が得られることがわかった。
論文 参考訳(メタデータ) (2022-07-21T16:21:24Z) - A Novel Intrinsic Image Decomposition Method to Recover Albedo for
Aerial Images in Photogrammetry Processing [3.556015072520384]
フォトグラム画像による表面アルベドは、VR/AR/MRおよびデジタルツインにおける下流の応用を促進することができる。
これらのテクスチャは直接画像から導出されるので、標準フォトグラムのパイプラインはこれらの応用に最適である。
自然照明条件下での屋外空間画像に対する画像形成モデルを提案する。
次に、逆モデルを導出し、典型的なフォトグラム積を幾何学の初期近似として利用してアルベドを推定する。
論文 参考訳(メタデータ) (2022-04-08T15:50:52Z) - Spatially Multi-conditional Image Generation [80.04130168156792]
本稿では,マルチ条件画像生成の問題に対処する新しいニューラルアーキテクチャを提案する。
提案手法は, 利用可能なラベルを入力トークンとして受信する, 画素単位のトランスフォーマー型アーキテクチャを用いる。
3つのベンチマークデータセットに対する実験により,提案手法の最先端および比較ベースラインに対する明らかな優位性を示した。
論文 参考訳(メタデータ) (2022-03-25T17:57:13Z) - Watermarking Images in Self-Supervised Latent Spaces [75.99287942537138]
我々は,自己教師型アプローチに照らして,事前学習した深層ネットワークに基づく透かし手法を再検討する。
我々は、マーク時間におけるデータの増大を利用して、マークとバイナリのメッセージをその潜在空間に埋め込む方法を提案する。
論文 参考訳(メタデータ) (2021-12-17T15:52:46Z) - Factorisation-based Image Labelling [0.9319432628663639]
本稿では,潜在変数を持つ生成モデルに基づくパッチベースのラベル伝搬手法を提案する。
提案したモデルを,MICCAI 2012 Grand Challenge and Workshop on Multi-Atlas Labelingのデータを用いて,最先端のモデルと比較した。
論文 参考訳(メタデータ) (2021-11-19T17:10:54Z) - Exploiting Web Images for Fine-Grained Visual Recognition by Eliminating
Noisy Samples and Utilizing Hard Ones [60.07027312916081]
トレーニング中に実世界のWeb画像から無関係なサンプルを除去するための新しいアプローチを提案します。
私達のアプローチはよりよい性能を達成するために無関係な騒々しいWebイメージおよび堅い例の有害な影響を緩和できます。
論文 参考訳(メタデータ) (2021-01-23T03:58:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。