論文の概要: CoRe: Color Regression for Multicolor Fashion Garments
- arxiv url: http://arxiv.org/abs/2010.02849v2
- Date: Tue, 31 May 2022 14:39:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 05:52:41.322648
- Title: CoRe: Color Regression for Multicolor Fashion Garments
- Title(参考訳): コア:多色ファッション服のカラーレグレッション
- Authors: Alexandre Rame, Arthur Douillard, Charles Ollion
- Abstract要約: 本稿では,RGBの正確な値を予測するために,色検出を回帰問題として扱う。
新たに提案したアーキテクチャの洗練のための第2のレグレッションステージも含んでいます。
このアーキテクチャはモジュラーであり、多色衣料のすべての色のRGBを検出するために容易に拡張される。
- 参考スコア(独自算出の注目度): 80.57724826629176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Developing deep networks that analyze fashion garments has many real-world
applications. Among all fashion attributes, color is one of the most important
yet challenging to detect. Existing approaches are classification-based and
thus cannot go beyond the list of discrete predefined color names. In this
paper, we handle color detection as a regression problem to predict the exact
RGB values. That's why in addition to a first color classifier, we include a
second regression stage for refinement in our newly proposed architecture. This
second step combines two attention models: the first depends on the type of
clothing, the second depends on the color previously detected by the
classifier. Our final prediction is the weighted spatial pooling over the image
pixels RGB values, where the illumination has been corrected. This architecture
is modular and easily expanded to detect the RGBs of all colors in a multicolor
garment. In our experiments, we show the benefits of each component of our
architecture.
- Abstract(参考訳): ファッションウェアを解析するディープネットワークの開発には、多くの実世界の応用がある。
あらゆるファッション属性の中で、色は最も重要で検出が難しいものの1つだ。
既存のアプローチは分類ベースであるため、個別に定義された色名のリストを超えることはできない。
本稿では,正確なrgb値を予測する回帰問題として,色検出を扱う。
そのため、最初の色分類器に加えて、新しく提案されたアーキテクチャを洗練するための第2の回帰ステージが含まれています。
この2番目のステップは2つの注意モデルを組み合わせる: 1つは衣服の種類に依存し、2つ目は以前に分類器が検出した色に依存します。
最終的な予測は、画像画素RGB値に対する重み付き空間プーリングであり、照明が修正されている。
このアーキテクチャはモジュラーであり、多色衣料のすべての色のRGBを検出するために容易に拡張される。
実験では、アーキテクチャの各コンポーネントの利点を示します。
関連論文リスト
- Exploring Multi-modal Neural Scene Representations With Applications on Thermal Imaging [4.780283142269005]
我々は、RGB以外の2次モードをNeRFに組み込むための4つの戦略を提案する。
放射能の点でRGBと大きく異なるため,熱画像は第2のモダリティとして選択した。
以上の結果から,第2分枝をNeRFに付加することは熱画像の新規なビュー合成に最適であり,かつRGBに有意な結果をもたらすことが判明した。
論文 参考訳(メタデータ) (2024-03-18T15:18:55Z) - A Multi-modal Approach to Single-modal Visual Place Classification [2.580765958706854]
RGBと深度(D)を組み合わせたマルチセンサー融合アプローチが近年人気を集めている。
単一モードRGB画像分類タスクを擬似多モードRGB-D分類問題として再構成する。
これら2つのモダリティを適切に処理し、融合し、分類するための、実践的で完全に自己管理されたフレームワークについて説明する。
論文 参考訳(メタデータ) (2023-05-10T14:04:21Z) - Detecting Recolored Image by Spatial Correlation [60.08643417333974]
画像のリカラー化は、画像の色値を操作して新しいスタイルを与える、新たな編集技術である。
本稿では,空間相関の観点から,従来型と深層学習による再色検出の汎用的検出能力を示す解を探索する。
提案手法は,複数のベンチマークデータセット上での最先端検出精度を実現し,未知の種類の再色法を適切に一般化する。
論文 参考訳(メタデータ) (2022-04-23T01:54:06Z) - Color Invariant Skin Segmentation [17.501659517108884]
本稿では,カラー情報に頼らずに画像中の皮膚を自動的に検出する問題に対処する。
この研究の主な動機は、皮膚のトーン全体にわたって一貫性のある結果を達成することである。
我々はそのような情報がない場合によく機能する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-04-21T05:07:21Z) - RGB-D Saliency Detection via Cascaded Mutual Information Minimization [122.8879596830581]
既存のRGB-Dサリエンシ検出モデルは、RGBと深さを効果的にマルチモーダル学習を実現するために明示的に奨励するものではない。
本稿では,RGB画像と深度データ間のマルチモーダル情報を「明示的」にモデル化するために,相互情報最小化による新しい多段階学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-15T12:31:27Z) - Image Colorization: A Survey and Dataset [94.59768013860668]
本稿では,最先端の深層学習に基づく画像着色技術に関する包括的調査を行う。
既存の着色技法を7つのクラスに分類し、その性能を規定する重要な要因について論じる。
我々は既存のデータセットと提案した画像の両方を用いて、既存の画像のカラー化手法を広範囲に実験的に評価する。
論文 参考訳(メタデータ) (2020-08-25T01:22:52Z) - Bi-directional Cross-Modality Feature Propagation with
Separation-and-Aggregation Gate for RGB-D Semantic Segmentation [59.94819184452694]
深度情報はRGBD画像のセマンティックセグメンテーションにおいて有用であることが証明されている。
既存のほとんどの研究は、深度測定がRGBピクセルと正確で整合していると仮定し、問題をモーダルな特徴融合としてモデル化している。
本稿では,RGB特徴量応答を効果的に再検討するだけでなく,複数の段階を通して正確な深度情報を抽出し,代わりに2つの補正表現を集約する,統一的で効率的なクロスモダリティガイドを提案する。
論文 参考訳(メタデータ) (2020-07-17T18:35:24Z) - Learning to Structure an Image with Few Colors [59.34619548026885]
そこで,カラー量子化ネットワークであるColorCNNを提案する。
1ビットのカラースペース(すなわち2色)だけで、提案されたネットワークはCIFAR10データセット上で82.1%のトップ-1の精度を達成した。
アプリケーションの場合、PNGでエンコードされた場合、提案したカラー量子化は、極低ビットレート方式の他の画像圧縮方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-17T17:56:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。