論文の概要: Semi-supervised Fashion Compatibility Prediction by Color Distortion
Prediction
- arxiv url: http://arxiv.org/abs/2212.14680v1
- Date: Tue, 27 Dec 2022 05:33:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-09 01:47:05.926872
- Title: Semi-supervised Fashion Compatibility Prediction by Color Distortion
Prediction
- Title(参考訳): 色歪予測による半教師付きファッション相性予測
- Authors: Ling Xiao and Toshihiko Yamasaki
- Abstract要約: 教師付き学習手法は、大規模ラベル付きデータセットが必須であるという事実に悩まされてきた。
低レベル画像情報の認識をベースラインに強制する一般的な色歪み予測タスクを提案する。
提案されたプレテキストタスクをベースラインに適用すると、元のベースラインを一貫して上回る。
- 参考スコア(独自算出の注目度): 38.97384476324863
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Supervised learning methods have been suffering from the fact that a
large-scale labeled dataset is mandatory, which is difficult to obtain. This
has been a more significant issue for fashion compatibility prediction because
compatibility aims to capture people's perception of aesthetics, which are
sparse and changing. Thus, the labeled dataset may become outdated quickly due
to fast fashion. Moreover, labeling the dataset always needs some expert
knowledge; at least they should have a good sense of aesthetics. However, there
are limited self/semi-supervised learning techniques in this field. In this
paper, we propose a general color distortion prediction task forcing the
baseline to recognize low-level image information to learn more discriminative
representation for fashion compatibility prediction. Specifically, we first
propose to distort the image by adjusting the image color balance, contrast,
sharpness, and brightness. Then, we propose adding Gaussian noise to the
distorted image before passing them to the convolutional neural network (CNN)
backbone to learn a probability distribution over all possible distortions. The
proposed pretext task is adopted in the state-of-the-art methods in fashion
compatibility and shows its effectiveness in improving these methods' ability
in extracting better feature representations. Applying the proposed pretext
task to the baseline can consistently outperform the original baseline.
- Abstract(参考訳): 教師付き学習手法は,大規模ラベル付きデータセットが必須であるという事実に悩まされており,入手が困難である。
これはファッション互換性の予測においてより重大な問題であり、互換性は人々の美学に対する認識を捉えることを目的としている。
したがって、ラベル付きデータセットはファストファッションのために急速に時代遅れになる可能性がある。
さらに、データセットのラベル付けには、常にある程度の専門知識が必要です。
しかし、この分野には限定的な自己/半監督学習技術がある。
本稿では,ベースラインに低レベル画像情報を認識させ,ファッション適合性予測のためのより識別的な表現を学習させる一般的な色歪予測タスクを提案する。
具体的には、画像の色バランス、コントラスト、シャープさ、明るさを調整して画像を歪めることを提案する。
次に,畳み込みニューラルネットワーク(cnn)バックボーンに渡す前に,歪み画像にガウス雑音を加えることにより,可能なすべての歪みの確率分布を学習する。
提案するpretextタスクは,ファッション互換性の最先端手法に採用され,より優れた特徴表現抽出におけるそれらの手法の能力向上効果を示す。
提案するプリテキストタスクをベースラインに適用することで、元のベースラインを一貫して上回ることができる。
関連論文リスト
- Uncovering Capabilities of Model Pruning in Graph Contrastive Learning [0.0]
我々は、拡張ビューではなく、異なるモデルバージョンを対比することで、グラフのコントラスト学習の問題を再構築する。
教師なしおよび転送学習によるグラフ分類に関する様々なベンチマークにおいて,本手法を広範囲に検証する。
論文 参考訳(メタデータ) (2024-10-27T07:09:31Z) - DiffuseMix: Label-Preserving Data Augmentation with Diffusion Models [18.44432223381586]
近年、ディープニューラルネットワークの一般化を改善するために、画像混合に基づく拡張技術が数多く導入されている。
これらの手法では、2つ以上のランダムに選択された自然画像が混合され、拡張画像を生成する。
DiffuseMixを提案する。DiffuseMixは、拡散モデルを利用してトレーニング画像を再構成する新しいデータ拡張手法である。
論文 参考訳(メタデータ) (2024-04-05T05:31:02Z) - Improving Fairness using Vision-Language Driven Image Augmentation [60.428157003498995]
公平性は、特に顔領域において、ディープラーニングの識別モデルを訓練する際に重要である。
モデルは、特定の特性(年齢や肌の色など)と無関係な属性(下流タスク)を関連付ける傾向がある
本稿では,これらの相関を緩和し,公平性を向上する手法を提案する。
論文 参考訳(メタデータ) (2023-11-02T19:51:10Z) - Balancing the Picture: Debiasing Vision-Language Datasets with Synthetic
Contrast Sets [52.77024349608834]
視覚言語モデルは、インターネットから未計算の画像テキストペアの事前トレーニング中に学んだ社会的バイアスを永続し、増幅することができる。
COCO Captionsは、背景コンテキストとその場にいる人々の性別間のバイアスを評価するために最も一般的に使用されるデータセットである。
本研究では,COCOデータセットを男女バランスの取れたコントラストセットで拡張する新しいデータセットデバイアスパイプラインを提案する。
論文 参考訳(メタデータ) (2023-05-24T17:59:18Z) - Robustifying Deep Vision Models Through Shape Sensitization [19.118696557797957]
そこで本研究では,ネットワークの全体像を学習するためのインセンティブを明示的に付与する,シンプルで軽量な対向拡張手法を提案する。
我々の拡張は、ランダムに決定された混合比を用いて、シャッフルパッチで、ある画像から別の画像へのエッジマップを重畳する。
この拡張により,データセットやニューラルアーキテクチャの分類精度とロバストネスが大幅に向上することを示す。
論文 参考訳(メタデータ) (2022-11-14T11:17:46Z) - Improving Fairness in Image Classification via Sketching [14.154930352612926]
ディープニューラルネットワーク(DNN)は、異なるサブ人口からトレーニングデータが収集された場合、不公平な予測を行う傾向がある。
我々はこの現象に対処するためにスケッチを使うことを提案する。
本手法は,一般的なシーンデータセットと医療シーンデータセットの両方に関する広範な実験を通じて評価する。
論文 参考訳(メタデータ) (2022-10-31T22:26:32Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z) - Fast, Self Supervised, Fully Convolutional Color Normalization of H&E
Stained Images [3.1329883315045106]
色の変化は、病理組織学における自動診断システムのためのディープラーニングベースのソリューションの展開に問題を引き起こす。
本稿では,自己教師付きトレーニングと推論において高速な色正規化手法を提案する。
本手法は,軽量な完全畳み込みニューラルネットワークをベースとして,深層学習に基づくパイプラインに前処理ブロックとして容易に取り付けることができる。
論文 参考訳(メタデータ) (2020-11-30T17:05:58Z) - An Empirical Study of the Collapsing Problem in Semi-Supervised 2D Human
Pose Estimation [80.02124918255059]
半教師付き学習は、ラベルなし画像の探索によってモデルの精度を高めることを目的としている。
私たちは相互に教え合うために2つのネットワークを学びます。
各ネットワーク内の容易なイメージに関するより信頼性の高い予測は、他のネットワークに対応するハードイメージについて学ぶように教えるために使用される。
論文 参考訳(メタデータ) (2020-11-25T03:29:52Z) - End-to-end Interpretable Learning of Non-blind Image Deblurring [102.75982704671029]
非ブラインド画像のデブロワーリングは、通常、対応するシャープ画像の勾配に関する自然の先行によって正規化される線形最小二乗問題として定式化される。
本稿では,(既知の)ぼかしと自然像前のカーネルの逆フィルタを用いて,リチャードソン解法を事前条件として提案する。
論文 参考訳(メタデータ) (2020-07-03T15:45:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。