論文の概要: Modulated Contrast for Versatile Image Synthesis
- arxiv url: http://arxiv.org/abs/2203.09333v1
- Date: Thu, 17 Mar 2022 14:03:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-18 21:49:38.542287
- Title: Modulated Contrast for Versatile Image Synthesis
- Title(参考訳): 汎用画像合成のための変調コントラスト
- Authors: Fangneng Zhan, Jiahui Zhang, Yingchen Yu, Rongliang Wu, Shijian Lu
- Abstract要約: MoNCEは画像のコントラストを導入し、多面的画像間距離の知覚のための校正基準を学習する。
複数の対照的な目的に対して協調的に負のサンプルのプッシュ力を変調するために,MoNCEの最適輸送を導入する。
- 参考スコア(独自算出の注目度): 60.304183493234376
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Perceiving the similarity between images has been a long-standing and
fundamental problem underlying various visual generation tasks. Predominant
approaches measure the inter-image distance by computing pointwise absolute
deviations, which tends to estimate the median of instance distributions and
leads to blurs and artifacts in the generated images. This paper presents
MoNCE, a versatile metric that introduces image contrast to learn a calibrated
metric for the perception of multifaceted inter-image distances. Unlike vanilla
contrast which indiscriminately pushes negative samples from the anchor
regardless of their similarity, we propose to re-weight the pushing force of
negative samples adaptively according to their similarity to the anchor, which
facilitates the contrastive learning from informative negative samples. Since
multiple patch-level contrastive objectives are involved in image distance
measurement, we introduce optimal transport in MoNCE to modulate the pushing
force of negative samples collaboratively across multiple contrastive
objectives. Extensive experiments over multiple image translation tasks show
that the proposed MoNCE outperforms various prevailing metrics substantially.
The code is available at https://github.com/fnzhan/MoNCE.
- Abstract(参考訳): 画像間の類似性を認識することは、様々な視覚生成タスクの根底にある長年の根本的問題である。
優先的なアプローチは、点方向の絶対偏差を計算することによって画像間距離を測定するが、これはインスタンス分布の中央値を推定し、生成された画像のぼやけやアーティファクトを引き起こす傾向がある。
本稿では,画像コントラストを導入した多面体間距離の知覚のための校正指標であるMoNCEについて述べる。
類似性によらず無差別にアンカーから負のサンプルをプッシュするバニラコントラストと異なり,アンカーとの類似性に応じて適応的に負のサンプルの押し力を再強調する手法を提案する。
複数のパッチレベルのコントラスト対象が画像距離測定に関与しているため、複数のコントラスト対象に対して協調的に負サンプルのプッシュ力を変調するMoNCEの最適輸送を導入する。
複数の画像翻訳タスクに関する広範囲な実験により、提案手法が様々な普及度指標を実質的に上回っていることが示された。
コードはhttps://github.com/fnzhan/monceで入手できる。
関連論文リスト
- Adaptive Multi-head Contrastive Learning [44.163227964513695]
対照的な学習では、異なる拡張によって生成された元のイメージの2つのビューが正のペアと見なされる。
単射影ヘッドによって提供される単一の類似度測定は、正と負のサンプル対を評価する。
適応型マルチヘッドコントラスト学習(AMCL)は,いくつかの一般的なコントラスト学習手法に適用し,実験的に拡張することができる。
論文 参考訳(メタデータ) (2023-10-09T11:08:34Z) - Contrast-augmented Diffusion Model with Fine-grained Sequence Alignment
for Markup-to-Image Generation [15.411325887412413]
本稿では,FSA-CDM (Contrast-augmented Diffusion Model with Fine-fine Sequence Alignment) という新しいモデルを提案する。
FSA-CDMは、マークアップ・ツー・イメージ生成の性能を高めるために、対照的な正/負のサンプルを拡散モデルに導入する。
異なるドメインの4つのベンチマークデータセットで実験が行われる。
論文 参考訳(メタデータ) (2023-08-02T13:43:03Z) - Synthetic Hard Negative Samples for Contrastive Learning [8.776888865665024]
本稿では,コントラスト学習のための新しい特徴レベル手法,すなわち合成硬質負のサンプルをサンプリングする手法を提案する。
負試料を混合し, アンカー試料と他の負試料とのコントラストを制御して, より硬い負試料を生成する。
提案手法は,画像データセットの分類性能を向上し,既存の手法に容易に組み込むことができる。
論文 参考訳(メタデータ) (2023-04-06T09:54:35Z) - Masked Images Are Counterfactual Samples for Robust Fine-tuning [77.82348472169335]
微調整の深層学習モデルは、分布内(ID)性能と分布外(OOD)堅牢性の間のトレードオフにつながる可能性がある。
そこで本研究では,マスク付き画像を対物サンプルとして用いて,ファインチューニングモデルのロバスト性を向上させる新しいファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T11:51:28Z) - Exploring Negatives in Contrastive Learning for Unpaired Image-to-Image
Translation [12.754320302262533]
我々は、パッチをスペーシングし、ランキング付けすることで、アンペア画像から画像への変換(PUT)のための新しい負のプルーニング技術を導入する。
提案アルゴリズムは効率的で柔軟で,対応するパッチ間で本質的な情報を安定的に学習することができる。
論文 参考訳(メタデータ) (2022-04-23T08:31:18Z) - Object-aware Contrastive Learning for Debiased Scene Representation [74.30741492814327]
オブジェクトを自己教師型でローカライズする,オブジェクト認識型コントラスト学習フレームワークを開発した。
また、コントラCAM、オブジェクト認識型乱作、背景混合に基づく2つのデータ拡張を導入し、コントラスト型自己教師型学習における文脈バイアスと背景バイアスを低減した。
論文 参考訳(メタデータ) (2021-07-30T19:24:07Z) - Contrastive Attraction and Contrastive Repulsion for Representation
Learning [131.72147978462348]
コントラスト学習(CL)法は,複数の負のサンプルに対して,エンコーダが各正のサンプルと対比する自己超越的な方法でデータ表現を学習する。
最近のCL法は、ImageNetのような大規模データセットで事前訓練された場合、有望な結果を得た。
自己グループ内の正と負のサンプルを別々に比較し、正と負の群を対比して進行する2つのCL戦略を提案する。
論文 参考訳(メタデータ) (2021-05-08T17:25:08Z) - DivCo: Diverse Conditional Image Synthesis via Contrastive Generative
Adversarial Network [70.12848483302915]
cgans (conditional generative adversarial networks) は、入力条件と潜在コードに基づいて様々な画像をターゲットにしている。
最近のMSGANは、生成した画像の多様性を奨励しようとしたが、画像ペア間の"負の関係"しか考慮しなかった。
潜在空間で指定された生成画像間の「正」と「負」の関係を適切に拘束する新しいDivCoフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-14T11:11:15Z) - Conditional Negative Sampling for Contrastive Learning of Visual
Representations [19.136685699971864]
難解な負の選択、あるいは現在の例に類似した選択は、より強い表現をもたらす可能性があることを示す。
それぞれの正の周りの「リング」に、負を条件付きでサンプリングする相互情報推定器のファミリーを導入する。
これらの推定器は, 偏差が大きいが, NCEよりも分散度が低いことが証明された。
論文 参考訳(メタデータ) (2020-10-05T14:17:32Z) - Delving into Inter-Image Invariance for Unsupervised Visual
Representations [108.33534231219464]
画像間不変学習の役割をよりよく理解するための研究を提案する。
オンラインラベルはオフラインラベルよりも早く収束する。
半硬な負のサンプルは、硬い負のサンプルよりも信頼性が高く、偏りがない。
論文 参考訳(メタデータ) (2020-08-26T17:44:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。