論文の概要: Contrastive Representation Learning with Trainable Augmentation Channel
- arxiv url: http://arxiv.org/abs/2111.07679v1
- Date: Mon, 15 Nov 2021 11:24:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-17 00:12:39.010045
- Title: Contrastive Representation Learning with Trainable Augmentation Channel
- Title(参考訳): 学習支援チャネルを用いたコントラスト表現学習
- Authors: Masanori Koyama and Kentaro Minami and Takeru Miyato and Yarin Gal
- Abstract要約: 対照的な表現学習では、画像が拡張によって変更された場合でも、画像インスタンスを分類できるように、データ表現を訓練する。
本稿では,エンコーダに格納された情報と拡張によって導入されたデータ破損との間に綱引きが存在するような符号化処理を形式化し,部分解を提案する。
このフレームワークをベースとしたinfoMaxの目的により,データに依存した拡張分布を学習し,表現の崩壊を回避することができることを示す。
- 参考スコア(独自算出の注目度): 48.12240947976029
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In contrastive representation learning, data representation is trained so
that it can classify the image instances even when the images are altered by
augmentations. However, depending on the datasets, some augmentations can
damage the information of the images beyond recognition, and such augmentations
can result in collapsed representations. We present a partial solution to this
problem by formalizing a stochastic encoding process in which there exist a
tug-of-war between the data corruption introduced by the augmentations and the
information preserved by the encoder. We show that, with the infoMax objective
based on this framework, we can learn a data-dependent distribution of
augmentations to avoid the collapse of the representation.
- Abstract(参考訳): 対照的な表現学習では、拡張によって画像が変更された場合でも、画像インスタンスを分類できるようにデータ表現を訓練する。
しかし、データセットによっては、いくつかの拡張は認識を超えた画像の情報を損なう可能性があり、そのような拡張は崩壊した表現をもたらす可能性がある。
本稿では,拡張によって導入されたデータ破損とエンコーダが保持する情報との間に綱引きが存在する確率的符号化過程を形式化し,この問題に対する部分解を提案する。
このフレームワークをベースとしたinfoMaxの目的により,データに依存した拡張分布を学習し,表現の崩壊を回避することができることを示す。
関連論文リスト
- Can Encrypted Images Still Train Neural Networks? Investigating Image Information and Random Vortex Transformation [51.475827684468875]
画像変換時の情報内容の変化を評価するために,画像情報量を測定する新しい枠組みを構築した。
また,Random Vortex Transformationと呼ばれる新しい画像暗号化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-25T09:14:53Z) - Robust Classification by Coupling Data Mollification with Label Smoothing [25.66357344079206]
本稿では,ラベルのスムーズ化を図り,ラベルの信頼度を画像劣化と整合させることにより,画像のノイズ化とぼやけという形でデータモリフィケーションを結合する手法を提案する。
CIFARおよびTinyImageNetデータセットの劣化画像ベンチマークにおいて、ロバスト性および不確実性の向上を実証した。
論文 参考訳(メタデータ) (2024-06-03T16:21:29Z) - Evaluating Data Attribution for Text-to-Image Models [62.844382063780365]
我々は,既存の大規模モデルを与えられた模範オブジェクトやスタイルにチューニングする「カストミゼーション」手法による属性評価を行う。
私たちのキーとなる洞察は、これによって、構築によって模範にコンピュータ的に影響される合成画像を効率的に作成できるということです。
問題の本質的な不確実性を考慮することで、一連のトレーニング画像に対してソフトな属性スコアを割り当てることができる。
論文 参考訳(メタデータ) (2023-06-15T17:59:51Z) - What can we learn about a generated image corrupting its latent
representation? [57.1841740328509]
GANのボトルネックにおける潜在表現に基づいて画像品質を予測できるという仮説を考察する。
遅延表現を雑音で破壊し、複数の出力を生成することでこれを実現できる。
論文 参考訳(メタデータ) (2022-10-12T14:40:32Z) - Prefix Conditioning Unifies Language and Label Supervision [84.11127588805138]
学習した表現の一般化性を低減することにより,データセットのバイアスが事前学習に悪影響を及ぼすことを示す。
実験では、この単純な手法により、ゼロショット画像認識精度が向上し、画像レベルの分布シフトに対するロバスト性が向上することを示した。
論文 参考訳(メタデータ) (2022-06-02T16:12:26Z) - ExCon: Explanation-driven Supervised Contrastive Learning for Image
Classification [12.109442912963969]
本稿では,サリエンシに基づく説明手法を活用して,コンテント保存型マスク強化によるコントラスト学習を提案する。
提案手法は, 近距離画像の埋め込みに類似した内容と説明を与えるという2つの目的を, 批判的に果たすものである。
ExConは、分類、説明品質、対向ロバスト性、および分布シフトの文脈におけるモデルの確率的予測のキャリブレーションの観点から、バニラ指導によるコントラスト学習より優れていることを示す。
論文 参考訳(メタデータ) (2021-11-28T23:15:26Z) - Audio-to-Image Cross-Modal Generation [0.0]
クロスモーダル表現学習は、異なるモーダルからの情報を1つの表現に統合することができる。
オーディオデータから画像アーキタイプを再構成するために、可変オートエンコーダ(VAE)を訓練する。
その結果, 生成した画像が相対的に不整合(多様性)である場合でも, 適切な画像分類に欠かせない特徴が保存されていることが示唆された。
論文 参考訳(メタデータ) (2021-09-27T21:25:31Z) - Composable Augmentation Encoding for Video Representation Learning [94.2358972764708]
自己教師型ビデオ表現学習におけるコントラスト手法に着目した。
対照的な学習における一般的なパラダイムは、同じインスタンスで異なるデータビューをサンプリングし、異なるデータインスタンスを負として、ポジティブペアを構築することである。
そこで我々は,拡張パラメータの列を明示的に提供する,拡張対応型コントラスト学習フレームワークを提案する。
提案手法は,特定の空間的あるいは時間的拡張に関する情報をエンコードすると同時に,多数のビデオベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-04-01T16:48:53Z) - KeepAugment: A Simple Information-Preserving Data Augmentation Approach [42.164438736772134]
本稿では,強調画像の忠実度を高めるために,emphKeepAugmentと呼ばれるシンプルかつ高効率なアプローチを提案する。
このアイデアはまず、元の画像上の重要な領域を検出し、拡張中にこれらの情報的領域を保存するために、サリエンシマップを使用する。
実験により,提案手法は,先行技術データ拡張方式において著しく改善されていることを示す。
論文 参考訳(メタデータ) (2020-11-23T22:43:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。