Fugu-MT 論文翻訳(概要): Learning to See by Looking at Noise

論文の概要: Learning to See by Looking at Noise

arxiv url: http://arxiv.org/abs/2106.05963v1
Date: Thu, 10 Jun 2021 17:56:46 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-11 14:38:41.035351
Title: Learning to See by Looking at Noise
Title（参考訳）: 騒音を見て見ることを学ぶ
Authors: Manel Baradad, Jonas Wulff, Tongzhou Wang, Phillip Isola, Antonio Torralba
Abstract要約: 簡単なランダムなプロセスから画像を生成する一連の画像生成モデルについて検討する。これらは、対照的な損失を伴う視覚表現学習者のトレーニングデータとして使用される。以上の結果から,実データの構造的特性を捉えることはノイズにとって重要であるが,現実的ではないプロセスでも良好な性能が達成できることが示唆された。
参考スコア（独自算出の注目度）: 87.12788334473295
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Current vision systems are trained on huge datasets, and these datasets come with costs: curation is expensive, they inherit human biases, and there are concerns over privacy and usage rights. To counter these costs, interest has surged in learning from cheaper data sources, such as unlabeled images. In this paper we go a step further and ask if we can do away with real image datasets entirely, instead learning from noise processes. We investigate a suite of image generation models that produce images from simple random processes. These are then used as training data for a visual representation learner with a contrastive loss. We study two types of noise processes, statistical image models and deep generative models under different random initializations. Our findings show that it is important for the noise to capture certain structural properties of real data but that good performance can be achieved even with processes that are far from realistic. We also find that diversity is a key property to learn good representations. Datasets, models, and code are available at https://mbaradad.github.io/learning_with_noise.
Abstract（参考訳）: 現在のビジョンシステムは巨大なデータセットに基づいてトレーニングされており、これらのデータセットにはコストが伴います。これらのコストに対応するため、ラベルなし画像などの安価なデータソースから学ぶことへの関心が高まっている。本稿では、さらに一歩進めて、ノイズプロセスから学習する代わりに、実際の画像データセットを完全に廃止できるかどうかを問う。単純なランダムプロセスから画像を生成する一連の画像生成モデルについて検討する。これらは、コントラスト損失のある視覚表現学習者のトレーニングデータとして使用される。本研究では,ランダム初期化の異なる2種類の雑音過程,統計的画像モデル,深部生成モデルについて検討した。その結果,ノイズが実データの特定の構造的特性を捉えることは重要であるが,現実的とは程遠いプロセスでも良好な性能が得られることがわかった。また、多様性は優れた表現を学ぶための鍵となる性質であることもわかりました。データセット、モデル、コードはhttps://mbaradad.github.io/learning_with_noiseで入手できる。

関連論文リスト

Community Forensics: Using Thousands of Generators to Train Fake Image Detectors [15.166026536032142]
AI生成画像を検出する上で重要な課題の1つは、これまで目に見えない生成モデルによって作成された画像を見つけることである。従来よりも大きく,多様である新しいデータセットを提案する。得られたデータセットには、4803の異なるモデルからサンプリングされた2.7Mイメージが含まれている。
論文参考訳（メタデータ） (2024-11-06T18:59:41Z)
Robust Neural Processes for Noisy Data [1.7268667700090563]
ノイズによってデータが汚染された場合の文脈内学習モデルの振る舞いについて検討する。クリーンなデータで最高のパフォーマンスを示すモデルは、ノイズの多いデータで最高のパフォーマンスを示すモデルとは異なることが分かりました。本稿では,NPモデルの学習方法を提案する。
論文参考訳（メタデータ） (2024-11-03T20:00:55Z)
Deep Image Composition Meets Image Forgery [0.0]
画像偽造は長年研究されてきた。ディープラーニングモデルは、トレーニングのために大量のラベル付きデータを必要とする。本研究では,画像合成深層学習モデルを用いて,実生活における操作の質に近いスプライシング画像を生成する。
論文参考訳（メタデータ） (2024-04-03T17:54:37Z)
NoiseTransfer: Image Noise Generation with Contrastive Embeddings [9.322843611215486]
本稿では,複数のノイズ分布を持つ雑音像を合成できる新しい生成モデルを提案する。我々は、雑音の識別可能な潜在特徴を学習するために、最近のコントラスト学習を採用する。本モデルでは,単一の基準雑音画像からのみノイズ特性を伝達することにより,新しい雑音画像を生成することができる。
論文参考訳（メタデータ） (2023-01-31T11:09:15Z)
ConfounderGAN: Protecting Image Data Privacy with Causal Confounder [85.6757153033139]
本稿では,GAN(Generative Adversarial Network)のConfounderGANを提案する。実験は、3つの自然なオブジェクトデータセットと3つの医療データセットからなる6つの画像分類データセットで実施される。
論文参考訳（メタデータ） (2022-12-04T08:49:14Z)
Noise Self-Regression: A New Learning Paradigm to Enhance Low-Light Images Without Task-Related Data [86.68013790656762]
タスク関連のデータにアクセスせずにノイズ自己回帰(NoiSER)を提案する。 NoiSERは品質向上に非常に競争力があるが、モデルのサイズははるかに小さく、トレーニングや推論のコストもはるかに低い。
論文参考訳（メタデータ） (2022-11-09T06:18:18Z)
IDR: Self-Supervised Image Denoising via Iterative Data Refinement [66.5510583957863]
本稿では,最先端のデノナイジング性能を実現するために,教師なしの実用的なデノナイジング手法を提案する。本手法では, 1つのノイズ画像と1つのノイズモデルしか必要とせず, 実際の生画像に容易にアクセス可能である。実世界のアプリケーションにおける生画像復調性能を評価するため,500シーンのシーンを含む高品質な生画像データセットSenseNoise-500を構築した。
論文参考訳（メタデータ） (2021-11-29T07:22:53Z)
Curious Representation Learning for Embodied Intelligence [81.21764276106924]
近年,自己指導型表現学習は顕著な成功を収めている。しかし、真にインテリジェントなエージェントを構築するためには、環境から学習できる表現学習アルゴリズムを構築する必要がある。本稿では,強化学習方針と視覚的表現モデルを同時に学習する,好奇心をそそる表現学習フレームワークを提案する。
論文参考訳（メタデータ） (2021-05-03T17:59:20Z)
From ImageNet to Image Classification: Contextualizing Progress on Benchmarks [99.19183528305598]
ImageNet作成プロセスにおける特定の設計選択が、結果のデータセットの忠実性に与える影響について検討する。私たちの分析では、ノイズの多いデータ収集パイプラインが、結果のベンチマークと、それがプロキシとして機能する実世界のタスクとの間に、体系的なミスアライメントをもたらす可能性があることを指摘しています。
論文参考訳（メタデータ） (2020-05-22T17:39:16Z)
CycleISP: Real Image Restoration via Improved Data Synthesis [166.17296369600774]
本稿では,前向きと逆方向のカメラ画像パイプラインをモデル化するフレームワークを提案する。リアルな合成データに基づいて新しい画像認識ネットワークをトレーニングすることにより、実際のカメラベンチマークデータセット上で最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2020-03-17T15:20:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。