論文の概要: The Surprising Effectiveness of Linear Unsupervised Image-to-Image
Translation
- arxiv url: http://arxiv.org/abs/2007.12568v1
- Date: Fri, 24 Jul 2020 15:21:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 06:58:54.662496
- Title: The Surprising Effectiveness of Linear Unsupervised Image-to-Image
Translation
- Title(参考訳): 線形教師なし画像-画像間翻訳のサプライズ効果
- Authors: Eitan Richardson and Yair Weiss
- Abstract要約: 教師なし画像変換のための線形エンコーダデコーダアーキテクチャを提案する。
これらのアーキテクチャでは学習がずっと簡単かつ高速であることが示されますが、結果は驚くほど効果的です。
- 参考スコア(独自算出の注目度): 9.51828574518325
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Unsupervised image-to-image translation is an inherently ill-posed problem.
Recent methods based on deep encoder-decoder architectures have shown
impressive results, but we show that they only succeed due to a strong locality
bias, and they fail to learn very simple nonlocal transformations (e.g. mapping
upside down faces to upright faces). When the locality bias is removed, the
methods are too powerful and may fail to learn simple local transformations. In
this paper we introduce linear encoder-decoder architectures for unsupervised
image to image translation. We show that learning is much easier and faster
with these architectures and yet the results are surprisingly effective. In
particular, we show a number of local problems for which the results of the
linear methods are comparable to those of state-of-the-art architectures but
with a fraction of the training time, and a number of nonlocal problems for
which the state-of-the-art fails while linear methods succeed.
- Abstract(参考訳): 教師なし画像間翻訳は本質的に不適切な問題である。
ディープエンコーダ-デコーダアーキテクチャに基づく最近の手法は印象的な結果を示しているが、強い局所バイアスのためだけに成功し、非常に単純な非局所変換(例えば、逆さまの顔から直立顔へのマッピング)を学ばないことが示されている。
局所バイアスが取り除かれた場合、メソッドは強力であり、単純な局所変換を学習できない可能性がある。
本稿では,教師なし画像変換のための線形エンコーダデコーダアーキテクチャを提案する。
これらのアーキテクチャでは、学習はずっと簡単で速くなりますが、その結果は驚くほど効果的です。
特に,リニアメソッドの結果が最先端アーキテクチャに匹敵するが,トレーニング時間のごく一部であるような局所的な問題や,リニアメソッドが成功している間に最先端が失敗するような非局所的な問題をいくつか提示する。
関連論文リスト
- Learning to Manipulate Artistic Images [27.803374400458402]
任意のスタイル画像操作ネットワーク(SIM-Net)を提案する。
計算効率と高分解能をある程度のバランスをとる。
定性的かつ定量的な実験は、我々の手法が最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-01-25T06:34:49Z) - Learning from small data sets: Patch-based regularizers in inverse
problems for image reconstruction [1.1650821883155187]
機械学習の最近の進歩は、ネットワークを訓練するために大量のデータとコンピュータ能力を必要とする。
本稿は,ごく少数の画像のパッチを考慮に入れることで,小さなデータセットから学習する問題に対処する。
本稿では,Langevin Monte Carlo法を用いて後部を近似することにより,不確実な定量化を実現する方法を示す。
論文 参考訳(メタデータ) (2023-12-27T15:30:05Z) - Detecting Generated Images by Real Images Only [64.12501227493765]
既存の画像検出手法は、生成画像中の視覚的アーティファクトを検出したり、大規模なトレーニングによって、実画像と生成画像の両方から識別的特徴を学習する。
本稿では,新たな視点から生成した画像検出問題にアプローチする。
実画像の共通性を見つけ、特徴空間内の密接な部分空間にマッピングすることで、生成した画像は生成モデルに関係なくサブ空間の外側に投影される。
論文 参考訳(メタデータ) (2023-11-02T03:09:37Z) - Reinforcement Learning for on-line Sequence Transformation [0.0]
トークンを読むか、別のトークンを書くべきかを判断するために、強化によって学習するアーキテクチャを導入します。
実験では、ニューラルネットワーク翻訳の最先端手法と比較した。
論文 参考訳(メタデータ) (2021-05-28T20:31:25Z) - Dual Contrastive Learning for Unsupervised Image-to-Image Translation [16.759958400617947]
unsupervised image-to-image translationタスクは、非ペアトレーニングデータからソースドメインxとターゲットドメインyとのマッピングを見つけることを目的としている。
画像対画像翻訳におけるコントラスト学習は最先端の成果をもたらす。
本論文では, 対比学習に基づく新しい手法と, 対比データ間の効率的なマッピングを推定するデュアルラーニング設定を提案する。
論文 参考訳(メタデータ) (2021-04-15T18:00:22Z) - Free-Form Image Inpainting via Contrastive Attention Network [64.05544199212831]
画像の塗装作業では、複雑なパターンを形成する画像のどこにでも、どんな形でもマスクが現れる。
エンコーダはこの複雑な状況下でこのような強力な表現を捕捉することは困難である。
本稿では,ロバスト性と一般化性を改善するための自己教師型シームズ推論ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-29T14:46:05Z) - LoCo: Local Contrastive Representation Learning [93.98029899866866]
重なり合うローカルブロックが重なり合うことで、デコーダの深さを効果的に増加させ、上位ブロックが暗黙的に下位ブロックにフィードバックを送ることができることを示す。
このシンプルな設計は、ローカル学習とエンドツーエンドのコントラスト学習アルゴリズムのパフォーマンスギャップを初めて埋める。
論文 参考訳(メタデータ) (2020-08-04T05:41:29Z) - Geometrically Mappable Image Features [85.81073893916414]
地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。
本稿では,画像検索を対象とした画像特徴学習手法を提案する。
論文 参考訳(メタデータ) (2020-03-21T15:36:38Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。