論文の概要: CycleGAN with Better Cycles
- arxiv url: http://arxiv.org/abs/2408.15374v1
- Date: Tue, 27 Aug 2024 19:22:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-29 17:52:31.926760
- Title: CycleGAN with Better Cycles
- Title(参考訳): より優れたサイクルを持つCycleGAN
- Authors: Tongzhou Wang, Yihan Lin,
- Abstract要約: CycleGANは、サイクル整合性損失を使用して、未ペアデータセットで画像から画像への変換をトレーニングするフレームワークを提供する。
本稿では, サイクル整合性に対する3つの簡単な修正を提案し, より少ないアーティファクトでより良い結果が得られることを示す。
- 参考スコア(独自算出の注目度): 7.9736958643964515
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: CycleGAN provides a framework to train image-to-image translation with unpaired datasets using cycle consistency loss [4]. While results are great in many applications, the pixel level cycle consistency can potentially be problematic and causes unrealistic images in certain cases. In this project, we propose three simple modifications to cycle consistency, and show that such an approach achieves better results with fewer artifacts.
- Abstract(参考訳): CycleGANは、サイクル整合性損失[4]を使用して、未ペアデータセットで画像から画像への変換をトレーニングするフレームワークを提供する。
多くのアプリケーションでは結果が優れているが、ピクセルレベルのサイクルの一貫性は問題になり、場合によっては非現実的な画像を引き起こす可能性がある。
本稿では, サイクル整合性に対する3つの簡単な修正を提案し, より少ないアーティファクトでより良い結果が得られることを示す。
関連論文リスト
- Improving Composed Image Retrieval via Contrastive Learning with Scaling Positives and Negatives [20.37803751979975]
Composed Image Retrieval (CIR)タスクは、参照画像と修正テキストからなる合成クエリを使用してターゲット画像を取得することを目的としている。
マルチモーダルな大言語モデルを用いてCIR用三重項を生成するデータ生成手法を提案する。
提案手法は, 正と負を効果的にスケールし, FashionIQ と CIRR の両方のデータセットで最先端の結果を得る。
論文 参考訳(メタデータ) (2024-04-17T12:30:54Z) - Group Sparse Coding for Image Denoising [12.684545950979187]
グループスパース表現はGSRにおける画像デブロリングと画像インペインティングにおいて有望な結果を示した[3]
本稿では,GSR[3]モデルに適応するプログレッシブ画像復調アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-22T06:25:53Z) - CycleGAN with three different unpaired datasets [0.0]
研究者たちは、オリジナルの研究で未完成のデータセットを使って画像から画像への翻訳を行う新しい方法を開発した。
pix2pixモデルの結果が良好であるにもかかわらず、マッチしたデータセットは頻繁に利用できない。
ペアデータがない場合、CycleGANは画像から画像に変換することでこの問題を克服できる。
論文 参考訳(メタデータ) (2022-08-12T23:04:36Z) - Progressively-connected Light Field Network for Efficient View Synthesis [69.29043048775802]
本稿では、複雑な前方シーンのビュー合成のためのプログレッシブ・コネクテッド・ライトフィールド・ネットワーク(ProLiF)を提案する。
ProLiFは4Dライトフィールドをエンコードし、画像やパッチレベルの損失に対するトレーニングステップで大量の光線をレンダリングすることができる。
論文 参考訳(メタデータ) (2022-07-10T13:47:20Z) - High-Quality Pluralistic Image Completion via Code Shared VQGAN [51.7805154545948]
高速な推論速度で高品質と多様性を両立させることができる多元画像補完のための新しい枠組みを提案する。
我々のフレームワークは、セマンティックにリッチな離散的なコードを効率的かつ堅牢に学習することができ、画像再構成の品質が大幅に向上する。
論文 参考訳(メタデータ) (2022-04-05T01:47:35Z) - Towards Bidirectional Arbitrary Image Rescaling: Joint Optimization and
Cycle Idempotence [76.93002743194974]
本稿では、任意の再スケーリング(アップスケーリングとダウンスケーリングの両方)を統一プロセスとして扱う方法を提案する。
提案モデルでは、アップスケーリングとダウンスケーリングを同時に学習し、双方向の任意のイメージ再スケーリングを実現する。
繰り返しにダウンスケーリング・アップスケーリング・サイクルが適用された場合, 復元精度が著しく低下することなく, サイクルイデオポテンス試験において堅牢であることが確認された。
論文 参考訳(メタデータ) (2022-03-02T07:42:15Z) - Improving Performance of Semantic Segmentation CycleGANs by Noise
Injection into the Latent Segmentation Space [35.71822843703423]
セマンティックセグメンテーションとサイクル一貫性の概念を組み合わせることで,マルチタスクトレーニングプロトコルを実現する。
本稿では,潜伏分節領域の透かしとして表現する,いわゆるステガノグラフィー効果に対処するノイズ注入法を提案する。
ノイズ注入は透かしの生成を著しく減らし,高い関連クラスを認識できるようにする。
論文 参考訳(メタデータ) (2022-01-17T14:10:27Z) - Breaking Shortcut: Exploring Fully Convolutional Cycle-Consistency for
Video Correspondence Learning [78.43196840793489]
我々は、推論プロセスによりシンプルで一貫性のある完全な畳み込み法を提案する。
この崩壊現象の背景にある下線原因について検討し,画素の絶対位置がサイクルコンシスタンスを容易に達成するための近道であることを示す。
論文 参考訳(メタデータ) (2021-05-12T17:52:45Z) - Very Lightweight Photo Retouching Network with Conditional Sequential
Modulation [42.311196534333284]
極めて軽量なフレームワーク-条件付き逐次リタッチネットワーク(CSRNet)を提案する。
CSRNetは37K未満のトレーニング可能なパラメータしか含まないが、これは既存の学習ベースの手法よりも桁違いに小さい。
実験では、ベンチマークMIT-Adobe FiveKデータセットで最新のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2021-04-13T15:11:02Z) - Aliasing is your Ally: End-to-End Super-Resolution from Raw Image Bursts [70.80220990106467]
本発表では,空間と時間に若干異なる視点から撮影された複数の低解像度スナップショットから高分解能画像を再構成する問題に対処する。
この問題を解決するための主な課題は、(i)入力画像とサブピクセル精度の整合性、(ii)ネイティブカメラデータに対する最大限の忠実性のための生(ノイズ)画像の扱い、(iii)タスクに適した画像事前(正規化器)を設計・学習することである。
論文 参考訳(メタデータ) (2021-04-13T13:39:43Z) - Reconstructing the Noise Manifold for Image Denoising [56.562855317536396]
本稿では,画像ノイズ空間の構造を明示的に活用するcGANを提案する。
画像ノイズの低次元多様体を直接学習することにより、この多様体にまたがる情報のみをノイズ画像から除去する。
我々の実験に基づいて、我々のモデルは既存の最先端アーキテクチャを大幅に上回っている。
論文 参考訳(メタデータ) (2020-02-11T00:31:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。