論文の概要: CycleGAN with Better Cycles
- arxiv url: http://arxiv.org/abs/2408.15374v2
- Date: Thu, 21 Nov 2024 23:51:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-25 15:01:46.796643
- Title: CycleGAN with Better Cycles
- Title(参考訳): より優れたサイクルを持つCycleGAN
- Authors: Tongzhou Wang, Yihan Lin,
- Abstract要約: CycleGANは、サイクル整合性損失を使用して、未ペアデータセットで画像から画像への変換をトレーニングするフレームワークを提供する。
本稿では, サイクル整合性に対する3つの簡単な修正を提案し, より少ないアーティファクトでより良い結果が得られることを示す。
- 参考スコア(独自算出の注目度): 7.9736958643964515
- License:
- Abstract: CycleGAN provides a framework to train image-to-image translation with unpaired datasets using cycle consistency loss [4]. While results are great in many applications, the pixel level cycle consistency can potentially be problematic and causes unrealistic images in certain cases. In this project, we propose three simple modifications to cycle consistency, and show that such an approach achieves better results with fewer artifacts.
- Abstract(参考訳): CycleGANは、サイクル整合性損失[4]を使用して、未ペアデータセットで画像から画像への変換をトレーニングするフレームワークを提供する。
多くのアプリケーションでは結果が優れているが、ピクセルレベルのサイクルの一貫性は問題になり、場合によっては非現実的な画像を引き起こす可能性がある。
本稿では, サイクル整合性に対する3つの簡単な修正を提案し, より少ないアーティファクトでより良い結果が得られることを示す。
関連論文リスト
- Improving Composed Image Retrieval via Contrastive Learning with Scaling Positives and Negatives [20.37803751979975]
Composed Image Retrieval (CIR)タスクは、参照画像と修正テキストからなる合成クエリを使用してターゲット画像を取得することを目的としている。
マルチモーダルな大言語モデルを用いてCIR用三重項を生成するデータ生成手法を提案する。
提案手法は, 正と負を効果的にスケールし, FashionIQ と CIRR の両方のデータセットで最先端の結果を得る。
論文 参考訳(メタデータ) (2024-04-17T12:30:54Z) - Robust 3D Shape Reconstruction in Zero-Shot from a Single Image in the Wild [22.82439286651921]
本研究では,3次元形状復元に特化して設計された分割と再構成を統合した統合回帰モデルを提案する。
また、オブジェクト、オクローダ、バックグラウンドの幅広いバリエーションをシミュレートするスケーラブルなデータ合成パイプラインも導入しています。
我々の合成データのトレーニングにより,提案モデルは実世界の画像に対して最先端のゼロショット結果が得られる。
論文 参考訳(メタデータ) (2024-03-21T16:40:10Z) - Exposure Bracketing Is All You Need For A High-Quality Image [50.822601495422916]
マルチ露光画像は、デノイング、デブロアリング、高ダイナミックレンジイメージング、超解像において相補的である。
本研究では,これらの課題を組み合わせ,高品質な画像を得るために露光ブラケット写真を活用することを提案する。
特に時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文 参考訳(メタデータ) (2024-01-01T14:14:35Z) - Group Sparse Coding for Image Denoising [12.684545950979187]
グループスパース表現はGSRにおける画像デブロリングと画像インペインティングにおいて有望な結果を示した[3]
本稿では,GSR[3]モデルに適応するプログレッシブ画像復調アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-22T06:25:53Z) - CycleGAN with three different unpaired datasets [0.0]
研究者たちは、オリジナルの研究で未完成のデータセットを使って画像から画像への翻訳を行う新しい方法を開発した。
pix2pixモデルの結果が良好であるにもかかわらず、マッチしたデータセットは頻繁に利用できない。
ペアデータがない場合、CycleGANは画像から画像に変換することでこの問題を克服できる。
論文 参考訳(メタデータ) (2022-08-12T23:04:36Z) - Progressively-connected Light Field Network for Efficient View Synthesis [69.29043048775802]
本稿では、複雑な前方シーンのビュー合成のためのプログレッシブ・コネクテッド・ライトフィールド・ネットワーク(ProLiF)を提案する。
ProLiFは4Dライトフィールドをエンコードし、画像やパッチレベルの損失に対するトレーニングステップで大量の光線をレンダリングすることができる。
論文 参考訳(メタデータ) (2022-07-10T13:47:20Z) - High-Quality Pluralistic Image Completion via Code Shared VQGAN [51.7805154545948]
高速な推論速度で高品質と多様性を両立させることができる多元画像補完のための新しい枠組みを提案する。
我々のフレームワークは、セマンティックにリッチな離散的なコードを効率的かつ堅牢に学習することができ、画像再構成の品質が大幅に向上する。
論文 参考訳(メタデータ) (2022-04-05T01:47:35Z) - Towards Bidirectional Arbitrary Image Rescaling: Joint Optimization and
Cycle Idempotence [76.93002743194974]
本稿では、任意の再スケーリング(アップスケーリングとダウンスケーリングの両方)を統一プロセスとして扱う方法を提案する。
提案モデルでは、アップスケーリングとダウンスケーリングを同時に学習し、双方向の任意のイメージ再スケーリングを実現する。
繰り返しにダウンスケーリング・アップスケーリング・サイクルが適用された場合, 復元精度が著しく低下することなく, サイクルイデオポテンス試験において堅牢であることが確認された。
論文 参考訳(メタデータ) (2022-03-02T07:42:15Z) - Improving Performance of Semantic Segmentation CycleGANs by Noise
Injection into the Latent Segmentation Space [35.71822843703423]
セマンティックセグメンテーションとサイクル一貫性の概念を組み合わせることで,マルチタスクトレーニングプロトコルを実現する。
本稿では,潜伏分節領域の透かしとして表現する,いわゆるステガノグラフィー効果に対処するノイズ注入法を提案する。
ノイズ注入は透かしの生成を著しく減らし,高い関連クラスを認識できるようにする。
論文 参考訳(メタデータ) (2022-01-17T14:10:27Z) - Aliasing is your Ally: End-to-End Super-Resolution from Raw Image Bursts [70.80220990106467]
本発表では,空間と時間に若干異なる視点から撮影された複数の低解像度スナップショットから高分解能画像を再構成する問題に対処する。
この問題を解決するための主な課題は、(i)入力画像とサブピクセル精度の整合性、(ii)ネイティブカメラデータに対する最大限の忠実性のための生(ノイズ)画像の扱い、(iii)タスクに適した画像事前(正規化器)を設計・学習することである。
論文 参考訳(メタデータ) (2021-04-13T13:39:43Z) - Reconstructing the Noise Manifold for Image Denoising [56.562855317536396]
本稿では,画像ノイズ空間の構造を明示的に活用するcGANを提案する。
画像ノイズの低次元多様体を直接学習することにより、この多様体にまたがる情報のみをノイズ画像から除去する。
我々の実験に基づいて、我々のモデルは既存の最先端アーキテクチャを大幅に上回っている。
論文 参考訳(メタデータ) (2020-02-11T00:31:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。