論文の概要: Image-to-Image Translation: Methods and Applications
- arxiv url: http://arxiv.org/abs/2101.08629v1
- Date: Thu, 21 Jan 2021 14:20:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-21 07:54:29.819978
- Title: Image-to-Image Translation: Methods and Applications
- Title(参考訳): 画像間翻訳:方法と応用
- Authors: Yingxue Pang, Jianxin Lin, Tao Qin, and Zhibo Chen
- Abstract要約: image-to-image translation (i2i) は、コンテンツ表現を保持しながら、ソースドメインからターゲットドメインにイメージを転送することを目的としている。
I2Iは近年注目され、大きな進歩を遂げている。
- 参考スコア(独自算出の注目度): 58.897541139310874
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image-to-image translation (I2I) aims to transfer images from a source domain
to a target domain while preserving the content representations. I2I has drawn
increasing attention and made tremendous progress in recent years because of
its wide range of applications in many computer vision and image processing
problems, such as image synthesis, segmentation, style transfer, restoration,
and pose estimation. In this paper, we provide an overview of the I2I works
developed in recent years. We will analyze the key techniques of the existing
I2I works and clarify the main progress the community has made. Additionally,
we will elaborate on the effect of I2I on the research and industry community
and point out remaining challenges in related fields.
- Abstract(参考訳): image-to-image translation (i2i) は、コンテンツ表現を保持しながら、ソースドメインからターゲットドメインにイメージを転送することを目的としている。
I2Iは画像合成、セグメンテーション、スタイル転送、復元、ポーズ推定といった多くのコンピュータビジョンや画像処理問題に幅広く応用されているため、近年は注目され、大きな進歩を遂げている。
本稿では,近年開発されたI2Iについて概説する。
我々は,既存のi2i作業の重要な技術を分析し,コミュニティが行った主な進歩を明らかにする。
また、I2Iが研究・産業コミュニティに与える影響について詳しく述べ、関連分野の課題を指摘したい。
関連論文リスト
- An Analysis for Image-to-Image Translation and Style Transfer [7.074445137050722]
本稿では,画像間翻訳とスタイル変換の相違点と関連点を紹介する。
議論プロセス全体は、概念、フォーム、トレーニングモード、評価プロセス、視覚化結果を含む。
論文 参考訳(メタデータ) (2024-08-12T08:49:00Z) - Negative Results of Image Processing for Identifying Duplicate Questions on Stack Overflow [2.2667044928324747]
Stack Overflow上の重複した質問を識別するための画像ベース手法について検討した。
まず,画像からのテキストを疑問テキストに統合し,第2に画像キャプションを用いて視覚的内容に基づいて画像を評価する。
私たちの研究は、簡単な複製と仮説検証の基盤を築き、将来の研究を私たちのアプローチの上に構築します。
論文 参考訳(メタデータ) (2024-07-08T00:14:21Z) - A Survey of Multimodal-Guided Image Editing with Text-to-Image Diffusion Models [117.77807994397784]
画像編集は、ユーザーが特定の要求を満たすために、与えられた合成画像または実際の画像を編集することを目的としている。
この分野での最近の顕著な進歩は、テキスト・ツー・イメージ(T2I)拡散モデルの開発に基づいている。
T2Iベースの画像編集手法は、編集性能を大幅に向上させ、マルチモーダル入力でガイドされたコンテンツを修正するためのユーザフレンドリーなインタフェースを提供する。
論文 参考訳(メタデータ) (2024-06-20T17:58:52Z) - S2ST: Image-to-Image Translation in the Seed Space of Latent Diffusion [23.142097481682306]
複雑な画像におけるグローバルI2ITを実現するための新しいフレームワークであるS2STを紹介する。
S2STは遅延拡散モデルのシード空間内で動作し、後者が学習した強力な画像の先行処理を利用する。
S2STは、複雑な自動車シーンに対して、最先端のGANベースのI2IT手法、および拡散ベースのアプローチを超越していることを示す。
論文 参考訳(メタデータ) (2023-11-30T18:59:49Z) - Semantic Image Segmentation: Two Decades of Research [22.533249554532322]
本書はセマンティックイメージセグメンテーション(SiS)分野における20年間の研究成果をまとめたものである。
本稿では,近年のトランスフォーマーの利用動向を含む,最近のディープラーニング手法の概要を紹介する。
我々は、マルチドメイン学習、ドメイン一般化、ドメインインクリメンタル学習、テスト時間適応、ソースフリードメイン適応といった新しいトレンドを明らかにした。
論文 参考訳(メタデータ) (2023-02-13T14:11:05Z) - Automatic Image Content Extraction: Operationalizing Machine Learning in
Humanistic Photographic Studies of Large Visual Archives [81.88384269259706]
本稿では,機械学習による大規模画像アーカイブの検索と解析のための自動画像コンテンツ抽出フレームワークを提案する。
提案する枠組みは、人文科学と社会科学のいくつかの分野に適用できる。
論文 参考訳(メタデータ) (2022-04-05T12:19:24Z) - Multi-domain Unsupervised Image-to-Image Translation with Appearance
Adaptive Convolution [62.4972011636884]
本稿では,MDUIT(Multi-domain unsupervised image-to-image translation)フレームワークを提案する。
我々は、分解されたコンテンツ特徴と外観適応的畳み込みを利用して、画像をターゲットの外観に変換する。
提案手法は,最先端の手法と比較して,複数の領域で視覚的に多様かつ妥当な結果が得られることを示す。
論文 参考訳(メタデータ) (2022-02-06T14:12:34Z) - Leveraging in-domain supervision for unsupervised image-to-image
translation tasks via multi-stream generators [4.726777092009554]
本稿では、翻訳品質の利点を活かすために、このドメイン内の貴重な事前知識を組み込むための2つの手法を紹介する。
本稿では,入力データをセマンティックマスクに従って分割し,画像の異なる領域の異なる動作にネットワークを明示的に導くことを提案する。
さらに,翻訳作業とともにセマンティックセグメンテーションネットワークを訓練し,この出力をロバスト性を向上させる損失項として活用することを提案する。
論文 参考訳(メタデータ) (2021-12-30T15:29:36Z) - Unsupervised Image-to-Image Translation via Pre-trained StyleGAN2
Network [73.5062435623908]
本稿では,一連のモデル変換によって対象領域に新たなモデルを生成する新しいI2I翻訳手法を提案する。
潜在ベクトルを生成されたモデルに入力することで、ソースドメインとターゲットドメインの間でI2I翻訳を行うことができる。
論文 参考訳(メタデータ) (2020-10-12T13:51:40Z) - TuiGAN: Learning Versatile Image-to-Image Translation with Two Unpaired
Images [102.4003329297039]
教師なし画像画像変換(UI2I)タスクは、ペア画像のない2つのドメイン間のマッピングを学習する。
本研究では,2つの未ペア画像のみをトレーニングし,ワンショットで教師なし学習を行う生成モデルTuiGANを提案する。
論文 参考訳(メタデータ) (2020-04-09T16:23:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。