論文の概要: GAN-based Algorithm for Efficient Image Inpainting
- arxiv url: http://arxiv.org/abs/2309.07293v1
- Date: Wed, 13 Sep 2023 20:28:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-15 17:01:37.121358
- Title: GAN-based Algorithm for Efficient Image Inpainting
- Title(参考訳): GANを用いた高能率画像処理アルゴリズム
- Authors: Zhengyang Han, Zehao Jiang, Yuan Ju
- Abstract要約: 世界的なパンデミックは、人々がマスクを着用し始める顔認識の新しい次元に課題を提起している。
このような条件下では,画像の塗り絵に機械学習を応用して問題に対処することを検討する。
特に、オートエンコーダは、画像の重要で一般的な特徴を維持する大きな可能性を秘めている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Global pandemic due to the spread of COVID-19 has post challenges in a new
dimension on facial recognition, where people start to wear masks. Under such
condition, the authors consider utilizing machine learning in image inpainting
to tackle the problem, by complete the possible face that is originally covered
in mask. In particular, autoencoder has great potential on retaining important,
general features of the image as well as the generative power of the generative
adversarial network (GAN). The authors implement a combination of the two
models, context encoders and explain how it combines the power of the two
models and train the model with 50,000 images of influencers faces and yields a
solid result that still contains space for improvements. Furthermore, the
authors discuss some shortcomings with the model, their possible improvements,
as well as some area of study for future investigation for applicative
perspective, as well as directions to further enhance and refine the model.
- Abstract(参考訳): 新型コロナウイルス(COVID-19)の感染拡大による世界的なパンデミックは、人々がマスクを着用し始める顔認識に新たな課題を提起している。
このような条件下で、著者らは、当初マスクで覆われていた可能性のある顔を完成させることにより、画像の塗装に機械学習を活用することを検討する。
特にオートエンコーダは、画像の重要で一般的な特徴と生成的敵ネットワーク(gan)の生成能力を保持する上で大きな可能性を秘めている。
著者らは2つのモデルの組み合わせ、文脈エンコーダを実装し、2つのモデルのパワーを組み合わせて、インフルエンサーの顔の5万の画像でモデルを訓練し、改善のためのスペースを含むしっかりとした結果を得る方法について説明している。
さらに,本モデルにおける問題点,改善の可能性,今後の応用的視点の研究分野,さらにモデルをさらに強化・洗練する方向について論じた。
関連論文リスト
- BrushNet: A Plug-and-Play Image Inpainting Model with Decomposed
Dual-Branch Diffusion [61.90969199199739]
BrushNetは、ピクセルレベルのマスク付きイメージ機能を事前訓練されたDMに埋め込むために設計された、新しいプラグアンドプレイデュアルブランチモデルである。
BrushNetは、画像品質、マスク領域保存、テキストコヒーレンスを含む7つの主要な指標で、既存のモデルよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-03-11T17:59:31Z) - Separate-and-Enhance: Compositional Finetuning for Text2Image Diffusion
Models [58.46926334842161]
この研究は、注意力の低いアクティベーションスコアとマスクオーバーラップに関連する問題を指摘し、このような不一致の根本的な理由を照らしている。
本稿では,物体マスクの重なりを低減し,注目度を最大化する2つの新しい目的,分離損失とエンハンス損失を提案する。
提案手法は従来のテスト時間適応手法と異なり,拡張性と一般化性を高める重要なパラメータの微調整に重点を置いている。
論文 参考訳(メタデータ) (2023-12-10T22:07:42Z) - Conditioning Diffusion Models via Attributes and Semantic Masks for Face
Generation [1.104121146441257]
深層生成モデルは、現実的な顔の画像を生成する素晴らしい結果を示している。
GANはセマンティックマスクで条件付きで高品質で高忠実な画像を生成することができたが、それでも出力を多様化する能力は欠けていた。
本稿では,属性とセマンティックマスクの両方を利用した多条件拡散モデルの提案を行い,高品質で制御可能な顔画像を生成する。
論文 参考訳(メタデータ) (2023-06-01T17:16:37Z) - SARGAN: Spatial Attention-based Residuals for Facial Expression
Manipulation [1.7056768055368383]
本稿では,3つの視点から制限に対処するSARGANという新しい手法を提案する。
我々は対称エンコーダ・デコーダネットワークを利用して顔の特徴に複数スケールで対応した。
提案手法は最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-03-30T08:15:18Z) - Learning Prior Feature and Attention Enhanced Image Inpainting [63.21231753407192]
本稿では,事前学習に基づくMasked AutoEncoder(MAE)を塗装モデルに組み込む。
マスク付き領域とマスキングされていない領域間の長距離依存性をより学習させるために,MAE の注意点を用いた手法を提案する。
論文 参考訳(メタデータ) (2022-08-03T04:32:53Z) - Towards Robust Blind Face Restoration with Codebook Lookup Transformer [94.48731935629066]
ブラインドフェイスの修復は、しばしば補助的なガイダンスを必要とする非常に不適切な問題である。
学習した個別のコードブックを小さなプロキシ空間に配置し,ブラインドフェイスの復元をコード予測タスクとすることを示す。
我々は、低品質顔のグローバルな構成とコンテキストをモデル化するトランスフォーマーベースの予測ネットワーク、CodeFormerを提案する。
論文 参考訳(メタデータ) (2022-06-22T17:58:01Z) - GMFIM: A Generative Mask-guided Facial Image Manipulation Model for
Privacy Preservation [0.7734726150561088]
入力顔画像に知覚不可能な編集を適用するために,GANをベースとしたマスク誘導顔画像マニピュレーションモデルを提案する。
我々のモデルは、最先端の手法と比較して、自動顔認識システムに対してより良い性能を実現することができる。
論文 参考訳(メタデータ) (2022-01-10T14:09:14Z) - Aggregated Contextual Transformations for High-Resolution Image
Inpainting [57.241749273816374]
画像の高精細化のための拡張GANモデルAggregated Contextual-Transformation GAN (AOT-GAN)を提案する。
そこで,提案するAOTブロックの複数のレイヤを積み重ねることで,AOT-GANのジェネレータを構築する。
テクスチャ合成を改善するため,AOT-GANの識別をマスク予測タスクでトレーニングすることで強化する。
論文 参考訳(メタデータ) (2021-04-03T15:50:17Z) - JDSR-GAN: Constructing A Joint and Collaborative Learning Network for
Masked Face Super-Resolution [28.022800882214803]
ほとんどのビデオ監視シナリオで得られた顔画像は、マスクと同時に低解像度です。
これまでのスーパーレゾリューションソリューションのほとんどは、1つのモデルで両方のタスクを処理できない。
我々は,マスク付き顔超解像課題のための共同学習ネットワークJDSR-GANを構築した。
論文 参考訳(メタデータ) (2021-03-25T08:50:40Z) - Towards Unsupervised Deep Image Enhancement with Generative Adversarial
Network [92.01145655155374]
監視されていない画像強調生成ネットワーク(UEGAN)を提案する。
教師なしの方法で所望の特性を持つ画像の集合から、対応する画像と画像のマッピングを学習する。
その結果,提案モデルは画像の美的品質を効果的に向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T03:22:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。