論文の概要: Controlling Memorability of Face Images
- arxiv url: http://arxiv.org/abs/2202.11896v1
- Date: Thu, 24 Feb 2022 04:33:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-25 16:17:28.655558
- Title: Controlling Memorability of Face Images
- Title(参考訳): 顔画像の記憶性制御
- Authors: Mohammad Younesi, Yalda Mohsenzadeh
- Abstract要約: 本稿では,顔画像の記憶性を変化させ,制御するための高速なアプローチを提案する。
われわれはまず、StyleGANの潜在空間に超平面を発見し、高解像度と低解像度の記憶可能な画像を分離した。
今回我々は,StyleGAN拡張潜伏空間の異なる層が顔の記憶にどう寄与するかを解析した。
- 参考スコア(独自算出の注目度): 5.000272778136267
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Everyday, we are bombarded with many photographs of faces, whether on social
media, television, or smartphones. From an evolutionary perspective, faces are
intended to be remembered, mainly due to survival and personal relevance.
However, all these faces do not have the equal opportunity to stick in our
minds. It has been shown that memorability is an intrinsic feature of an image
but yet, it is largely unknown what attributes make an image more memorable. In
this work, we aimed to address this question by proposing a fast approach to
modify and control the memorability of face images. In our proposed method, we
first found a hyperplane in the latent space of StyleGAN to separate high and
low memorable images. We then modified the image memorability (while
maintaining the identity and other facial features such as age, emotion, etc.)
by moving in the positive or negative direction of this hyperplane normal
vector. We further analyzed how different layers of the StyleGAN augmented
latent space contribute to face memorability. These analyses showed how each
individual face attribute makes an image more or less memorable. Most
importantly, we evaluated our proposed method for both real and synthesized
face images. The proposed method successfully modifies and controls the
memorability of real human faces as well as unreal synthesized faces. Our
proposed method can be employed in photograph editing applications for social
media, learning aids, or advertisement purposes.
- Abstract(参考訳): 毎日、ソーシャルメディアでもテレビでもスマートフォンでも、顔の写真がたくさん撮られています。
進化的観点では、顔は、主に生存と個人の関連性のために記憶されることを意図している。
しかし、これらすべての顔は、私たちの心に同じ機会を持っていません。
記憶性は画像の本質的な特徴であることが示されたが、どの属性が画像をより記憶しやすくしているかは明らかになっていない。
本研究では,顔画像の記憶可能性の修正と制御を高速に行う手法を提案することで,この問題に対処することを目的とした。
提案手法では,StyleGANの潜伏空間に高精細画像と低精細画像の分離を行う超平面を初めて発見した。
次に、この超平面ノルマルベクトルの正あるいは負の方向に移動することにより、画像記憶性(アイデンティティや年齢、感情などの顔の特徴を維持しながら)を変化させた。
さらに,StyleGAN拡張潜伏空間の異なる層が顔の記憶にどう寄与するかを解析した。
これらの分析は、個々の顔属性が画像をどのように記憶可能かを示した。
また,提案手法を実画像と合成画像の両方に対して評価した。
提案手法は,人間の顔の記憶力や非現実的な合成顔の記憶力の修正と制御に成功している。
提案手法は,ソーシャルメディア,学習支援,広告目的での写真編集アプリケーションに適用することができる。
関連論文リスト
- GaussianHeads: End-to-End Learning of Drivable Gaussian Head Avatars from Coarse-to-fine Representations [54.94362657501809]
マルチビュー画像から高ダイナミックで変形可能な人間の頭部アバターをリアルタイムで生成する手法を提案する。
本手法のコアとなるのは,顔表情と頭部運動の複雑なダイナミクスを捉えることができる頭部モデルの階層的表現である。
我々は、この粗い顔アバターモデルを、エンドツーエンドのフレームワークで学習可能なパラメータとして頭部ポーズとともに訓練する。
論文 参考訳(メタデータ) (2024-09-18T13:05:43Z) - Generalizable Face Landmarking Guided by Conditional Face Warping [34.49985314656207]
我々は、ラベル付き実顔とラベルなしのスタイリング顔に基づいて、一般化可能な顔ランドマークを学習する。
本手法は,顔のランドマーク化作業において,既存の最先端領域適応手法よりも優れる。
論文 参考訳(メタデータ) (2024-04-18T16:53:08Z) - FlashFace: Human Image Personalization with High-fidelity Identity Preservation [59.76645602354481]
FlashFaceを使うと、ユーザーは自分の写真を簡単にパーソナライズできる。
我々のアプローチは、高忠実度ID保存とより良い指示に従うことによって、既存の人間の写真カスタマイズ方法と区別できる。
論文 参考訳(メタデータ) (2024-03-25T17:59:57Z) - Privacy-Preserving Face Recognition Using Trainable Feature Subtraction [40.47645421424354]
顔認識はプライバシーの懸念を増している。
本稿では,視覚障害と回復障害に対する顔画像保護について検討する。
我々は,この手法を新たなプライバシ保護顔認識手法であるMinusFaceに精錬する。
論文 参考訳(メタデータ) (2024-03-19T05:27:52Z) - When StyleGAN Meets Stable Diffusion: a $\mathscr{W}_+$ Adapter for
Personalized Image Generation [60.305112612629465]
テキストと画像の拡散モデルは、多種多様で高品質でフォトリアリスティックな画像を生成するのに優れている。
本稿では,拡散モデルのための拡張されたアイデンティティ保存とアンタングル化を実現するために,StyleGAN 埋め込み空間 $mathcalW_+$ の新たな利用法を提案する。
提案手法は,即時記述に適合するだけでなく,一般的なスタイルGAN編集方向に対応可能なパーソナライズされたテキスト・ツー・イメージ出力を生成する。
論文 参考訳(メタデータ) (2023-11-29T09:05:14Z) - Face Identity-Aware Disentanglement in StyleGAN [15.753131748318335]
StyleGANのプラグインであるPluGeN4Facesを導入する。
実験の結果,PluGeN4Facesによる顔属性の修正は,既存の最先端モデルに比べて画像の残像特性が有意に低侵襲であることがわかった。
論文 参考訳(メタデータ) (2023-09-21T12:54:09Z) - DreamIdentity: Improved Editability for Efficient Face-identity
Preserved Image Generation [69.16517915592063]
人間の顔の正確な表現を学習するための新しい顔識別エンコーダを提案する。
また、モデルの編集可能性を高めるために、自己拡張編集可能性学習を提案する。
我々の手法は、異なるシーン下でより高速にアイデンティティ保存された画像を生成することができる。
論文 参考訳(メタデータ) (2023-07-01T11:01:17Z) - FaceMAE: Privacy-Preserving Face Recognition via Masked Autoencoders [81.21440457805932]
顔のプライバシと認識性能を同時に考慮する新しいフレームワークFaceMAEを提案する。
ランダムにマスクされた顔画像は、FaceMAEの再構築モジュールのトレーニングに使用される。
また、いくつかの公開顔データセット上で十分なプライバシー保護顔認証を行う。
論文 参考訳(メタデータ) (2022-05-23T07:19:42Z) - FaR-GAN for One-Shot Face Reenactment [20.894596219099164]
本稿では,任意の音源の顔画像とターゲット表現のみを入力として用いた一発顔再現モデルFaR-GANを提案する。
提案手法は,音源の同一性,表情,頭部ポーズ,さらには画像背景についても仮定しない。
論文 参考訳(メタデータ) (2020-05-13T16:15:37Z) - Towards Face Encryption by Generating Adversarial Identity Masks [53.82211571716117]
敵の識別マスクを生成するためのターゲットID保護反復法(TIP-IM)を提案する。
TIP-IMは、様々な最先端の顔認識モデルに対して95%以上の保護成功率を提供する。
論文 参考訳(メタデータ) (2020-03-15T12:45:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。