論文の概要: Bayesian optimization for automatic design of face stimuli
- arxiv url: http://arxiv.org/abs/2007.09989v1
- Date: Mon, 20 Jul 2020 10:27:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 13:14:21.400150
- Title: Bayesian optimization for automatic design of face stimuli
- Title(参考訳): 顔刺激の自動設計のためのベイズ最適化
- Authors: Pedro F. da Costa, Romy Lorenz, Ricardo Pio Monti, Emily Jones, Robert
Leech
- Abstract要約: 本稿では,GANとベイズ最適化を組み合わせた新しいフレームワークを提案する。
形式的には、我々はベイズ最適化を用いて、最先端のGANモデルの潜在空間を効率的に探索し、新しい顔を自動的に生成することを目的としている。
このアルゴリズムは,顔の異なるセマンティック・トランスフォーメーションにまたがる応答をマッピングしながら,個人の最適な顔の特定を効率的に行う方法を示す。
- 参考スコア(独自算出の注目度): 2.572404739180802
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Investigating the cognitive and neural mechanisms involved with face
processing is a fundamental task in modern neuroscience and psychology. To
date, the majority of such studies have focused on the use of pre-selected
stimuli. The absence of personalized stimuli presents a serious limitation as
it fails to account for how each individual face processing system is tuned to
cultural embeddings or how it is disrupted in disease. In this work, we propose
a novel framework which combines generative adversarial networks (GANs) with
Bayesian optimization to identify individual response patterns to many
different faces. Formally, we employ Bayesian optimization to efficiently
search the latent space of state-of-the-art GAN models, with the aim to
automatically generate novel faces, to maximize an individual subject's
response. We present results from a web-based proof-of-principle study, where
participants rated images of themselves generated via performing Bayesian
optimization over the latent space of a GAN. We show how the algorithm can
efficiently locate an individual's optimal face while mapping out their
response across different semantic transformations of a face; inter-individual
analyses suggest how the approach can provide rich information about individual
differences in face processing.
- Abstract(参考訳): 顔処理に関わる認知と神経のメカニズムを調べることは、現代の神経科学と心理学の基本的な課題である。
これまで、これらの研究の大部分は、選択された刺激の使用に焦点を当ててきた。
パーソナライズされた刺激の欠如は、個々の顔処理システムが文化的埋め込みにどう調整されるか、病気でどのように混乱するかを考慮できないため、深刻な限界を示す。
本稿では,様々な顔に対する個々の応答パターンを識別するために,gansとベイズ最適化を組み合わせた新しい枠組みを提案する。
形式的には、ベイズ最適化を用いて最先端のGANモデルの潜在空間を効率的に探索し、新しい顔を自動的に生成し、個々の被験者の反応を最大化する。
GANの潜伏空間上でベイズ最適化を行うことにより、参加者が生成した自身の画像を評価した、Webベースの実証・実証研究の結果を報告する。
顔の異なるセマンティック・トランスフォーメーションにまたがって反応をマッピングしながら、アルゴリズムが個人の最適な顔を効率的に見つけ出す方法を示す。
関連論文リスト
- Diverse Code Query Learning for Speech-Driven Facial Animation [2.1779479916071067]
音声駆動型顔アニメーションは、所定の音声信号に従って唇同期3D音声を合成することを目的としている。
我々は,同一の音声信号に条件付された複数のサンプルを予測し,多様な顔のアニメーションに対処するために,サンプルの多様性を明示的に促すことを提案する。
論文 参考訳(メタデータ) (2024-09-27T21:15:21Z) - Appearance Debiased Gaze Estimation via Stochastic Subject-Wise
Adversarial Learning [33.55397868171977]
外観に基づく視線推定はコンピュータビジョンにおいて注目されており、様々な深層学習技術を用いて顕著な改善が達成されている。
本稿では,被験者の外観を一般化するネットワークを訓練する,SAZE学習という新しい枠組みを提案する。
実験の結果,MPIIGazeデータセットとEyeDiapデータセットの3.89と4.42をそれぞれ達成した。
論文 参考訳(メタデータ) (2024-01-25T00:23:21Z) - Multimodal Adaptive Fusion of Face and Gait Features using Keyless
attention based Deep Neural Networks for Human Identification [67.64124512185087]
歩行のような軟式生体認証は、人物認識や再識別といった監視作業において顔に広く使われている。
本稿では,キーレス注意深層ニューラルネットワークを活用することで,歩行と顔のバイオメトリック・キューを動的に組み込むための適応型マルチバイオメトリック・フュージョン戦略を提案する。
論文 参考訳(メタデータ) (2023-03-24T05:28:35Z) - End-to-end Face-swapping via Adaptive Latent Representation Learning [12.364688530047786]
本稿では,高精細・高精細・高精細・高精細・高精細な顔交換のための新しいエンドツーエンド統合フレームワークを提案する。
顔の知覚とブレンドをエンドツーエンドのトレーニングとテストのプロセスに統合することで、野生の顔に高いリアルな顔スワッピングを実現することができる。
論文 参考訳(メタデータ) (2023-03-07T19:16:20Z) - CIAO! A Contrastive Adaptation Mechanism for Non-Universal Facial
Expression Recognition [80.07590100872548]
本稿では、顔エンコーダの最後の層に異なるデータセットの特定の感情特性を適応させるメカニズムであるContrastive Inhibitory Adaptati On(CIAO)を提案する。
CIAOは、非常にユニークな感情表現を持つ6つの異なるデータセットに対して、表情認識性能が改善されている。
論文 参考訳(メタデータ) (2022-08-10T15:46:05Z) - TANet: A new Paradigm for Global Face Super-resolution via
Transformer-CNN Aggregation Network [72.41798177302175]
本稿では, 顔構造特徴の表現能力を完全に探求する自己認識機構(すなわち Transformer のコア)に基づく新しいパラダイムを提案する。
具体的には、2つの経路からなるTransformer-CNNアグリゲーションネットワーク(TANet)を設計する。
上記の2つの経路から特徴を集約することにより、グローバルな顔の構造の整合性と局所的な顔のディテール復元の忠実度を同時に強化する。
論文 参考訳(メタデータ) (2021-09-16T18:15:07Z) - One-shot Face Reenactment Using Appearance Adaptive Normalization [30.615671641713945]
本稿では,一発顔再現のための新しい生成的対向ネットワークを提案する。
1枚の顔画像を別のポーズ・アンド・エクスプレッションにアニメーションし、元の外観を保ちます。
論文 参考訳(メタデータ) (2021-02-08T03:36:30Z) - InterFaceGAN: Interpreting the Disentangled Face Representation Learned
by GANs [73.27299786083424]
我々は、最先端のGANモデルによって学習された不整合顔表現を解釈するInterFaceGANというフレームワークを提案する。
まず、GANは潜在空間の線型部分空間で様々な意味学を学ぶ。
次に、異なる意味論間の相関関係について詳細な研究を行い、部分空間射影を通してそれらをよりよく解離させる。
論文 参考訳(メタデータ) (2020-05-18T18:01:22Z) - Dual-Attention GAN for Large-Pose Face Frontalization [59.689836951934694]
本稿では,フォトリアリスティック顔フロンダル化のためのDA-GAN(Dual-Attention Generative Adversarial Network)を提案する。
具体的には、ローカル機能と長距離依存関係を統合するために、自己アテンションベースのジェネレータが導入された。
顔領域の局所的特徴を強調するために,新しい顔認識に基づく識別器を適用した。
論文 参考訳(メタデータ) (2020-02-17T20:00:56Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。