論文の概要: Generating Diverse Realistic Laughter for Interactive Art
- arxiv url: http://arxiv.org/abs/2111.03146v1
- Date: Thu, 4 Nov 2021 20:31:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-09 03:37:40.539529
- Title: Generating Diverse Realistic Laughter for Interactive Art
- Title(参考訳): インタラクティブアートのためのディバースリアルライナーの生成
- Authors: M. Mehdi Afsar, Eric Park, \'Etienne Paquette, Gauthier Gidel, Kory W.
Mathewson, Eilif Muller
- Abstract要約: 我々は、GAN(Generative Adversarial Network)を用いたヒトの笑いの多様性を再現するアプローチであるLaughGANterを開発した。
多様な笑いサンプルのデータセットをトレーニングすると、LaughGANterは多様な高品質な笑いサンプルを生成し、感情分析に適した潜伏空間と、潜伏混合・補間や感情伝達といった新しい芸術的応用を学ぶ。
- 参考スコア(独自算出の注目度): 12.81706915365902
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose an interactive art project to make those rendered invisible by the
COVID-19 crisis and its concomitant solitude reappear through the welcome
melody of laughter, and connections created and explored through advanced
laughter synthesis approaches. However, the unconditional generation of the
diversity of human emotional responses in high-quality auditory synthesis
remains an open problem, with important implications for the application of
these approaches in artistic settings. We developed LaughGANter, an approach to
reproduce the diversity of human laughter using generative adversarial networks
(GANs). When trained on a dataset of diverse laughter samples, LaughGANter
generates diverse, high quality laughter samples, and learns a latent space
suitable for emotional analysis and novel artistic applications such as latent
mixing/interpolation and emotional transfer.
- Abstract(参考訳): われわれは,新型コロナウイルスの危機や,それに伴う孤独感が,笑いの歓迎のメロディを通じて再び現れるようにするためのインタラクティブアートプロジェクトを提案し,高度な笑い合成アプローチを通じて構築し,探求する。
しかしながら、高品質な聴覚合成における人間の感情反応の多様性の無条件発生は、芸術的場面におけるこれらのアプローチの適用に重要な意味を持つオープンな問題である。
我々は,GANを用いたヒトの笑いの多様性を再現するアプローチであるLaughGANterを開発した。
様々な笑いサンプルのデータセットで訓練されると、hryganterは多様な高品質な笑いサンプルを生成し、感情分析に適した潜在空間と、潜伏混合/補間や感情伝達のような新しい芸術的応用を学ぶ。
関連論文リスト
- FlowVQTalker: High-Quality Emotional Talking Face Generation through
Normalizing Flow and Quantization [4.978754943172958]
本稿では,正規化フローとベクトル量子化モデルを用いて感情的な発話顔を生成することを提案する。
具体的には、顔の感情のダイナミクスを多感情階級の潜在空間にエンコードするフローベース係数生成器を開発する。
設計したベクトル量子化画像生成器は、コードクエリータスクとして表現力のある顔画像を作成する。
論文 参考訳(メタデータ) (2024-03-11T01:58:04Z) - From Audio to Photoreal Embodiment: Synthesizing Humans in Conversations [107.88375243135579]
音声を聴くと、顔、体、手を含む個人に対して、ジェスチャー動作の可能性を複数出力する。
ジェスチャーにおいて重要なニュアンスを表現できる高光写実性アバターを用いて生成した動きを可視化する。
実験により,本モデルが適切な多様なジェスチャーを生成することを示し,拡散法とVQ法の両方に優れることがわかった。
論文 参考訳(メタデータ) (2024-01-03T18:55:16Z) - Laughing Matters: Introducing Laughing-Face Generation using Diffusion
Models [35.688696422879175]
そこで本研究では,静止画と笑いを含む音声クリップを用いて,リアルな笑い系列を生成する新しいモデルを提案する。
我々は、さまざまな笑いデータセットに基づいてモデルをトレーニングし、笑いのために特別に設計された評価指標を導入する。
本モデルでは,笑声生成のために再訓練された場合でも,すべての指標に対して最先端のパフォーマンスが達成される。
論文 参考訳(メタデータ) (2023-05-15T17:59:57Z) - MixSyn: Learning Composition and Style for Multi-Source Image Synthesis [8.473714899301601]
本研究では,複数の音源から新しいファジィ合成を学習し,その合成に対応する画像領域の混合として新たな画像を作成するためのMixSynを提案する。
品質,多様性,リアリズム,表現力の観点から,MixSynを最先端の単一ソースシーケンシャル生成とコラージュ生成のアプローチと比較した。
論文 参考訳(メタデータ) (2021-11-24T18:58:34Z) - LaughNet: synthesizing laughter utterances from waveform silhouettes and
a single laughter example [55.10864476206503]
我々は、波形シルエットを入力として、笑いを合成するLaughNetと呼ばれるモデルを提案する。
その結果,LaughNetは笑い声を適度な品質で合成し,トレーニング例の特徴を保てることがわかった。
論文 参考訳(メタデータ) (2021-10-11T00:45:07Z) - Emotion-aware Chat Machine: Automatic Emotional Response Generation for
Human-like Emotional Interaction [55.47134146639492]
この記事では、投稿中のセマンティクスと感情を同時にエンコードできる、未定義のエンドツーエンドニューラルネットワークを提案する。
実世界のデータを用いた実験により,提案手法は,コンテンツコヒーレンスと感情の適切性の両方の観点から,最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-06-06T06:26:15Z) - Audio-Driven Emotional Video Portraits [79.95687903497354]
Emotional Video Portraits(EVP)は、オーディオによって駆動される鮮やかな感情的なダイナミクスで高品質のビデオポートレートを合成するシステムです。
具体的には,音声を2つの分離空間に分解するクロスリコンストラクテッド感情不等角化手法を提案する。
ゆがんだ特徴によって、動的2D感情的な顔のランドマークは推定することができます。
次に,最終的な高品質映像画像を生成するために,ターゲット適応型顔合成手法を提案する。
論文 参考訳(メタデータ) (2021-04-15T13:37:13Z) - Facial Emotion Recognition with Noisy Multi-task Annotations [88.42023952684052]
ノイズの多いマルチタスクアノテーションを用いた顔の感情認識の新しい問題を提案する。
この新たな問題に対して,共同分布マッチングの観点からの定式化を提案する。
我々は,感情予測と共同分布学習を可能にする新しい手法を利用する。
論文 参考訳(メタデータ) (2020-10-19T20:39:37Z) - Hierarchy Composition GAN for High-fidelity Image Synthesis [57.32311953820988]
本稿では,革新的階層構成GAN(HIC-GAN)を提案する。
HIC-GANは、幾何学と外観領域における画像合成をエンドツーエンドのトレーニング可能なネットワークに組み込んでいる。
シーンテキスト画像合成, 肖像画編集, 室内レンダリングタスクの実験により, 提案したHIC-GANは, 質的, 定量的に優れた合成性能が得られることを示した。
論文 参考訳(メタデータ) (2019-05-12T11:11:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。