論文の概要: Generating Diverse Realistic Laughter for Interactive Art
- arxiv url: http://arxiv.org/abs/2111.03146v1
- Date: Thu, 4 Nov 2021 20:31:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-09 03:37:40.539529
- Title: Generating Diverse Realistic Laughter for Interactive Art
- Title(参考訳): インタラクティブアートのためのディバースリアルライナーの生成
- Authors: M. Mehdi Afsar, Eric Park, \'Etienne Paquette, Gauthier Gidel, Kory W.
Mathewson, Eilif Muller
- Abstract要約: 我々は、GAN(Generative Adversarial Network)を用いたヒトの笑いの多様性を再現するアプローチであるLaughGANterを開発した。
多様な笑いサンプルのデータセットをトレーニングすると、LaughGANterは多様な高品質な笑いサンプルを生成し、感情分析に適した潜伏空間と、潜伏混合・補間や感情伝達といった新しい芸術的応用を学ぶ。
- 参考スコア(独自算出の注目度): 12.81706915365902
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose an interactive art project to make those rendered invisible by the
COVID-19 crisis and its concomitant solitude reappear through the welcome
melody of laughter, and connections created and explored through advanced
laughter synthesis approaches. However, the unconditional generation of the
diversity of human emotional responses in high-quality auditory synthesis
remains an open problem, with important implications for the application of
these approaches in artistic settings. We developed LaughGANter, an approach to
reproduce the diversity of human laughter using generative adversarial networks
(GANs). When trained on a dataset of diverse laughter samples, LaughGANter
generates diverse, high quality laughter samples, and learns a latent space
suitable for emotional analysis and novel artistic applications such as latent
mixing/interpolation and emotional transfer.
- Abstract(参考訳): われわれは,新型コロナウイルスの危機や,それに伴う孤独感が,笑いの歓迎のメロディを通じて再び現れるようにするためのインタラクティブアートプロジェクトを提案し,高度な笑い合成アプローチを通じて構築し,探求する。
しかしながら、高品質な聴覚合成における人間の感情反応の多様性の無条件発生は、芸術的場面におけるこれらのアプローチの適用に重要な意味を持つオープンな問題である。
我々は,GANを用いたヒトの笑いの多様性を再現するアプローチであるLaughGANterを開発した。
様々な笑いサンプルのデータセットで訓練されると、hryganterは多様な高品質な笑いサンプルを生成し、感情分析に適した潜在空間と、潜伏混合/補間や感情伝達のような新しい芸術的応用を学ぶ。
関連論文リスト
- Alien Recombination: Exploring Concept Blends Beyond Human Cognitive Availability in Visual Art [90.8684263806649]
視覚芸術の創造において、AIが人間の認知的限界を超越する方法を示します。
我々の研究は、視覚芸術には膨大な未探索の概念的組み合わせが含まれているという仮説を立てている。
本稿では,人間の認知能力を超えた概念の組み合わせを同定し,生成するエイリアン組換え法を提案する。
論文 参考訳(メタデータ) (2024-11-18T11:55:38Z) - Visions of Destruction: Exploring a Potential of Generative AI in Interactive Art [2.3020018305241337]
本稿では,対話型アートにおける生成AIの可能性について,実践に基づく研究手法を用いて検討する。
インタラクティブなアートワーク "Visions of Destruction" を詳細なケーススタディとして紹介し、動的でオーディエンス対応のエクスペリエンスを作り出すために、生成AIの革新的な利用を強調している。
論文 参考訳(メタデータ) (2024-08-26T21:20:45Z) - Expressivity and Speech Synthesis [51.75420054449122]
われわれはこれまでの方法論の進歩を概説し、その次のレベルの人工表現性に到達するための継続的な取り組みを概説した。
また、社会的な意味と、急速に進歩する表現型音声合成(ESS)技術についても論じる。
論文 参考訳(メタデータ) (2024-04-30T08:47:24Z) - FlowVQTalker: High-Quality Emotional Talking Face Generation through Normalizing Flow and Quantization [4.429892245774265]
本稿では,正規化フローとベクトル量子化モデルを用いて感情的な発話顔を生成することを提案する。
具体的には、顔の感情のダイナミクスを多感情階級の潜在空間にエンコードするフローベース係数生成器を開発する。
設計したベクトル量子化画像生成器は、コードクエリータスクとして表現力のある顔画像を作成する。
論文 参考訳(メタデータ) (2024-03-11T01:58:04Z) - Laughing Matters: Introducing Laughing-Face Generation using Diffusion
Models [35.688696422879175]
そこで本研究では,静止画と笑いを含む音声クリップを用いて,リアルな笑い系列を生成する新しいモデルを提案する。
我々は、さまざまな笑いデータセットに基づいてモデルをトレーニングし、笑いのために特別に設計された評価指標を導入する。
本モデルでは,笑声生成のために再訓練された場合でも,すべての指標に対して最先端のパフォーマンスが達成される。
論文 参考訳(メタデータ) (2023-05-15T17:59:57Z) - LaughNet: synthesizing laughter utterances from waveform silhouettes and
a single laughter example [55.10864476206503]
我々は、波形シルエットを入力として、笑いを合成するLaughNetと呼ばれるモデルを提案する。
その結果,LaughNetは笑い声を適度な品質で合成し,トレーニング例の特徴を保てることがわかった。
論文 参考訳(メタデータ) (2021-10-11T00:45:07Z) - Emotion-aware Chat Machine: Automatic Emotional Response Generation for
Human-like Emotional Interaction [55.47134146639492]
この記事では、投稿中のセマンティクスと感情を同時にエンコードできる、未定義のエンドツーエンドニューラルネットワークを提案する。
実世界のデータを用いた実験により,提案手法は,コンテンツコヒーレンスと感情の適切性の両方の観点から,最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-06-06T06:26:15Z) - Audio-Driven Emotional Video Portraits [79.95687903497354]
Emotional Video Portraits(EVP)は、オーディオによって駆動される鮮やかな感情的なダイナミクスで高品質のビデオポートレートを合成するシステムです。
具体的には,音声を2つの分離空間に分解するクロスリコンストラクテッド感情不等角化手法を提案する。
ゆがんだ特徴によって、動的2D感情的な顔のランドマークは推定することができます。
次に,最終的な高品質映像画像を生成するために,ターゲット適応型顔合成手法を提案する。
論文 参考訳(メタデータ) (2021-04-15T13:37:13Z) - Facial Emotion Recognition with Noisy Multi-task Annotations [88.42023952684052]
ノイズの多いマルチタスクアノテーションを用いた顔の感情認識の新しい問題を提案する。
この新たな問題に対して,共同分布マッチングの観点からの定式化を提案する。
我々は,感情予測と共同分布学習を可能にする新しい手法を利用する。
論文 参考訳(メタデータ) (2020-10-19T20:39:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。