Fugu-MT 論文翻訳(概要): Generating Diverse Realistic Laughter for Interactive Art

論文の概要: Generating Diverse Realistic Laughter for Interactive Art

arxiv url: http://arxiv.org/abs/2111.03146v1
Date: Thu, 4 Nov 2021 20:31:15 GMT
ステータス: 翻訳完了
システム内更新日: 2021-11-09 03:37:40.539529
Title: Generating Diverse Realistic Laughter for Interactive Art
Title（参考訳）: インタラクティブアートのためのディバースリアルライナーの生成
Authors: M. Mehdi Afsar, Eric Park, \'Etienne Paquette, Gauthier Gidel, Kory W. Mathewson, Eilif Muller
Abstract要約: 我々は、GAN(Generative Adversarial Network)を用いたヒトの笑いの多様性を再現するアプローチであるLaughGANterを開発した。多様な笑いサンプルのデータセットをトレーニングすると、LaughGANterは多様な高品質な笑いサンプルを生成し、感情分析に適した潜伏空間と、潜伏混合・補間や感情伝達といった新しい芸術的応用を学ぶ。
参考スコア（独自算出の注目度）: 12.81706915365902
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We propose an interactive art project to make those rendered invisible by the COVID-19 crisis and its concomitant solitude reappear through the welcome melody of laughter, and connections created and explored through advanced laughter synthesis approaches. However, the unconditional generation of the diversity of human emotional responses in high-quality auditory synthesis remains an open problem, with important implications for the application of these approaches in artistic settings. We developed LaughGANter, an approach to reproduce the diversity of human laughter using generative adversarial networks (GANs). When trained on a dataset of diverse laughter samples, LaughGANter generates diverse, high quality laughter samples, and learns a latent space suitable for emotional analysis and novel artistic applications such as latent mixing/interpolation and emotional transfer.
Abstract（参考訳）: われわれは,新型コロナウイルスの危機や,それに伴う孤独感が,笑いの歓迎のメロディを通じて再び現れるようにするためのインタラクティブアートプロジェクトを提案し,高度な笑い合成アプローチを通じて構築し,探求する。しかしながら、高品質な聴覚合成における人間の感情反応の多様性の無条件発生は、芸術的場面におけるこれらのアプローチの適用に重要な意味を持つオープンな問題である。我々は,GANを用いたヒトの笑いの多様性を再現するアプローチであるLaughGANterを開発した。様々な笑いサンプルのデータセットで訓練されると、hryganterは多様な高品質な笑いサンプルを生成し、感情分析に適した潜在空間と、潜伏混合/補間や感情伝達のような新しい芸術的応用を学ぶ。

関連論文リスト

Think-Before-Draw: Decomposing Emotion Semantics & Fine-Grained Controllable Expressive Talking Head Generation [7.362433184546492]
コンピュータビジョンとマルチモーダル人工知能の交差点における重要な研究領域として、感情的トーキー生成が出現している。本研究では,2つの課題に対処するThink-Before-Drawフレームワークを提案する。
論文参考訳（メタデータ） (2025-07-17T03:33:46Z)
Disentangle Identity, Cooperate Emotion: Correlation-Aware Emotional Talking Portrait Generation [63.94836524433559]
DICE-Talkは、感情と同一性を切り離し、類似した特徴を持つ感情を協調するフレームワークである。我々は、モーダル・アテンションを通して、音声と視覚の感情の手がかりを共同でモデル化するアンタングル型感情埋め込み装置を開発した。次に,学習可能な感情バンクを用いた相関強化感情調和モジュールを提案する。第3に、拡散過程における感情の一貫性を強制する感情識別目標を設計する。
論文参考訳（メタデータ） (2025-04-25T05:28:21Z)
When Words Smile: Generating Diverse Emotional Facial Expressions from Text [72.19705878257204]
本稿では,感情動態に着目したエンドツーエンドのテキスト対表現モデルを提案する。我々のモデルは連続的な潜伏空間における表情の変動を学習し、多様な、流動的で、感情的に一貫性のある表現を生成する。
論文参考訳（メタデータ） (2024-12-03T15:39:05Z)
Alien Recombination: Exploring Concept Blends Beyond Human Cognitive Availability in Visual Art [90.8684263806649]
視覚芸術の創造において、AIが人間の認知的限界を超越する方法を示します。我々の研究は、視覚芸術には膨大な未探索の概念的組み合わせが含まれているという仮説を立てている。本稿では,人間の認知能力を超えた概念の組み合わせを同定し,生成するエイリアン組換え法を提案する。
論文参考訳（メタデータ） (2024-11-18T11:55:38Z)
Visions of Destruction: Exploring a Potential of Generative AI in Interactive Art [2.3020018305241337]
本稿では,対話型アートにおける生成AIの可能性について,実践に基づく研究手法を用いて検討する。インタラクティブなアートワーク "Visions of Destruction" を詳細なケーススタディとして紹介し、動的でオーディエンス対応のエクスペリエンスを作り出すために、生成AIの革新的な利用を強調している。
論文参考訳（メタデータ） (2024-08-26T21:20:45Z)
Expressivity and Speech Synthesis [51.75420054449122]
われわれはこれまでの方法論の進歩を概説し、その次のレベルの人工表現性に到達するための継続的な取り組みを概説した。また、社会的な意味と、急速に進歩する表現型音声合成(ESS)技術についても論じる。
論文参考訳（メタデータ） (2024-04-30T08:47:24Z)
FlowVQTalker: High-Quality Emotional Talking Face Generation through Normalizing Flow and Quantization [4.429892245774265]
本稿では,正規化フローとベクトル量子化モデルを用いて感情的な発話顔を生成することを提案する。具体的には、顔の感情のダイナミクスを多感情階級の潜在空間にエンコードするフローベース係数生成器を開発する。設計したベクトル量子化画像生成器は、コードクエリータスクとして表現力のある顔画像を作成する。
論文参考訳（メタデータ） (2024-03-11T01:58:04Z)
GMTalker: Gaussian Mixture-based Audio-Driven Emotional Talking Video Portraits [60.05683966405544]
GMTalkerはガウスの混合合成による感情的な音声画像生成フレームワークである。具体的には,よりフレキシブルな感情操作を実現するために,連続的かつ不整合な潜在空間を提案する。また,多種多様な頭部ポーズ,瞬き,眼球運動を生成するために,大規模データセット上で事前訓練された正規化フローベースモーションジェネレータを導入する。
論文参考訳（メタデータ） (2023-12-12T19:03:04Z)
Laughing Matters: Introducing Laughing-Face Generation using Diffusion Models [35.688696422879175]
そこで本研究では,静止画と笑いを含む音声クリップを用いて,リアルな笑い系列を生成する新しいモデルを提案する。我々は、さまざまな笑いデータセットに基づいてモデルをトレーニングし、笑いのために特別に設計された評価指標を導入する。本モデルでは,笑声生成のために再訓練された場合でも,すべての指標に対して最先端のパフォーマンスが達成される。
論文参考訳（メタデータ） (2023-05-15T17:59:57Z)
LaughNet: synthesizing laughter utterances from waveform silhouettes and a single laughter example [55.10864476206503]
我々は、波形シルエットを入力として、笑いを合成するLaughNetと呼ばれるモデルを提案する。その結果,LaughNetは笑い声を適度な品質で合成し,トレーニング例の特徴を保てることがわかった。
論文参考訳（メタデータ） (2021-10-11T00:45:07Z)
Emotion-aware Chat Machine: Automatic Emotional Response Generation for Human-like Emotional Interaction [55.47134146639492]
この記事では、投稿中のセマンティクスと感情を同時にエンコードできる、未定義のエンドツーエンドニューラルネットワークを提案する。実世界のデータを用いた実験により,提案手法は,コンテンツコヒーレンスと感情の適切性の両方の観点から,最先端の手法よりも優れていることが示された。
論文参考訳（メタデータ） (2021-06-06T06:26:15Z)
Audio-Driven Emotional Video Portraits [79.95687903497354]
Emotional Video Portraits(EVP)は、オーディオによって駆動される鮮やかな感情的なダイナミクスで高品質のビデオポートレートを合成するシステムです。具体的には,音声を2つの分離空間に分解するクロスリコンストラクテッド感情不等角化手法を提案する。ゆがんだ特徴によって、動的2D感情的な顔のランドマークは推定することができます。次に,最終的な高品質映像画像を生成するために,ターゲット適応型顔合成手法を提案する。
論文参考訳（メタデータ） (2021-04-15T13:37:13Z)
Facial Emotion Recognition with Noisy Multi-task Annotations [88.42023952684052]
ノイズの多いマルチタスクアノテーションを用いた顔の感情認識の新しい問題を提案する。この新たな問題に対して,共同分布マッチングの観点からの定式化を提案する。我々は,感情予測と共同分布学習を可能にする新しい手法を利用する。
論文参考訳（メタデータ） (2020-10-19T20:39:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。