論文の概要: BPLF: A Bi-Parallel Linear Flow Model for Facial Expression Generation
from Emotion Set Images
- arxiv url: http://arxiv.org/abs/2106.07563v1
- Date: Thu, 27 May 2021 09:37:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-20 22:11:16.285085
- Title: BPLF: A Bi-Parallel Linear Flow Model for Facial Expression Generation
from Emotion Set Images
- Title(参考訳): BPLF:感情集合画像からの表情生成のための双方向線形流れモデル
- Authors: Gao Xu (1), Yuanpeng Long (2), Siwei Liu (1), Lijia Yang (1), Shimei
Xu (3), Xiaoming Yao (1,3), Kunxian Shu (1) ((1) School of Computer Science
and Technology, Chongqing Key Laboratory on Big Data for Bio Intelligence,
Chongqing University of Posts and Telecommunications, Chongqing, China, (2)
School of Economic Information Engineering, Southwestern University of
Finance and Economics, Chengdu, China (3) 51yunjian.com, Hetie International
Square, Chengdu, Sichuan, China)
- Abstract要約: フローベース生成モデルはディープラーニング生成モデルであり、データ分布を明示的に学習することでデータを生成する能力を得る。
本稿では、感情セット画像から顔の感情を生成するための双方向線形フローモデルを構築した。
本稿では、現在の顔の感情画像の公開データセットを整理し、新しい感情データを作成し、このデータセットを通してモデルを検証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The flow-based generative model is a deep learning generative model, which
obtains the ability to generate data by explicitly learning the data
distribution. Theoretically its ability to restore data is stronger than other
generative models. However, its implementation has many limitations, including
limited model design, too many model parameters and tedious calculation. In
this paper, a bi-parallel linear flow model for facial emotion generation from
emotion set images is constructed, and a series of improvements have been made
in terms of the expression ability of the model and the convergence speed in
training. The model is mainly composed of several coupling layers superimposed
to form a multi-scale structure, in which each coupling layer contains 1*1
reversible convolution and linear operation modules. Furthermore, this paper
sorted out the current public data set of facial emotion images, made a new
emotion data, and verified the model through this data set. The experimental
results show that, under the traditional convolutional neural network, the
3-layer 3*3 convolution kernel is more conducive to extracte the features of
the face images. The introduction of principal component decomposition can
improve the convergence speed of the model.
- Abstract(参考訳): フローベース生成モデルはディープラーニング生成モデルであり、データ分布を明示的に学習することでデータを生成する能力を得る。
理論的には、データ復元能力は他の生成モデルよりも強い。
しかし、その実装には、限られたモデル設計、過剰なモデルパラメータ、退屈な計算など、多くの制限がある。
本稿では、感情セット画像から顔の感情を生成するための双方向線形フローモデルを構築し、モデルの表現能力とトレーニングにおける収束速度の観点から、一連の改善を行った。
モデルは主に複数の結合層を重畳して構成され、各結合層は1*1の可逆畳み込みと線形演算モジュールを含んでいる。
さらに、顔の感情画像の現在の公開データセットを整理し、新しい感情データを作成し、このデータセットを通してモデルを検証した。
実験の結果,従来の畳み込みニューラルネットワークでは,3層3*3畳み込みカーネルの方が顔画像の特徴を抽出しやすくなっていることがわかった。
主成分分解の導入はモデルの収束速度を改善することができる。
関連論文リスト
- A survey of probabilistic generative frameworks for molecular simulations [0.0]
生成的人工知能は現在、分子科学において広く使われているツールである。
本稿では,フローベースモデルと拡散モデルという2つのカテゴリに大別された生成モデルのクラスを紹介し,説明する。
可変次元, 複雑性, モーダル非対称性を持つデータセットの精度, 計算コスト, 生成速度について検討する。
論文 参考訳(メタデータ) (2024-11-14T12:05:08Z) - Sub-graph Based Diffusion Model for Link Prediction [43.15741675617231]
拡散確率モデル(Denoising Diffusion Probabilistic Models, DDPM)は、例外的な品質を持つ同時代の生成モデルである。
本研究では,ベイズ式による確率推定過程を分解するために,専用設計を用いたリンク予測のための新しい生成モデルを構築した。
提案手法は,(1)再トレーニングを伴わないデータセット間の転送可能性,(2)限られたトレーニングデータに対する有望な一般化,(3)グラフ敵攻撃に対する堅牢性など,多くの利点を示す。
論文 参考訳(メタデータ) (2024-09-13T02:23:55Z) - MaxFusion: Plug&Play Multi-Modal Generation in Text-to-Image Diffusion Models [34.611309081801345]
大規模な拡散ベースのテキスト・ツー・イメージ(T2I)モデルでは、テキスト・ツー・イメージ生成に印象的な生成能力がある。
本稿では,最小限の計算量で新しいタスクにまたがって生成モデルを拡張するための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-04-15T17:55:56Z) - Heat Death of Generative Models in Closed-Loop Learning [63.83608300361159]
本研究では、独自の学習データセットに加えて、生成したコンテンツをフィードバックする生成モデルの学習ダイナミクスについて検討する。
各イテレーションで十分な量の外部データが導入されない限り、非自明な温度がモデルを退化させることを示す。
論文 参考訳(メタデータ) (2024-04-02T21:51:39Z) - A Phase Transition in Diffusion Models Reveals the Hierarchical Nature
of Data [55.748186000425996]
最近の進歩は、拡散モデルが高品質な画像を生成することを示している。
我々はこの現象を階層的なデータ生成モデルで研究する。
本分析は拡散モデルにおける時間とスケールの関係を特徴付ける。
論文 参考訳(メタデータ) (2024-02-26T19:52:33Z) - Make-A-Shape: a Ten-Million-scale 3D Shape Model [52.701745578415796]
本稿では,大規模な効率的なトレーニングを目的とした新しい3次元生成モデルであるMake-A-Shapeを紹介する。
まずウェーブレットツリー表現を革新し、サブバンド係数フィルタリングスキームを定式化して形状をコンパクトに符号化する。
我々は、粗いウェーブレット係数の生成を効果的に学習するために、我々のモデルを訓練するためのサブバンド適応型トレーニング戦略を導出する。
論文 参考訳(メタデータ) (2024-01-20T00:21:58Z) - Learning Versatile 3D Shape Generation with Improved AR Models [91.87115744375052]
自己回帰(AR)モデルはグリッド空間の関節分布をモデル化することにより2次元画像生成において印象的な結果を得た。
本稿では3次元形状生成のための改良された自己回帰モデル(ImAM)を提案する。
論文 参考訳(メタデータ) (2023-03-26T12:03:18Z) - Meta Internal Learning [88.68276505511922]
単一画像生成のための内部学習は、単一の画像に基づいて新しい画像を生成するようにジェネレータを訓練するフレームワークである。
本稿では,サンプル画像の内部統計をより効果的にモデル化するために,画像集合のトレーニングを可能にするメタラーニング手法を提案する。
以上の結果から, 得られたモデルは, 多数の共通画像アプリケーションにおいて, シングルイメージのGANと同程度に適していることがわかった。
論文 参考訳(メタデータ) (2021-10-06T16:27:38Z) - Flow-based Generative Models for Learning Manifold to Manifold Mappings [39.60406116984869]
本稿では,フローベース生成モデルに類似した,多様体値データに対する可逆層を3種類導入する。
配向分布関数の分野の脳画像を確実にかつ正確に再構築できる有望な結果を示します。
論文 参考訳(メタデータ) (2020-12-18T02:19:18Z) - Learning Bijective Feature Maps for Linear ICA [73.85904548374575]
画像データに適した既存の確率的深層生成モデル (DGM) は, 非線形ICAタスクでは不十分であることを示す。
そこで本研究では,2次元特徴写像と線形ICAモデルを組み合わせることで,高次元データに対する解釈可能な潜在構造を学習するDGMを提案する。
画像上のフローベースモデルや線形ICA、変分オートエンコーダよりも、高速に収束し、訓練が容易なモデルを作成し、教師なしの潜在因子発見を実現する。
論文 参考訳(メタデータ) (2020-02-18T17:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。