論文の概要: 2D+3D facial expression recognition via embedded tensor manifold
regularization
- arxiv url: http://arxiv.org/abs/2201.12506v1
- Date: Sat, 29 Jan 2022 06:11:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-01 16:22:30.548646
- Title: 2D+3D facial expression recognition via embedded tensor manifold
regularization
- Title(参考訳): 埋め込みテンソル多様体正規化による2次元3次元表情認識
- Authors: Yunfang Fu, Qiuqi Ruan, Ziyan Luo, Gaoyun An, Yi Jin, Jun Wan
- Abstract要約: 2D+3次元表情認識(FERETMR)のための埋め込みテンソル多様体正規化による新しい手法を提案する。
定常点の観点から一階最適条件を確立し、収束解析によるブロック座標降下(BCD)アルゴリズムを設計する。
BU-3DFEデータベースとBosphorusデータベースの数値計算結果から,提案手法の有効性が示された。
- 参考スコア(独自算出の注目度): 16.98176664818354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, a novel approach via embedded tensor manifold regularization
for 2D+3D facial expression recognition (FERETMR) is proposed. Firstly, 3D
tensors are constructed from 2D face images and 3D face shape models to keep
the structural information and correlations. To maintain the local structure
(geometric information) of 3D tensor samples in the low-dimensional tensors
space during the dimensionality reduction, the $\ell_0$-norm of the core
tensors and a tensor manifold regularization scheme embedded on core tensors
are adopted via a low-rank truncated Tucker decomposition on the generated
tensors. As a result, the obtained factor matrices will be used for facial
expression classification prediction. To make the resulting tensor optimization
more tractable, $\ell_1$-norm surrogate is employed to relax $\ell_0$-norm and
hence the resulting tensor optimization problem has a nonsmooth objective
function due to the $\ell_1$-norm and orthogonal constraints from the
orthogonal Tucker decomposition. To efficiently tackle this tensor optimization
problem, we establish the first-order optimality condition in terms of
stationary points, and then design a block coordinate descent (BCD) algorithm
with convergence analysis and the computational complexity. Numerical results
on BU-3DFE database and Bosphorus databases demonstrate the effectiveness of
our proposed approach.
- Abstract(参考訳): 本稿では,2次元3次元表情認識(FERETMR)のための組込みテンソル多様体正規化による新しい手法を提案する。
まず、構造情報と相関を保つために、2次元顔画像と3次元顔形状モデルから3次元テンソルを構築する。
次元減少中の低次元テンソル空間における3次元テンソル試料の局所構造(幾何情報)を維持するため、生成したテンソル上の低ランク切断タッカー分解により、コアテンソルの$\ell_0$ノルムとコアテンソルに埋め込まれたテンソル多様体正則化スキームを採用する。
その結果、得られた因子行列は表情の分類予測に使用される。
結果として得られるテンソル最適化をより魅力的にするために、$\ell_1$-norm を緩和するために $\ell_0$-norm を用い、その結果のテンソル最適化問題は、直交タッカー分解による $\ell_1$-norm と直交タッカー分解による直交制約による非滑らかな目的関数を持つ。
このテンソル最適化問題を効率的に解くため、定常点の観点から一階最適条件を確立し、収束解析と計算複雑性を考慮したブロック座標降下(BCD)アルゴリズムを設計する。
BU-3DFEデータベースとBosphorusデータベースの数値計算結果から,提案手法の有効性が示された。
関連論文リスト
- Geometric Algebra Planes: Convex Implicit Neural Volumes [70.12234371845445]
GA-Planes はスパース低ランク係数と低分解能行列と等価であることを示す。
また,GA-Planeは既存の表現にも適用可能であることを示す。
論文 参考訳(メタデータ) (2024-11-20T18:21:58Z) - R$^2$-Gaussian: Rectifying Radiative Gaussian Splatting for Tomographic Reconstruction [53.19869886963333]
3次元ガウススプラッティング(3DGS)は画像のレンダリングと表面再構成において有望な結果を示した。
本稿では,Sparse-viewトモグラフィ再構成のための3DGSベースのフレームワークであるR2$-Gaussianを紹介する。
論文 参考訳(メタデータ) (2024-05-31T08:39:02Z) - Reducing SO(3) Convolutions to SO(2) for Efficient Equivariant GNNs [3.1618838742094457]
等変畳み込みは高次テンソルを使用すると計算複雑性が著しく増加する。
大規模なOC-20データセットとOC-22データセットの最先端結果が得られる同変畳み込みに対する我々の新しいアプローチを利用したグラフニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2023-02-07T18:16:13Z) - IKOL: Inverse kinematics optimization layer for 3D human pose and shape
estimation via Gauss-Newton differentiation [44.00115413716392]
本稿では3次元ポーズ形状推定のための逆運動層(IKOL)を提案する。
IKOLは、既存の回帰ベースのメソッドよりもはるかに多い。
より正確な3Dポーズ推定を提供する。
論文 参考訳(メタデータ) (2023-02-02T12:43:29Z) - Orthogonal Matrix Retrieval with Spatial Consensus for 3D Unknown-View
Tomography [58.60249163402822]
未知視トモグラフィ(UVT)は、未知のランダムな向きで2次元投影から3次元密度マップを再構成する。
提案したOMRはより堅牢で、従来の最先端のOMRアプローチよりも大幅に性能が向上している。
論文 参考訳(メタデータ) (2022-07-06T21:40:59Z) - Geometry-Contrastive Transformer for Generalized 3D Pose Transfer [95.56457218144983]
この研究の直感は、与えられたメッシュ間の幾何学的不整合を強力な自己認識機構で知覚することである。
本研究では,グローバルな幾何学的不整合に対する3次元構造的知覚能力を有する新しい幾何学コントラスト変換器を提案する。
本稿では, クロスデータセット3次元ポーズ伝達タスクのための半合成データセットとともに, 潜時等尺正則化モジュールを提案する。
論文 参考訳(メタデータ) (2021-12-14T13:14:24Z) - Fast Low-Rank Tensor Decomposition by Ridge Leverage Score Sampling [5.740578698172382]
リッジレバレッジスコア (ridge leverage scores) と呼ばれるランダム化数値線形代数のタッカー分解とツールの利用について検討する。
近似リッジレバレッジスコアを用いて、任意のリッジ回帰問題に対してスケッチされたインスタンスを構築する方法を示す。
本研究では, 合成データと実世界のデータの両方に対して, 大規模かつ低ランクのタッカー分解に対する近似リッジ回帰アルゴリズムの有効性を示す。
論文 参考訳(メタデータ) (2021-07-22T13:32:47Z) - Self-Supervised Nonlinear Transform-Based Tensor Nuclear Norm for
Multi-Dimensional Image Recovery [27.34643415429293]
自己超越下で観測されたテンソルデータを用いて非線形変換を学習する多層ニューラルネットワークを提案する。
提案するネットワークは、変換テンソルの低ランク表現と、観測されたテンソルと再構成テンソルとの間のデータ適合を利用して非線形変換を構築する。
論文 参考訳(メタデータ) (2021-05-29T14:56:51Z) - Self-supervised Geometric Perception [96.89966337518854]
自己教師付き幾何知覚(self-supervised geometric perception)は、基底幾何モデルラベルなしで対応マッチングのための特徴記述子を学ぶためのフレームワークである。
また,SGPは,地上トラスラベルを用いて訓練した教師付きオークルよりも同等か優れる最先端性能を達成できることを示す。
論文 参考訳(メタデータ) (2021-03-04T15:34:43Z) - Low-Rank and Sparse Enhanced Tucker Decomposition for Tensor Completion [3.498620439731324]
テンソル完備化のために,低ランクかつスパースに拡張されたタッカー分解モデルを導入する。
我々のモデルはスパースコアテンソルを促進するためにスパース正規化項を持ち、テンソルデータ圧縮に有用である。
テンソルに出現する潜在的な周期性と固有相関特性を利用するので,本モデルでは様々な種類の実世界のデータセットを扱うことが可能である。
論文 参考訳(メタデータ) (2020-10-01T12:45:39Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。