論文の概要: Generating Dataset For Large-scale 3D Facial Emotion Recognition
- arxiv url: http://arxiv.org/abs/2109.08043v1
- Date: Thu, 16 Sep 2021 15:12:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-17 17:45:34.034827
- Title: Generating Dataset For Large-scale 3D Facial Emotion Recognition
- Title(参考訳): 大規模3次元顔表情認識のためのデータセット生成
- Authors: Faizan Farooq Khan and Syed Zulqarnain Gilani
- Abstract要約: ラベル付き感情を持つ3次元顔の大規模なデータセットを生成する手法を提案する。
また,624,000個の顔スキャンで訓練した3D FERのためのディープ畳み込みニューラルネットワークを開発した。
- 参考スコア(独自算出の注目度): 7.310043452300736
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The tremendous development in deep learning has led facial expression
recognition (FER) to receive much attention in the past few years. Although 3D
FER has an inherent edge over its 2D counterpart, work on 2D images has
dominated the field. The main reason for the slow development of 3D FER is the
unavailability of large training and large test datasets. Recognition
accuracies have already saturated on existing 3D emotion recognition datasets
due to their small gallery sizes. Unlike 2D photographs, 3D facial scans are
not easy to collect, causing a bottleneck in the development of deep 3D FER
networks and datasets. In this work, we propose a method for generating a large
dataset of 3D faces with labeled emotions. We also develop a deep convolutional
neural network(CNN) for 3D FER trained on 624,000 3D facial scans. The test
data comprises 208,000 3D facial scans.
- Abstract(参考訳): ディープラーニングの飛躍的な発展により、顔認識(fer)はここ数年で大きな注目を集めている。
3D FERは、その2D画像に対して固有のエッジを持っているが、2D画像の研究がこの分野を支配している。
3D FERの遅い開発の主な理由は、大規模なトレーニングと大規模なテストデータセットが利用できないことである。
認識精度はすでに、ギャラリーのサイズが小さいため、既存の3D感情認識データセットに飽和している。
2D写真とは異なり、3D顔画像の収集は容易ではなく、ディープ3D FERネットワークやデータセットの開発にボトルネックを引き起こす。
本研究では,ラベル付き感情を持つ3次元顔の大規模データセットを生成する手法を提案する。
また624,000個の顔スキャンで訓練した3D FERのためのディープ畳み込みニューラルネットワーク(CNN)を開発した。
テストデータには20万8000の3d顔スキャンが含まれる。
関連論文リスト
- SE3D: A Framework For Saliency Method Evaluation In 3D Imaging [4.090991964172346]
3D畳み込みニューラルネットワーク(3D CNN)は、LIDAR、MRI、CTスキャンを処理できる。
Explainable Artificial Intelligenceの最近の進歩にもかかわらず、3D CNNの説明にはほとんど注力していない。
本稿では,3次元イメージングにおけるSaliency Method EvaluationのためのフレームワークSE3Dを提案する。
論文 参考訳(メタデータ) (2024-05-23T13:55:11Z) - NeRF-MAE: Masked AutoEncoders for Self-Supervised 3D Representation Learning for Neural Radiance Fields [57.617972778377215]
提案手法は,RGB画像から有効な3D表現を生成する方法を示す。
我々は、この表現を、提案した擬似RGBデータに基づいて、180万枚以上の画像で事前訓練する。
我々は,NeRFの自己教師型プレトレーニングであるNeRF-MAE(NeRF-MAE)を目覚ましいスケールで実施し,様々な3Dタスクの性能向上を実現した。
論文 参考訳(メタデータ) (2024-04-01T17:59:55Z) - Super Images -- A New 2D Perspective on 3D Medical Imaging Analysis [0.0]
トレーニング中に3次元知識を効率的に埋め込んで3次元データを扱うための,シンプルで効果的な2次元手法を提案する。
本手法は3次元画像にスライスを並べて超高分解能画像を生成する。
2次元ネットワークのみを利用した3次元ネットワークを実現する一方で、モデルの複雑さはおよそ3倍に減少する。
論文 参考訳(メタデータ) (2022-05-05T09:59:03Z) - Gait Recognition in the Wild with Dense 3D Representations and A
Benchmark [86.68648536257588]
既存の歩行認識の研究は、制約されたシーンにおける人間の体のシルエットや骨格のような2D表現によって支配されている。
本稿では,野生における歩行認識のための高密度な3次元表現の探索を目的とする。
大規模な3D表現に基づく歩行認識データセットGait3Dを構築した。
論文 参考訳(メタデータ) (2022-04-06T03:54:06Z) - DRaCoN -- Differentiable Rasterization Conditioned Neural Radiance
Fields for Articulated Avatars [92.37436369781692]
フルボディの体積アバターを学習するためのフレームワークであるDRaCoNを提案する。
2Dと3Dのニューラルレンダリング技術の利点を利用する。
挑戦的なZJU-MoCapとHuman3.6Mデータセットの実験は、DRaCoNが最先端の手法より優れていることを示している。
論文 参考訳(メタデータ) (2022-03-29T17:59:15Z) - FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection [78.00922683083776]
一般的な2D検出器をこの3Dタスクで動作させることは簡単ではない。
本報告では,完全畳み込み型単段検出器を用いた手法を用いてこの問題を考察する。
私たちのソリューションは、NeurIPS 2020のnuScenes 3D検出チャレンジのすべてのビジョンのみの方法の中で1位を獲得します。
論文 参考訳(メタデータ) (2021-04-22T09:35:35Z) - Learning from 2D: Pixel-to-Point Knowledge Transfer for 3D Pretraining [21.878815180924832]
豊富な2Dデータセットから学んだ2Dネットワークを活用した新しい3Dプリトレーニング手法を提案する。
実験により,2次元知識を事前学習した3次元モデルにより,実世界の様々な3次元ダウンストリームタスクのパフォーマンスが向上することを示した。
論文 参考訳(メタデータ) (2021-04-10T05:40:42Z) - 3D-to-2D Distillation for Indoor Scene Parsing [78.36781565047656]
大規模3次元データリポジトリから抽出した3次元特徴を有効活用し,RGB画像から抽出した2次元特徴を向上する手法を提案する。
まず,事前学習した3Dネットワークから3D知識を抽出して2Dネットワークを監督し,トレーニング中の2D特徴からシミュレーションされた3D特徴を学習する。
次に,2次元の正規化方式を設計し,2次元特徴と3次元特徴のキャリブレーションを行った。
第3に,非ペアの3dデータを用いたトレーニングのフレームワークを拡張するために,意味を意識した対向的トレーニングモデルを設計した。
論文 参考訳(メタデータ) (2021-04-06T02:22:24Z) - Reconstructing A Large Scale 3D Face Dataset for Deep 3D Face
Identification [9.159921061636695]
本稿では,2次元支援型深部3次元顔認証の枠組みを提案する。
特に,大規模な2次元顔データベースから数百万の3次元顔スキャンを再構築することを提案する。
提案手法はFRGC v2.0, Bosphorus, BU-3DFEの3次元顔データベース上で, 最先端のランク1スコアを実現する。
論文 参考訳(メタデータ) (2020-10-16T13:48:38Z) - Towards Generalization of 3D Human Pose Estimation In The Wild [73.19542580408971]
3DBodyTex.Poseは、3Dの人間のポーズ推定のタスクに対処するデータセットである。
3DBodyTex.Poseは、さまざまな衣服やポーズで405種類の実際の被写体を含む高品質でリッチなデータを提供する。
論文 参考訳(メタデータ) (2020-04-21T13:31:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。