論文の概要: A Multi-stream Convolutional Neural Network for Micro-expression
Recognition Using Optical Flow and EVM
- arxiv url: http://arxiv.org/abs/2011.03756v2
- Date: Tue, 10 Nov 2020 10:34:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 22:53:39.248468
- Title: A Multi-stream Convolutional Neural Network for Micro-expression
Recognition Using Optical Flow and EVM
- Title(参考訳): 光フローとevmを用いたマイクロ表現認識のためのマルチストリーム畳み込みニューラルネットワーク
- Authors: Jinming Liu, Ke Li, Baolin Song, Li Zhao
- Abstract要約: マイクロ・エクスプレッション(ME)の認識は、特に公共の安全や心理療法において、幅広い応用において重要な役割を担っている。
近年,従来の手法は機械学習設計に過度に依存しており,その実用化に十分な認識率は得られていない。
本稿では,ME認識のためのマルチストリーム畳み込みニューラルネットワーク(MSCNN)を設計する。
- 参考スコア(独自算出の注目度): 7.511596258731931
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Micro-expression (ME) recognition plays a crucial role in a wide range of
applications, particularly in public security and psychotherapy. Recently,
traditional methods rely excessively on machine learning design and the
recognition rate is not high enough for its practical application because of
its short duration and low intensity. On the other hand, some methods based on
deep learning also cannot get high accuracy due to problems such as the
imbalance of databases. To address these problems, we design a multi-stream
convolutional neural network (MSCNN) for ME recognition in this paper.
Specifically, we employ EVM and optical flow to magnify and visualize subtle
movement changes in MEs and extract the masks from the optical flow images. And
then, we add the masks, optical flow images, and grayscale images into the
MSCNN. After that, in order to overcome the imbalance of databases, we added a
random over-sampler after the Dense Layer of the neural network. Finally,
extensive experiments are conducted on two public ME databases: CASME II and
SAMM. Compared with many recent state-of-the-art approaches, our method
achieves more promising recognition results.
- Abstract(参考訳): マイクロ・エクスプレッション(ME)の認識は、特に公共の安全や心理療法において、幅広い応用において重要な役割を果たす。
近年,従来の手法は機械学習設計を過度に頼りすぎており,認識速度が短かったり強度が低かったりするため,実用化には不十分である。
一方,深層学習に基づく手法では,データベースの不均衡などの問題により高い精度が得られない場合もある。
これらの問題に対処するため,本稿では,ME認識のためのマルチストリーム畳み込みニューラルネットワーク(MSCNN)を設計する。
具体的には,esmとオプティカルフローを用いて,mesの微妙な動き変化を拡大可視化し,光フロー画像からマスクを抽出する。
そして、マスク、光学フロー画像、グレースケール画像をMSCNNに追加します。
その後、データベースの不均衡を克服するために、ニューラルネットワークのDense Layerの後、ランダムなオーバーサンプルを追加しました。
最後に、CASME IIとSAMMの2つのパブリックMEデータベース上で広範な実験を行う。
近年の最先端手法と比較すると,より有望な認識結果が得られる。
関連論文リスト
- Multi-frequency Electrical Impedance Tomography Reconstruction with Multi-Branch Attention Image Prior [12.844329463661857]
多周波電気インピーダンストモグラフィ(mfEIT)は有望なバイオメディカルイメージング技術である。
現在の最先端(SOTA)アルゴリズムは、教師付き学習と多元計測ベクトル(MMV)に依存しており、広範なトレーニングデータを必要とする。
我々は,mfEIT再構成のためのマルチブランチ注意画像優先(MAIP)に基づく新しい教師なし学習手法を提案する。
論文 参考訳(メタデータ) (2024-09-17T00:06:03Z) - Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.404644401997736]
本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2024-08-28T10:07:17Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Disruptive Autoencoders: Leveraging Low-level features for 3D Medical
Image Pre-training [51.16994853817024]
本研究は、3Dラジオグラフィ画像のための効果的な事前学習フレームワークの設計に焦点をあてる。
ローカルマスキングと低レベルの摂動の組み合わせによって生成された破壊から、オリジナルのイメージを再構築しようとする事前トレーニングフレームワークであるDisruptive Autoencodersを紹介する。
提案する事前トレーニングフレームワークは、複数のダウンストリームタスクでテストされ、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-07-31T17:59:42Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Unsupervised Domain Transfer with Conditional Invertible Neural Networks [83.90291882730925]
条件付き可逆ニューラルネットワーク(cINN)に基づくドメイン転送手法を提案する。
提案手法は本質的に,その可逆的アーキテクチャによるサイクル一貫性を保証し,ネットワークトレーニングを最大限効率的に行うことができる。
提案手法は,2つの下流分類タスクにおいて,現実的なスペクトルデータの生成を可能にし,その性能を向上する。
論文 参考訳(メタデータ) (2023-03-17T18:00:27Z) - LWGNet: Learned Wirtinger Gradients for Fourier Ptychographic Phase
Retrieval [14.588976801396576]
本稿では,フォワードイメージングシステムの知識と深層データ駆動ネットワークを組み合わせたハイブリッドモデル駆動残差ネットワークを提案する。
従来のアンローリング技術とは異なり、LWGNetは従来のディープ・ラーニング・テクニックよりも少ない段数しか使用していない。
この低ビット深度・低コストセンサの性能向上は、FPM撮像装置のコストを大幅に下げる可能性がある。
論文 参考訳(メタデータ) (2022-08-08T17:22:54Z) - SiPRNet: End-to-End Learning for Single-Shot Phase Retrieval [8.820823270160695]
畳み込みニューラルネットワーク(CNN)は、様々な画像再構成タスクにおいて重要な役割を果たしている。
本稿では,1つのフーリエ強度測定から信号を取得するために,SiPRNetという新しいCNN構造を設計する。
提案手法は、シングルショットマスクレス位相検索において、他のCNNおよび従来の最適化手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2022-05-23T16:24:52Z) - Intelligent Masking: Deep Q-Learning for Context Encoding in Medical
Image Analysis [48.02011627390706]
我々は,対象地域を排除し,事前訓練の手順を改善する,新たな自己指導型アプローチを開発した。
予測モデルに対してエージェントを訓練することで、下流の分類タスクで抽出した意味的特徴を大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-03-25T19:05:06Z) - Multiscale Convolutional Transformer with Center Mask Pretraining for
Hyperspectral Image Classificationtion [14.33259265286265]
本稿では,空間スペクトル情報の効率的な抽出を実現するために,高スペクトル画像(HSI)のための高速多スケール畳み込みモジュールを提案する。
マスクオートエンコーダと同様に、我々の事前学習法は、エンコーダ内の中央画素の対応するトークンのみをマスクし、残りのトークンをデコーダに入力し、中央画素のスペクトル情報を再構成する。
論文 参考訳(メタデータ) (2022-03-09T14:42:26Z) - Deep Residual Dense U-Net for Resolution Enhancement in Accelerated MRI
Acquisition [19.422926534305837]
本稿では,MRIの高速化による高画質画像の再構成を目的としたディープラーニング手法を提案する。
具体的には、畳み込みニューラルネットワーク(CNN)を用いて、エイリアス画像と元の画像の違いを学習する。
ダウンサンプリングされたk空間データの特異性を考慮すると、与えられたk空間データを効果的に活用する学習における損失関数に新しい用語を導入する。
論文 参考訳(メタデータ) (2020-01-13T19:01:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。