論文の概要: Revealing the Invisible with Model and Data Shrinking for
Composite-database Micro-expression Recognition
- arxiv url: http://arxiv.org/abs/2006.09674v1
- Date: Wed, 17 Jun 2020 06:19:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 21:04:26.545493
- Title: Revealing the Invisible with Model and Data Shrinking for
Composite-database Micro-expression Recognition
- Title(参考訳): 複合データベースマイクロ圧縮認識のためのモデルとデータスライキングによる不可視化
- Authors: Zhaoqiang Xia, Wei Peng, Huai-Qian Khor, Xiaoyi Feng, Guoying Zhao
- Abstract要約: 入力複雑性とモデル複雑性を含む学習複雑性の影響を分析する。
より浅層構造と低分解能入力データを探索する再帰畳み込みネットワーク(RCN)を提案する。
学習可能なパラメータを増やさなくてもRCNと統合できる3つのパラメータフリーモジュールを開発した。
- 参考スコア(独自算出の注目度): 49.463864096615254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Composite-database micro-expression recognition is attracting increasing
attention as it is more practical to real-world applications. Though the
composite database provides more sample diversity for learning good
representation models, the important subtle dynamics are prone to disappearing
in the domain shift such that the models greatly degrade their performance,
especially for deep models. In this paper, we analyze the influence of learning
complexity, including the input complexity and model complexity, and discover
that the lower-resolution input data and shallower-architecture model are
helpful to ease the degradation of deep models in composite-database task.
Based on this, we propose a recurrent convolutional network (RCN) to explore
the shallower-architecture and lower-resolution input data, shrinking model and
input complexities simultaneously. Furthermore, we develop three parameter-free
modules (i.e., wide expansion, shortcut connection and attention unit) to
integrate with RCN without increasing any learnable parameters. These three
modules can enhance the representation ability in various perspectives while
preserving not-very-deep architecture for lower-resolution data. Besides, three
modules can further be combined by an automatic strategy (a neural architecture
search strategy) and the searched architecture becomes more robust. Extensive
experiments on MEGC2019 dataset (composited of existing SMIC, CASME II and SAMM
datasets) have verified the influence of learning complexity and shown that
RCNs with three modules and the searched combination outperform the
state-of-the-art approaches.
- Abstract(参考訳): 複合データベースのマイクロ表現認識は、現実のアプリケーションではより実用的であるため、注目を集めている。
複合データベースは優れた表現モデルを学ぶためにより多くのサンプルの多様性を提供するが、重要な微妙なダイナミクスはドメインシフトで失われる傾向にあり、特に深いモデルではモデルの性能が著しく低下する。
本稿では,入力複雑性とモデルの複雑さを含む学習複雑性の影響を分析し,低分解能入力データと浅層構造モデルが複合データベースタスクにおける深層モデルの劣化を緩和するのに役立つことを明らかにする。
そこで本研究では,より浅層構造と低分解能入力データ,縮小モデルと入力複雑度を同時に探索する再帰畳み込みネットワーク(RCN)を提案する。
さらに、学習可能なパラメータを増やすことなくRCNと統合する3つのパラメータフリーモジュール(広拡張、ショートカット接続、アテンションユニット)を開発する。
これら3つのモジュールは、解像度の低いデータに対する奥行きのないアーキテクチャを維持しながら、さまざまな観点で表現能力を高めることができる。
さらに、3つのモジュールを自動戦略(ニューラルアーキテクチャ探索戦略)と組み合わせることで、検索されたアーキテクチャがより堅牢になる。
MEGC2019データセット(既存のSMIC、CASME II、SAMMデータセットからなる)の大規模な実験は、学習の複雑さの影響を検証し、3つのモジュールを持つRCNと検索された組み合わせが最先端のアプローチより優れていることを示した。
関連論文リスト
- YOLO-RD: Introducing Relevant and Compact Explicit Knowledge to YOLO by Retriever-Dictionary [12.39040757106137]
この問題に対処するために,革新的なem textbfRetriever-emtextbfDictionary (RD) モジュールを導入する。
このアーキテクチャにより、YOLOベースのモデルは、データセットの洞察を含むDictionaryから機能を効率的に取得できる。
論文 参考訳(メタデータ) (2024-10-20T09:38:58Z) - Images in Discrete Choice Modeling: Addressing Data Isomorphism in
Multi-Modality Inputs [77.54052164713394]
本稿では,離散選択モデリング(DCM)と機械学習の交わりについて考察する。
本稿では,DCMフレームワーク内の従来の表型入力と同型情報を共有する高次元画像データの埋め込み結果について検討する。
論文 参考訳(メタデータ) (2023-12-22T14:33:54Z) - Serving Deep Learning Model in Relational Databases [70.53282490832189]
リレーショナルデータ上での深層学習(DL)モデルの実現は、様々な商業分野や科学分野において重要な要件となっている。
最先端のDL中心アーキテクチャは、DL計算を専用のDLフレームワークにオフロードします。
UDF中心アーキテクチャの可能性は、リレーショナルデータベース管理システム(RDBMS)内の1つ以上のテンソル計算をユーザ定義関数(UDF)にカプセル化する。
論文 参考訳(メタデータ) (2023-10-07T06:01:35Z) - Homological Convolutional Neural Networks [4.615338063719135]
本稿では,トポロジ的に制約されたネットワーク表現を通じて,データ構造構造を利用した新しいディープラーニングアーキテクチャを提案する。
5つの古典的な機械学習モデルと3つのディープラーニングモデルに対して、18のベンチマークデータセットでモデルをテストします。
論文 参考訳(メタデータ) (2023-08-26T08:48:51Z) - General-Purpose Multimodal Transformer meets Remote Sensing Semantic
Segmentation [35.100738362291416]
マルチモーダルAIは、特にセマンティックセグメンテーションのような複雑なタスクのために、補完的なデータソースを活用する。
汎用マルチモーダルネットワークの最近のトレンドは、最先端の性能を達成する大きな可能性を示している。
本稿では,3次元畳み込みを利用して重要なローカル情報をエンコードし,同時にモーダルな特徴を学習するUNet型モジュールを提案する。
論文 参考訳(メタデータ) (2023-07-07T04:58:34Z) - Neural Attentive Circuits [93.95502541529115]
我々は、NAC(Neural Attentive Circuits)と呼ばれる汎用的でモジュラーなニューラルアーキテクチャを導入する。
NACは、ドメイン知識を使わずに、ニューラルネットワークモジュールのパラメータ化と疎結合を学習する。
NACは推論時に8倍のスピードアップを達成するが、性能は3%以下である。
論文 参考訳(メタデータ) (2022-10-14T18:00:07Z) - Adversarial Audio Synthesis with Complex-valued Polynomial Networks [60.231877895663956]
音声における時間周波数(TF)表現は、実数値ネットワークとしてますますモデル化されている。
我々は,このような複雑な数値表現を自然な方法で統合するAPOLLOと呼ばれる複雑な数値ネットワークを導入する。
APOLLOは、音声生成におけるSC09の最先端拡散モデルよりも17.5%$改善され、8.2%ドルとなる。
論文 参考訳(メタデータ) (2022-06-14T12:58:59Z) - Triple-level Model Inferred Collaborative Network Architecture for Video
Deraining [43.06607185181434]
我々は,協調最適化と自動探索機構を用いてネットワークアーキテクチャを推定するモデル誘導三段階最適化フレームワークを開発した。
我々のモデルは、最先端の作業よりも忠実度と時間的一貫性が著しく向上したことを示している。
論文 参考訳(メタデータ) (2021-11-08T13:09:00Z) - Deep Submodular Networks for Extractive Data Summarization [0.46898263272139784]
本稿では,要約問題に対するエンドツーエンド学習フレームワークを提案する。
Deep Submodular Networks (DSN)フレームワークは、スクラッチから要約に適した機能を学ぶために使用できる。
特に,DSNはオフ・ザ・シェルフ機能を用いて,単純な混合モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-16T19:06:15Z) - When Residual Learning Meets Dense Aggregation: Rethinking the
Aggregation of Deep Neural Networks [57.0502745301132]
我々は,グローバルな残差学習と局所的なマイクロセンスアグリゲーションを備えた新しいアーキテクチャであるMicro-Dense Netsを提案する。
我々のマイクロセンスブロックはニューラルアーキテクチャ検索に基づくモデルと統合して性能を向上させることができる。
論文 参考訳(メタデータ) (2020-04-19T08:34:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。