論文の概要: SeLiNet: Sentiment enriched Lightweight Network for Emotion Recognition
in Images
- arxiv url: http://arxiv.org/abs/2307.02773v1
- Date: Thu, 6 Jul 2023 04:49:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-07 15:02:55.239350
- Title: SeLiNet: Sentiment enriched Lightweight Network for Emotion Recognition
in Images
- Title(参考訳): SeLiNet:画像の感情認識のための高密度軽量ネットワーク
- Authors: Tuneer Khargonkar, Shwetank Choudhary, Sumit Kumar, Barath Raj KR
- Abstract要約: 本稿では、感情に富んだ軽量ネットワークSeLiNetと、画像の文脈的感情認識のためのエンド・ツー・エンド・デバイスパイプラインを提案する。
SeLiNetモデルは、身体特徴抽出器、画像美学特徴抽出器、学習ベース融合ネットワークで構成され、個別の感情と人間の感情を共同で推定する。
- 参考スコア(独自算出の注目度): 1.5070398746522742
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we propose a sentiment-enriched lightweight network SeLiNet
and an end-to-end on-device pipeline for contextual emotion recognition in
images. SeLiNet model consists of body feature extractor, image aesthetics
feature extractor, and learning-based fusion network which jointly estimates
discrete emotion and human sentiments tasks. On the EMOTIC dataset, the
proposed approach achieves an Average Precision (AP) score of 27.17 in
comparison to the baseline AP score of 27.38 while reducing the model size by
>85%. In addition, we report an on-device AP score of 26.42 with reduction in
model size by >93% when compared to the baseline.
- Abstract(参考訳): 本稿では,感情に富んだ軽量ネットワークSeLiNetと,画像の文脈的感情認識のためのエンド・ツー・エンド・デバイス・パイプラインを提案する。
SeLiNetモデルは、身体特徴抽出器、画像美学特徴抽出器、学習ベース融合ネットワークから構成され、個別の感情と人間の感情を共同で推定する。
EMOTICデータセットでは,ベースラインAPスコアの27.38に対して平均精度(AP)スコアの27.17を達成し,モデルサイズを85%削減する。
さらに,ベースラインと比較してモデルサイズが93%以上減少する26.42点のオンデバイスapスコアを報告した。
関連論文リスト
- Learning from Models and Data for Visual Grounding [55.21937116752679]
データ駆動学習と様々な大規模事前学習モデルからの知識伝達を組み合わせたフレームワークであるSynGroundを紹介する。
マスク注意目的を最適化することにより、トレーニング済みの視覚・言語モデルをこのデータセット上に微調整する。
得られたモデルは、既成のビジョン・アンド・ランゲージモデルの接地能力を向上する。
論文 参考訳(メタデータ) (2024-03-20T17:59:43Z) - A Light-weight Deep Learning Model for Remote Sensing Image
Classification [70.66164876551674]
リモートセンシング画像分類(RSIC)のための高性能で軽量なディープラーニングモデルを提案する。
NWPU-RESISC45ベンチマークで広範な実験を行うことで、提案した教師学生モデルは最先端システムより優れている。
論文 参考訳(メタデータ) (2023-02-25T09:02:01Z) - Segmentation of Weakly Visible Environmental Microorganism Images Using
Pair-wise Deep Learning Features [7.837413642215894]
本研究では,Pairwise Deep Learning Feature Network (PDLF-Net)を提案する。
PDLFを使用することで、各画像の対角深層学習機能をベースモデルのSegNetの異なるブロックに結合することにより、ネットワークはフォアグラウンド(EM)にもっと集中することができる。
PDLF-Netは89.24%、63.20%、77.27%、35.15%、89.72%、91.44%、89.30%という優れたセグメンテーション結果を達成する。
論文 参考訳(メタデータ) (2022-08-31T16:37:52Z) - ORCNet: A context-based network to simultaneously segment the ocular
region components [2.129671134410228]
我々は、Ocular Region Context Network (ORCNet)という新しいコンテキストベースのセグメンテーション手法を提案する。
PCロスは、グラウンド真実とセグメンテッドマスクとのパーセンテージ差値を用いて、ネットワークのセグメンテーション損失を罰する。
提案手法は,iris, sclera, ALL (iris + sclera) セグメンテーションの評価シナリオにおいて有望な結果を得た。
論文 参考訳(メタデータ) (2022-04-15T13:31:06Z) - Focal Modulation Networks [105.93086472906765]
自己注意(SA)は完全に焦点変調ネットワーク(FocalNet)に置き換えられる
ImageNet-1Kの精度は82.3%、83.9%である。
FocalNetsは下流のタスクに転送する際、顕著な優位性を示す。
論文 参考訳(メタデータ) (2022-03-22T17:54:50Z) - TENT: Efficient Quantization of Neural Networks on the tiny Edge with
Tapered FixEd PoiNT [3.6048665052465663]
TinyMLモデルにおけるテーパー固定点数値フォーマットの利点を活用するために、新しい低精度フレームワークTENTを提案します。
本稿では,数値フォーマットの動的範囲と分布を,各層におけるディープニューラルネットワークモデルのパラメータ分布とマッチングするテーパ付き固定点量子化アルゴリズムを提案する。
その結果,convnetおよびresnet-18モデルでは,固定点と比較してエネルギーオーバーヘッドが17~30%と,分類タスクの精度が最大31%向上した。
論文 参考訳(メタデータ) (2021-04-06T01:54:32Z) - Bottleneck Transformers for Visual Recognition [97.16013761605254]
視覚タスクに自己注意を組み込んだ強力なバックボーンアーキテクチャであるBoTNetを提案する。
我々は、ImageNetベンチマークにおいて84.7%のトップ1の精度で高いパフォーマンスを達成するモデルを提案する。
私たちのシンプルで効果的なアプローチが、将来のビジョンのための自己注意モデル研究の強力なベースラインになることを期待しています。
論文 参考訳(メタデータ) (2021-01-27T18:55:27Z) - Road Segmentation for Remote Sensing Images using Adversarial Spatial
Pyramid Networks [28.32775611169636]
合成画像生成と道路分割に構造化領域適応を適用した新しいモデルを提案する。
マルチレベルの特徴マップから学び、特徴のセマンティクスを改善するために、新しいスケールワイズアーキテクチャが導入された。
我々のモデルは、14.89Mパラメータと86.78B FLOPを持つマサチューセッツのデータセット上で、最先端の78.86 IOUを達成し、4倍少ないFLOPを持つが、より高精度(+3.47% IOU)である。
論文 参考訳(メタデータ) (2020-08-10T11:00:19Z) - Pairwise Relation Learning for Semi-supervised Gland Segmentation [90.45303394358493]
病理組織像における腺分節に対するPRS2モデルを提案する。
このモデルはセグメンテーションネットワーク(S-Net)とペア関係ネットワーク(PR-Net)から構成される。
我々は,GlaSデータセットの最近の5つの手法とCRAGデータセットの最近の3つの手法を比較した。
論文 参考訳(メタデータ) (2020-08-06T15:02:38Z) - EPNet: Enhancing Point Features with Image Semantics for 3D Object
Detection [60.097873683615695]
我々は,複数のセンサの活用を含む,3次元検出タスクにおける2つの重要な課題に対処することを目指している。
本稿では,画像アノテーションを使わずに,意味的な画像特徴をポイントワイズで拡張する新たな融合モジュールを提案する。
これら2つのコンポーネントを統合するために,EPNetというエンドツーエンドで学習可能なフレームワークを設計する。
論文 参考訳(メタデータ) (2020-07-17T09:33:05Z) - Grafted network for person re-identification [14.372506245952383]
畳み込みニューラルネットワークは、人物再同定(re-ID)において顕著な効果を示した
本稿では,高精度根茎と軽量シオンをグラフトした新しいグラフトネットワーク(GraftedNet)を提案する。
実験の結果、GraftedNetはランキング1で93.02%、85.3%、76.2%、mAPで81.6%、74.7%、71.6%を達成した。
論文 参考訳(メタデータ) (2020-06-02T22:33:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。