論文の概要: Affective Video Content Analysis: Decade Review and New Perspectives
- arxiv url: http://arxiv.org/abs/2310.17212v2
- Date: Thu, 18 Jan 2024 07:37:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-19 19:43:32.404275
- Title: Affective Video Content Analysis: Decade Review and New Perspectives
- Title(参考訳): 情緒的ビデオコンテンツ分析 : 十年レビューと新たな展望
- Authors: Junxiao Xue, Jie Wang, Xuecheng Wu and Qian Zhang
- Abstract要約: 情緒的ビデオコンテンツ分析(AVCA)は、感情的コンピューティングの不可欠な分野として広く研究されている。
本稿では、AVCAで広く使われている感情表現モデルを紹介し、よく使われるデータセットについて述べる。
本稿では,感情認識や世論分析などの今後の課題と今後の研究方向性について論じる。
- 参考スコア(独自算出の注目度): 4.3569033781023165
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video content is rich in semantics and has the ability to evoke various
emotions in viewers. In recent years, with the rapid development of affective
computing and the explosive growth of visual data, affective video content
analysis (AVCA) as an essential branch of affective computing has become a
widely researched topic. In this study, we comprehensively review the
development of AVCA over the past decade, particularly focusing on the most
advanced methods adopted to address the three major challenges of video feature
extraction, expression subjectivity, and multimodal feature fusion. We first
introduce the widely used emotion representation models in AVCA and describe
commonly used datasets. We summarize and compare representative methods in the
following aspects: (1) unimodal AVCA models, including facial expression
recognition and posture emotion recognition; (2) multimodal AVCA models,
including feature fusion, decision fusion, and attention-based multimodal
models; (3) model performance evaluation standards. Finally, we discuss future
challenges and promising research directions, such as emotion recognition and
public opinion analysis, human-computer interaction, and emotional
intelligence.
- Abstract(参考訳): ビデオコンテンツはセマンティクスに富み、視聴者の様々な感情を誘発する能力を持っている。
近年、情緒コンピューティングの急速な発展と視覚データの爆発的成長により、情緒的映像コンテンツ分析(AVCA)が感情的コンピューティングの重要な分野として広く研究されている。
本研究では,過去10年間のAVCA開発を包括的にレビューし,特にビデオ特徴抽出,表現主観性,マルチモーダル特徴融合の3大課題に対処するために,最も先進的な手法に注目した。
まず、AVCAで広く使われている感情表現モデルを紹介し、よく使われるデータセットを記述する。
1)表情認識と姿勢感情認識を含む単調なAVCAモデル,(2)特徴融合,決定融合,注意に基づくマルチモーダルモデルを含むマルチモーダルなAVCAモデル,(3)モデル性能評価基準。
最後に,感情認識や世論分析,人間とコンピュータのインタラクション,感情知など,今後の課題と今後の研究方向性について論じる。
関連論文リスト
- MEMO-Bench: A Multiple Benchmark for Text-to-Image and Multimodal Large Language Models on Human Emotion Analysis [53.012111671763776]
そこで本研究では、7,145枚の肖像画からなる総合的なベンチマークであるMEMO-Benchを紹介した。
以上の結果から,既存のT2Iモデルは負のモデルよりも肯定的な感情を生成するのに効果的であることが示唆された。
MLLMは人間の感情の識別と認識に一定の効果を示すが、人間のレベルの正確さには欠ける。
論文 参考訳(メタデータ) (2024-11-18T02:09:48Z) - A Novel Energy based Model Mechanism for Multi-modal Aspect-Based
Sentiment Analysis [85.77557381023617]
マルチモーダル感情分析のための新しいフレームワークDQPSAを提案する。
PDQモジュールは、プロンプトをビジュアルクエリと言語クエリの両方として使用し、プロンプト対応の視覚情報を抽出する。
EPEモジュールはエネルギーベースモデルの観点から解析対象の境界ペアリングをモデル化する。
論文 参考訳(メタデータ) (2023-12-13T12:00:46Z) - eMotions: A Large-Scale Dataset for Emotion Recognition in Short Videos [7.011656298079659]
短いビデオ(SV)が普及すると、SVにおける感情認識の必要性が生じる。
SVの感情データがないことから,27,996本のビデオからなるeMotionsという大規模データセットを導入する。
本稿では,ビデオトランスフォーマを用いて意味的関連表現をよりよく学習する,エンドツーエンドのベースライン方式AV-CPNetを提案する。
論文 参考訳(メタデータ) (2023-11-29T03:24:30Z) - A Survey on Video Diffusion Models [103.03565844371711]
AI生成コンテンツ(AIGC)の最近の波は、コンピュータビジョンでかなりの成功を収めている。
その印象的な生成能力のため、拡散モデルは徐々にGANと自動回帰変換器に基づく手法に取って代わられている。
本稿では,AIGC時代の映像拡散モデルについて概観する。
論文 参考訳(メタデータ) (2023-10-16T17:59:28Z) - How Would The Viewer Feel? Estimating Wellbeing From Video Scenarios [73.24092762346095]
情緒応答と主観的幸福感に注釈を付けた6万本以上のビデオを備えた大規模データセットを2つ導入した。
Video Cognitive Empathyデータセットには、微粒な感情応答の分布のためのアノテーションが含まれており、モデルが感情状態の詳細な理解を得ることができる。
Video to Valenceデータセットには、ビデオ間の相対的な快適性のアノテーションが含まれている。
論文 参考訳(メタデータ) (2022-10-18T17:58:25Z) - Use of Affective Visual Information for Summarization of Human-Centric
Videos [13.273989782771556]
本研究では、人間中心のビデオに対する感情情報豊かに教師付きビデオ要約タスクについて検討する。
まず、RECOLAデータセット上で視覚的入力駆動型感情認識モデル(CER-NET)を訓練し、感情特性を推定する。
次に,CER-NETの感情特性と高レベル表現を視覚情報と統合し,提案した情緒的映像要約アーキテクチャ(AVSUM)を定義する。
論文 参考訳(メタデータ) (2021-07-08T11:46:04Z) - Prior Aided Streaming Network for Multi-task Affective Recognitionat the
2nd ABAW2 Competition [9.188777864190204]
我々は第2回ABAW2コンペティション(ABAW2コンペティション)に応募する。
異なる感情表現を扱う際に,マルチタスク・ストリーミング・ネットワークを提案する。
我々は、先行知識として高度な表情埋め込みを活用している。
論文 参考訳(メタデータ) (2021-07-08T09:35:08Z) - Affective Image Content Analysis: Two Decades Review and New
Perspectives [132.889649256384]
我々は,過去20年間の情緒的イメージコンテンツ分析(AICA)の発展を包括的にレビューする。
我々は、感情的ギャップ、知覚主観性、ラベルノイズと欠如という3つの主要な課題に関して、最先端の手法に焦点を当てる。
画像の内容やコンテキスト理解,グループ感情クラスタリング,ビューアーとイメージのインタラクションなど,今後の課題や研究の方向性について論じる。
論文 参考訳(メタデータ) (2021-06-30T15:20:56Z) - Computational Emotion Analysis From Images: Recent Advances and Future
Directions [79.05003998727103]
本章では,画像感情分析(IEA)を計算的観点から導入することを目的としている。
心理学の一般的な感情表現モデルから始めます。
そして、研究者たちが解決しようとしている重要な計算問題を定義します。
論文 参考訳(メタデータ) (2021-03-19T13:33:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。