論文の概要: Variants of BERT, Random Forests and SVM approach for Multimodal
Emotion-Target Sub-challenge
- arxiv url: http://arxiv.org/abs/2007.13928v1
- Date: Tue, 28 Jul 2020 01:15:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 01:25:52.779666
- Title: Variants of BERT, Random Forests and SVM approach for Multimodal
Emotion-Target Sub-challenge
- Title(参考訳): マルチモーダル感情目標サブチェアにおけるBERT, ランダムフォレストおよびSVMアプローチのばらつき
- Authors: Hoang Manh Hung, Hyung-Jeong Yang, Soo-Hyung Kim, and Guee-Sang Lee
- Abstract要約: 本稿では,Muse-Topic Sub-Challengeの分類手法について論じる。
ALBERTとRoBERTaの2つの言語モデルをアンサンブルして10種類のトピックを予測する。
- 参考スコア(独自算出の注目度): 11.71437054341057
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Emotion recognition has become a major problem in computer vision in recent
years that made a lot of effort by researchers to overcome the difficulties in
this task. In the field of affective computing, emotion recognition has a wide
range of applications, such as healthcare, robotics, human-computer
interaction. Due to its practical importance for other tasks, many techniques
and approaches have been investigated for different problems and various data
sources. Nevertheless, comprehensive fusion of the audio-visual and language
modalities to get the benefits from them is still a problem to solve. In this
paper, we present and discuss our classification methodology for MuSe-Topic
Sub-challenge, as well as the data and results. For the topic classification,
we ensemble two language models which are ALBERT and RoBERTa to predict 10
classes of topics. Moreover, for the classification of valence and arousal, SVM
and Random forests are employed in conjunction with feature selection to
enhance the performance.
- Abstract(参考訳): 近年、コンピュータビジョンでは感情認識が大きな問題となり、この課題の難しさを克服するために研究者が多大な努力をしてきた。
情緒コンピューティングの分野では、感情認識は医療、ロボット工学、人間とコンピューターの相互作用など幅広い応用がある。
他のタスクに対する実践的な重要性から、様々な問題や様々なデータソースに対して多くの技術やアプローチが研究されている。
それでも、オーディオ視覚と言語モダリティを総合的に融合してメリットを得るというのは、まだ解決すべき問題です。
本稿では,muse-topic sub-challengeの分類法とデータと結果について考察する。
トピック分類では、ALBERTとRoBERTaの2つの言語モデルをアンサンブルして10種類のトピックを予測する。
また, 積雪林, SVM林, ランダム林が特徴選択と連動して利用され, 性能が向上した。
関連論文リスト
- A Multi-Task, Multi-Modal Approach for Predicting Categorical and
Dimensional Emotions [0.0]
分類的・次元的な感情を予測するマルチタスク・マルチモーダルシステムを提案する。
その結果,2種類の感情の相互規則化の重要性が強調された。
論文 参考訳(メタデータ) (2023-12-31T16:48:03Z) - Deep Imbalanced Learning for Multimodal Emotion Recognition in
Conversations [15.705757672984662]
会話におけるマルチモーダル感情認識(MERC)は、マシンインテリジェンスにとって重要な開発方向である。
MERCのデータの多くは自然に感情カテゴリーの不均衡な分布を示しており、研究者は感情認識に対する不均衡なデータの負の影響を無視している。
生データにおける感情カテゴリーの不均衡分布に対処するクラス境界拡張表現学習(CBERL)モデルを提案する。
我々は,IEMOCAPおよびMELDベンチマークデータセットの広範な実験を行い,CBERLが感情認識の有効性において一定の性能向上を達成したことを示す。
論文 参考訳(メタデータ) (2023-12-11T12:35:17Z) - Modality Influence in Multimodal Machine Learning [0.0]
本研究では,マルチモーダル感情分析,マルチモーダル感情認識,マルチモーダルヘイト音声認識,マルチモーダル病検出について検討した。
本研究の目的は、各タスクの最も影響力のあるモダリティやモダリティの集合を特定し、多様なマルチモーダル分類タスクの結論を引き出すことである。
論文 参考訳(メタデータ) (2023-06-10T16:28:52Z) - Machine Unlearning: A Survey [56.79152190680552]
プライバシ、ユーザビリティ、および/または忘れられる権利のために、特定のサンプルに関する情報をマシンアンラーニングと呼ばれるモデルから削除する必要がある特別なニーズが生まれている。
この新興技術は、その革新と実用性により、学者と産業の両方から大きな関心を集めている。
この複雑なトピックを分析したり、さまざまなシナリオで既存の未学習ソリューションの実現可能性を比較したりした研究はない。
この調査は、未学習のテクニックに関する卓越した問題と、新しい研究機会のための実現可能な方向性を強調して締めくくった。
論文 参考訳(メタデータ) (2023-06-06T10:18:36Z) - Vision+X: A Survey on Multimodal Learning in the Light of Data [71.07658443380264]
様々なモダリティのデータを組み込んだマルチモーダル機械学習は、ますます人気のある研究分野になりつつある。
我々は、視覚、音声、テキストなど、各データフォーマットの共通点と特異点を分析し、Vision+Xの組み合わせによって分類された技術開発を提示する。
論文 参考訳(メタデータ) (2022-10-05T13:14:57Z) - Foundations and Recent Trends in Multimodal Machine Learning:
Principles, Challenges, and Open Questions [68.6358773622615]
本稿では,マルチモーダル機械学習の計算的基礎と理論的基礎について概説する。
本稿では,表現,アライメント,推論,生成,伝達,定量化という,6つの技術課題の分類法を提案する。
最近の技術的成果は、この分類のレンズを通して示され、研究者は新しいアプローチの類似点と相違点を理解することができる。
論文 参考訳(メタデータ) (2022-09-07T19:21:19Z) - Empathetic Conversational Systems: A Review of Current Advances, Gaps,
and Opportunities [2.741266294612776]
多くの研究が共感の利点を認識し、共感を会話システムに取り入れ始めた。
本稿では,5つのレビュー次元を用いて,急速に成長するこの分野について検討する。
論文 参考訳(メタデータ) (2022-05-09T05:19:48Z) - Exploring Dimensionality Reduction Techniques in Multilingual
Transformers [64.78260098263489]
本稿では,多言語シームス変圧器の性能に及ぼす次元還元法の影響を包括的に考察する。
これは、それぞれ91.58% pm 2.59%$と54.65% pm 32.20%$の次元を平均で減少させることが可能であることを示している。
論文 参考訳(メタデータ) (2022-04-18T17:20:55Z) - Channel Exchanging Networks for Multimodal and Multitask Dense Image
Prediction [125.18248926508045]
本稿では,マルチモーダル融合とマルチタスク学習の両方に適用可能な,自己適応的でパラメータフリーなチャネル交換ネットワーク(CEN)を提案する。
CENは異なるモダリティのワーク間でチャネルを動的に交換する。
濃密な画像予測を応用するために、CENの有効性は4つの異なるシナリオで検証される。
論文 参考訳(メタデータ) (2021-12-04T05:47:54Z) - A Review on Explainability in Multimodal Deep Neural Nets [2.3204178451683264]
マルチモーダルAI技術は、いくつかのアプリケーションドメインで大きな成功を収めている。
その優れた性能にもかかわらず、深層ニューラルネットワークの複雑で不透明でブラックボックスな性質は、社会的受容と使用性を制限する。
本稿では,マルチモーダル深層ニューラルネットワークにおける説明可能性に関する包括的調査と解説を行うため,本論文を概説する。
論文 参考訳(メタデータ) (2021-05-17T14:17:49Z) - Multimodal Pretraining Unmasked: A Meta-Analysis and a Unified Framework
of Vision-and-Language BERTs [57.74359320513427]
ビジョンと言語BERTを事前訓練して、これらの2つの重要なAI領域の交差点での課題に取り組む方法が提案されている。
これら2つのカテゴリの違いについて検討し、単一の理論的枠組みの下でそれらをどのように統合できるかを示す。
5つのV&L BERT間の経験的差異を明らかにするための制御実験を行った。
論文 参考訳(メタデータ) (2020-11-30T18:55:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。