論文の概要: Learning from Label Relationships in Human Affect
- arxiv url: http://arxiv.org/abs/2207.05577v1
- Date: Tue, 12 Jul 2022 15:00:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-13 14:58:16.812222
- Title: Learning from Label Relationships in Human Affect
- Title(参考訳): 人的影響におけるラベル関係から学ぶ
- Authors: Niki Maria Foteinopoulou, Ioannis Patras
- Abstract要約: 我々は、学習を規則化し、より良い一般化をもたらす、多ラベル回帰と順序問題に対する新たなリレーショナル損失を導入する。
本研究は,精神分裂病の重症度推定問題に対する継続的影響と統合失調症重症度推定の問題について検討した。
- 参考スコア(独自算出の注目度): 13.592112044121683
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human affect and mental state estimation in an automated manner, face a
number of difficulties, including learning from labels with poor or no temporal
resolution, learning from few datasets with little data (often due to
confidentiality constraints) and, (very) long, in-the-wild videos. For these
reasons, deep learning methodologies tend to overfit, that is, arrive at latent
representations with poor generalisation performance on the final regression
task. To overcome this, in this work, we introduce two complementary
contributions. First, we introduce a novel relational loss for multilabel
regression and ordinal problems that regularises learning and leads to better
generalisation. The proposed loss uses label vector inter-relational
information to learn better latent representations by aligning batch label
distances to the distances in the latent feature space. Second, we utilise a
two-stage attention architecture that estimates a target for each clip by using
features from the neighbouring clips as temporal context. We evaluate the
proposed methodology on both continuous affect and schizophrenia severity
estimation problems, as there are methodological and contextual parallels
between the two. Experimental results demonstrate that the proposed methodology
outperforms all baselines. In the domain of schizophrenia, the proposed
methodology outperforms previous state-of-the-art by a large margin, achieving
a PCC of up to 78% performance close to that of human experts (85%) and much
higher than previous works (uplift of up to 40%). In the case of affect
recognition, we outperform previous vision-based methods in terms of CCC on
both the OMG and the AMIGOS datasets. Specifically for AMIGOS, we outperform
previous SoTA CCC for both arousal and valence by 9% and 13% respectively, and
in the OMG dataset we outperform previous vision works by up to 5% for both
arousal and valence.
- Abstract(参考訳): 人間の感情と精神状態の自動推定は、粗悪な、あるいは時間的解決のないラベルから学ぶこと、ほとんどデータを持たない少数のデータセットから学ぶこと(しばしば機密性の制約によって)、そして(非常に)細長いビデオなど、多くの困難に直面します。
これらの理由から、ディープラーニングの方法論は、最終回帰タスクの一般化性能が低い潜在表現に過剰に適合する傾向がある。
これを解決するために、本稿では2つの補完的な貢献を紹介する。
まず,多段回帰と順序問題に対する新しい関係損失を導入し,学習を規則化し,よりよい一般化に導く。
提案した損失はラベルベクトル相互関係情報を用いて、バッチラベル距離を潜在特徴空間内の距離に合わせることにより、より優れた潜在表現を学習する。
第2に,隣接するクリップの特徴を時間的文脈として使用することにより,各クリップのターゲットを推定する2段階のアテンションアーキテクチャを利用する。
提案手法は連続的影響と統合失調症の重症度推定問題の両方について評価し,両者の間には方法論的・文脈的平行性があることを示した。
実験の結果,提案手法がすべてのベースラインを上回った。
統合失調症の領域では、提案手法は従来の最先端技術よりも大きなマージンで優れており、PCCは人間の専門家(85%)よりも最大78%、以前の研究(40%)よりもはるかに高いパフォーマンスを達成している。
影響認識の場合,OMGデータセットとAMIGOSデータセットの両方において,従来のビジョンベース手法よりもCCCの方が優れていた。
特にamigosでは、arousalとvalenceの両方で以前のsoma cccを9%と13%で上回り、omgデータセットでは、arousalとvalenceの両方で、以前のビジョンワークを最大5%上回っています。
関連論文リスト
- Memory Consistency Guided Divide-and-Conquer Learning for Generalized
Category Discovery [56.172872410834664]
一般カテゴリー発見(GCD)は、半教師付き学習のより現実的で挑戦的な設定に対処することを目的としている。
メモリ一貫性を誘導する分枝・分枝学習フレームワーク(MCDL)を提案する。
本手法は,画像認識の目に見えるクラスと見えないクラスの両方において,最先端のモデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-01-24T09:39:45Z) - Estimation of individual causal effects in network setup for multiple
treatments [4.53340898566495]
個別治療効果 (ITE) の推定問題について, 複数の治療と観察データを用いて検討した。
我々は、共同創設者の共有表現を学ぶために、Graph Convolutional Networks(GCN)を採用しています。
アプローチでは、個別のニューラルネットワークを使用して、各治療の潜在的な結果を推測する。
論文 参考訳(メタデータ) (2023-12-18T06:07:45Z) - SSL-CPCD: Self-supervised learning with composite pretext-class
discrimination for improved generalisability in endoscopic image analysis [3.1542695050861544]
深層学習に基づく教師付き手法は医用画像解析において広く普及している。
大量のトレーニングデータと、目に見えないデータセットに対する一般的な問題に直面する必要がある。
本稿では,加法的角マージンを用いたパッチレベルのインスタンスグループ識別とクラス間変動のペナル化について検討する。
論文 参考訳(メタデータ) (2023-05-31T21:28:08Z) - Fairness meets Cross-Domain Learning: a new perspective on Models and
Metrics [80.07271410743806]
クロスドメイン学習(CD)とモデルフェアネスの関係について検討する。
いくつかの人口集団にまたがる顔画像と医療画像のベンチマークと、分類とローカライゼーションタスクについて紹介する。
本研究は,3つの最先端フェアネスアルゴリズムとともに,14のCDアプローチをカバーし,前者が後者に勝ることを示す。
論文 参考訳(メタデータ) (2023-03-25T09:34:05Z) - PromptCAL: Contrastive Affinity Learning via Auxiliary Prompts for
Generalized Novel Category Discovery [39.03732147384566]
Generalized Novel Category Discovery (GNCD) 設定は、既知のクラスや新しいクラスから来るラベルなしのトレーニングデータを分類することを目的としている。
本稿では,この課題に対処するために,PromptCALと呼ばれる補助視覚プロンプトを用いたコントラスト親和性学習法を提案する。
提案手法は,クラストークンと視覚的プロンプトのための既知のクラスと新しいクラスのセマンティッククラスタリングを改善するために,信頼性の高いペアワイズサンプル親和性を発見する。
論文 参考訳(メタデータ) (2022-12-11T20:06:14Z) - On Feature Learning in the Presence of Spurious Correlations [45.86963293019703]
得られた特徴表現の質は,提案手法以外の設計決定に大きく影響されていることを示す。
我々は,人気のウォーターバード,セレブの髪の色予測,WILDS-FMOW問題に関する文献で報告された最良の結果を大幅に改善した。
論文 参考訳(メタデータ) (2022-10-20T16:10:28Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Adversarial Dual-Student with Differentiable Spatial Warping for
Semi-Supervised Semantic Segmentation [70.2166826794421]
本研究では、教師なしデータ拡張を行うために、微分可能な幾何ワープを提案する。
また,平均教師数を改善するために,新しい対角的二重学習フレームワークを提案する。
我々のソリューションは、両方のデータセットで得られるパフォーマンスと最先端の結果を大幅に改善します。
論文 参考訳(メタデータ) (2022-03-05T17:36:17Z) - ACP++: Action Co-occurrence Priors for Human-Object Interaction
Detection [102.9428507180728]
ヒューマン・オブジェクト・インタラクション(HOI)検出のタスクにおける一般的な問題は、多数のHOIクラスが少数のラベル付き例しか持たないことである。
我々は、人間と物体の相互作用の間に自然の相関関係と反相関が存在することを観察した。
我々は、これらの先行知識を学習し、特に稀なクラスにおいて、より効果的な訓練に活用する手法を提案する。
論文 参考訳(メタデータ) (2021-09-09T06:02:50Z) - MET: Multimodal Perception of Engagement for Telehealth [52.54282887530756]
ビデオから人間のエンゲージメントレベルを知覚する学習ベースアルゴリズムMETを提案する。
我々はメンタルヘルス患者のエンゲージメント検出のための新しいデータセットMEDICAをリリースした。
論文 参考訳(メタデータ) (2020-11-17T15:18:38Z) - Robustly Pre-trained Neural Model for Direct Temporal Relation
Extraction [10.832917897850361]
BERT (Bidirectional Representation using Transformer) のいくつかの変種について検討した。
2012 i2b2 時間関係課題データセットのセマンティックな部分集合である直接時間関係データセットを用いて,これらの手法の評価を行った。
結果: 10倍のコーパスを含む事前学習戦略を取り入れたRoBERTaは,F値の絶対スコア(1.00スケール)を0.0864改善し,SVMモデルで達成した従来の最先端性能と比較して誤差率を24%低減した。
論文 参考訳(メタデータ) (2020-04-13T22:01:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。