論文の概要: A Cross-Domain Approach for Continuous Impression Recognition from
Dyadic Audio-Visual-Physio Signals
- arxiv url: http://arxiv.org/abs/2203.13932v1
- Date: Fri, 25 Mar 2022 22:40:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 17:19:08.385707
- Title: A Cross-Domain Approach for Continuous Impression Recognition from
Dyadic Audio-Visual-Physio Signals
- Title(参考訳): dyadic audio-visual-physio信号からの連続印象認識のためのクロスドメインアプローチ
- Authors: Yuanchao Li, Catherine Lai
- Abstract要約: 本稿では,Dyadic IMpressionIONデータセット上に提案したクロスドメインアーキテクチャを用いて印象認識を行う。
ドメイン間の注意は、ドメイン内およびドメイン間の関連性をキャプチャする、アテンション内およびインターアテンション機構から構成される。
提案手法は, コンピテンス次元0.770, 温暖度0.748の相関係数を得た。
- 参考スコア(独自算出の注目度): 2.6959411243976175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The impression we make on others depends not only on what we say, but also,
to a large extent, on how we say it. As a sub-branch of affective computing and
social signal processing, impression recognition has proven critical in both
human-human conversations and spoken dialogue systems. However, most research
has studied impressions only from the signals expressed by the emitter,
ignoring the response from the receiver. In this paper, we perform impression
recognition using a proposed cross-domain architecture on the dyadic IMPRESSION
dataset. This improved architecture makes use of cross-domain attention and
regularization. The cross-domain attention consists of intra- and
inter-attention mechanisms, which capture intra- and inter-domain relatedness,
respectively. The cross-domain regularization includes knowledge distillation
and similarity enhancement losses, which strengthen the feature connections
between the emitter and receiver. The experimental evaluation verified the
effectiveness of our approach. Our approach achieved a concordance correlation
coefficient of 0.770 in competence dimension and 0.748 in warmth dimension.
- Abstract(参考訳): 私たちが他人に与える印象は、私たちが何を言っているかだけでなく、その言い方にも大きく依存します。
感情コンピューティングと社会信号処理のサブブランチとして、人間と人間の会話と音声対話システムの両方において印象認識が重要であることが証明されている。
しかしながら、ほとんどの研究は、受信機からの応答を無視して、エミッターによって表現される信号からのみ印象を研究する。
本稿では,dyadicインプレッションデータセット上で提案するクロスドメインアーキテクチャを用いて印象認識を行う。
この改良されたアーキテクチャは、クロスドメインの注意と正規化を利用する。
ドメイン間の注意は、それぞれドメイン内およびドメイン間関連性をキャプチャする、アテンション内およびインターアテンション機構から構成される。
クロスドメイン正則化には、エミッタと受信機間の機能接続を強化する知識蒸留と類似性増強損失が含まれる。
本手法の有効性を実験的に検証した。
提案手法は, コンコータンス相関係数0.770, 温暖度0.748を実現した。
関連論文リスト
- Semantic Communication for Cooperative Perception using HARQ [51.148203799109304]
我々は重要セマンティック情報を抽出するために重要地図を活用し、協調的な知覚セマンティックコミュニケーションフレームワークを導入する。
周波数分割多重化(OFDM)とチャネル推定と等化戦略を併用して,時間変化によるマルチパスフェーディングによる課題に対処する。
我々は,ハイブリッド自動繰り返し要求(HARQ)の精神において,我々の意味コミュニケーションフレームワークと統合された新しい意味エラー検出手法を提案する。
論文 参考訳(メタデータ) (2024-08-29T08:53:26Z) - Benchmarking Cross-Domain Audio-Visual Deception Detection [45.342156006617394]
本稿では,最初のクロスドメイン音声・視覚的誤認検出ベンチマークを提案する。
シングル・ツー・シングルとマルチ・ツー・シングル・ドメインの一般化性能を比較した。
一般化性能を向上させるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-11T12:06:31Z) - Disentangled Interaction Representation for One-Stage Human-Object
Interaction Detection [70.96299509159981]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、人間中心の画像理解のコアタスクである。
最近のワンステージ手法では、対話予測に有用な画像ワイドキューの収集にトランスフォーマーデコーダを採用している。
従来の2段階の手法は、非絡み合いで説明可能な方法で相互作用特徴を構成する能力から大きな恩恵を受ける。
論文 参考訳(メタデータ) (2023-12-04T08:02:59Z) - A Causal Intervention Scheme for Semantic Segmentation of Quasi-periodic
Cardiovascular Signals [7.182731690965173]
フレームレベルのコントラスト的枠組みの下で,新たなトレーニングパラダイムを形成するために,コントラスト的因果介入(CCI)を提案する。
この介入は、単一の属性によってもたらされる暗黙の統計的バイアスを排除し、より客観的な表現につながる。
論文 参考訳(メタデータ) (2022-09-19T13:54:51Z) - Data-Driven Blind Synchronization and Interference Rejection for Digital
Communication Signals [98.95383921866096]
本研究では,データ駆動型深層学習手法の可能性について検討した。
本研究では,高分解能時間構造(非定常性)の取得が性能向上につながることを示す。
既製のNNと古典的検出と干渉除去の両方で改善可能なドメインインフォームドニューラルネットワーク(NN)の設計を提案する。
論文 参考訳(メタデータ) (2022-09-11T14:10:37Z) - Towards Unbiased Visual Emotion Recognition via Causal Intervention [63.74095927462]
本稿では,データセットバイアスによる負の効果を軽減するために,新しい感情認識ネットワーク(IERN)を提案する。
IERNの有効性を検証する一連の設計されたテストと、3つの感情ベンチマークの実験は、IERNが他の最先端のアプローチよりも優れていることを示した。
論文 参考訳(メタデータ) (2021-07-26T10:40:59Z) - Cross-Domain First Person Audio-Visual Action Recognition through
Relative Norm Alignment [15.545769463854915]
ファースト・パーソン・アクション・認識は、ウェアラブル・カメラの人気が高まっているため、ますます研究が進んでいるトピックである。
これは、この文脈でまだ解決されていない、軽量なドメイン横断の問題をもたらします。
本稿では,音声・視覚信号の本質的な相補性を利用して,学習中のデータによく作用する表現を学習することを提案する。
論文 参考訳(メタデータ) (2021-06-03T08:46:43Z) - DIRV: Dense Interaction Region Voting for End-to-End Human-Object
Interaction Detection [53.40028068801092]
本稿では,HOI問題に対するインタラクション領域という新しい概念に基づいて,新しい一段階HOI検出手法を提案する。
従来の手法とは異なり,本手法は人-物対ごとに異なるスケールにわたる密集した相互作用領域に焦点をあてる。
単一相互作用領域の検出欠陥を補うために,我々は新しい投票戦略を導入する。
論文 参考訳(メタデータ) (2020-10-02T13:57:58Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。