論文の概要: AFFAKT: A Hierarchical Optimal Transport based Method for Affective Facial Knowledge Transfer in Video Deception Detection
- arxiv url: http://arxiv.org/abs/2412.08965v1
- Date: Thu, 12 Dec 2024 05:57:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-13 13:34:01.492740
- Title: AFFAKT: A Hierarchical Optimal Transport based Method for Affective Facial Knowledge Transfer in Video Deception Detection
- Title(参考訳): AFFAKT:映像認識における顔情報伝達の階層的最適移動法
- Authors: Zihan Ji, Xuetao Tian, Ye Liu,
- Abstract要約: 本稿では,AFFAKTと呼ばれる新しい手法を提案する。この手法は,大規模な表情データセットから有用な知識と相関した知識を伝達することにより,分類性能を向上させる。
2つの偽造検出データセットの実験結果から,提案手法の優れた性能が示された。
- 参考スコア(独自算出の注目度): 3.920204205770502
- License:
- Abstract: The scarcity of high-quality large-scale labeled datasets poses a huge challenge for employing deep learning models in video deception detection. To address this issue, inspired by the psychological theory on the relation between deception and expressions, we propose a novel method called AFFAKT in this paper, which enhances the classification performance by transferring useful and correlated knowledge from a large facial expression dataset. Two key challenges in knowledge transfer arise: 1) \textit{how much} knowledge of facial expression data should be transferred and 2) \textit{how to} effectively leverage transferred knowledge for the deception classification model during inference. Specifically, the optimal relation mapping between facial expression classes and deception samples is firstly quantified using proposed H-OTKT module and then transfers knowledge from the facial expression dataset to deception samples. Moreover, a correlation prototype within another proposed module SRKB is well designed to retain the invariant correlations between facial expression classes and deception classes through momentum updating. During inference, the transferred knowledge is fine-tuned with the correlation prototype using a sample-specific re-weighting strategy. Experimental results on two deception detection datasets demonstrate the superior performance of our proposed method. The interpretability study reveals high associations between deception and negative affections, which coincides with the theory in psychology.
- Abstract(参考訳): 高品質な大規模ラベル付きデータセットの不足は、ビデオ偽造検出にディープラーニングモデルを採用する上で大きな課題となる。
そこで本稿では, 嘘と表情の関係に関する心理学的理論から着想を得た, AFFAKTと呼ばれる新しい手法を提案する。
知識伝達における2つの重要な課題が生じる。
1)顔表情データの知識を移譲すべきである。
2) \textit{how to} は推論中の偽装分類モデルの伝達知識を効果的に活用する。
具体的には、まず、提案したH-OTKTモジュールを用いて、表情クラスと偽装サンプルの最適関係マッピングを定量化し、その後、表情データセットからの知識を偽装サンプルに転送する。
さらに,別のモジュールSRKB内の相関プロトタイプは,モーメント更新による表情クラスと欺取クラスとの不変な相関を維持するためによく設計されている。
推論中は、サンプル固有の再重み付け戦略を用いて、伝達された知識を相関プロトタイプで微調整する。
2つの偽造検出データセットの実験結果から,提案手法の優れた性能が示された。
解釈可能性の研究は、心理学の理論と一致する偽りと否定的な愛情の間に高い関連性を示す。
関連論文リスト
- T-KAER: Transparency-enhanced Knowledge-Augmented Entity Resolution Framework [2.8894038270224858]
本稿では、Transparency-enhanced Knowledge-Augmented Entity ResolutionフレームワークであるT-KAERを紹介する。
透明性を高めるため、3つの透明性関連質問(T-Qs)が提案されている。
T-Qに対処するため、T-KAERはログファイル内のエンティティ解決プロセスを文書化することで透明性を向上させるように設計されている。
論文 参考訳(メタデータ) (2024-09-30T20:32:12Z) - Knowledge-Aided Semantic Communication Leveraging Probabilistic Graphical Modeling [6.754511772924184]
確率的グラフィカルモデル(PGM)に基づく意味コミュニケーション手法を提案する。
種々の意味的特徴の重要性を評価し,予測可能な意味情報の部分を除去するPGMに基づく圧縮アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-08T14:50:48Z) - Leveraging Variation Theory in Counterfactual Data Augmentation for Optimized Active Learning [19.962212551963383]
アクティブラーニング(AL)は、モデルがユーザフィードバックからインタラクティブに学習することを可能にする。
本稿では,ALに反実データ拡張手法を提案する。
論文 参考訳(メタデータ) (2024-08-07T14:55:04Z) - Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Harnessing Diffusion Models for Visual Perception with Meta Prompts [68.78938846041767]
本稿では,視覚知覚タスクの拡散モデルを用いた簡易かつ効果的な手法を提案する。
学習可能な埋め込み(メタプロンプト)を事前学習した拡散モデルに導入し、知覚の適切な特徴を抽出する。
提案手法は,NYU 深度 V2 と KITTI の深度推定タスク,および CityScapes のセマンティックセグメンテーションタスクにおいて,新しい性能記録を実現する。
論文 参考訳(メタデータ) (2023-12-22T14:40:55Z) - CLIP-based Synergistic Knowledge Transfer for Text-based Person
Retrieval [66.93563107820687]
個人検索(TPR)のためのCLIPベースのSynergistic Knowledge Transfer(CSKT)アプローチを提案する。
入力側でCLIPの知識を探索するために、まず、テキスト・ツー・イメージと画像・ツー・テキストの双方向プロンプトと結合プロンプトによって構築された双方向プロンプト転送(BPT)モジュールを提案する。
CSKTは、トレーニングパラメータがモデル全体の7.4%を占めるだけで、3つのベンチマークデータセットで最先端のアプローチを上回っている。
論文 参考訳(メタデータ) (2023-09-18T05:38:49Z) - Implicit Counterfactual Data Augmentation for Robust Learning [24.795542869249154]
本研究では, 突発的相関を除去し, 安定した予測を行うために, インプリシト・カウンセショナル・データ拡張法を提案する。
画像とテキストのデータセットをカバーする様々なバイアス付き学習シナリオで実験が行われてきた。
論文 参考訳(メタデータ) (2023-04-26T10:36:40Z) - The Overlooked Classifier in Human-Object Interaction Recognition [82.20671129356037]
クラス間の意味的相関を分類ヘッドにエンコードし,重みをHOIの言語埋め込みで初期化する。
我々は,LSE-Sign という新しい損失を,長い尾を持つデータセット上でのマルチラベル学習を強化するために提案する。
我々は,物体検出と人間のポーズを明確なマージンで求める最先端技術よりも優れた,検出不要なHOI分類を可能にする。
論文 参考訳(メタデータ) (2022-03-10T23:35:00Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Context Decoupling Augmentation for Weakly Supervised Semantic
Segmentation [53.49821324597837]
微調整されたセマンティックセグメンテーションは、近年深く研究されている困難な問題です。
本稿では、オブジェクトが現れる固有のコンテキストを変更する Context Decoupling Augmentation (CDA) メソッドを紹介します。
提案手法の有効性を検証するため, PASCAL VOC 2012データセットにいくつかの代替ネットワークアーキテクチャを用いた広範な実験を行い, CDAが様々なWSSS手法を新たな最先端技術に拡張できることを実証した。
論文 参考訳(メタデータ) (2021-03-02T15:05:09Z) - Transductive Zero-Shot Learning by Decoupled Feature Generation [30.664199050468472]
本稿では,未確認のクラスからの未表示の視覚データを利用できるトランスダクティブ・セッティングに着目する。
本稿では,現実的な視覚的特徴を生成し,意味的属性を視覚的手がかりに変換するタスクを分離することを提案する。
本研究は,提案手法の有効性を解明する上で,関連する最先端技術に対する優位性を実証するための詳細なアブレーション研究である。
論文 参考訳(メタデータ) (2021-02-05T16:17:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。