論文の概要: Prototypical Calibrating Ambiguous Samples for Micro-Action Recognition
- arxiv url: http://arxiv.org/abs/2412.14719v1
- Date: Thu, 19 Dec 2024 10:41:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-20 13:32:47.924403
- Title: Prototypical Calibrating Ambiguous Samples for Micro-Action Recognition
- Title(参考訳): マイクロアクション認識のための原型校正曖昧サンプル
- Authors: Kun Li, Dan Guo, Guoliang Chen, Chunxiao Fan, Jingyuan Xu, Zhiliang Wu, Hehe Fan, Meng Wang,
- Abstract要約: MAR(Micro-Action Recognition)は、社会的相互作用における非言語コミュニケーションの一形態として重要な役割を担っているため、注目を集めている。
現在のアプローチは、広範囲のカテゴリ範囲と微妙な視覚的差異から生じる、マイクロアクションの固有のあいまいさをしばしば見落としている。
我々は,MARのあいまいさを解消し緩和するための,新しいプロトタイプキャリブレーション・アンビグラス・ネットワーク(textbfPCAN)を提案する。
- 参考スコア(独自算出の注目度): 34.4463059961465
- License:
- Abstract: Micro-Action Recognition (MAR) has gained increasing attention due to its crucial role as a form of non-verbal communication in social interactions, with promising potential for applications in human communication and emotion analysis. However, current approaches often overlook the inherent ambiguity in micro-actions, which arises from the wide category range and subtle visual differences between categories. This oversight hampers the accuracy of micro-action recognition. In this paper, we propose a novel Prototypical Calibrating Ambiguous Network (\textbf{PCAN}) to unleash and mitigate the ambiguity of MAR. \textbf{Firstly}, we employ a hierarchical action-tree to identify the ambiguous sample, categorizing them into distinct sets of ambiguous samples of false negatives and false positives, considering both body- and action-level categories. \textbf{Secondly}, we implement an ambiguous contrastive refinement module to calibrate these ambiguous samples by regulating the distance between ambiguous samples and their corresponding prototypes. This calibration process aims to pull false negative ($\mathbb{FN}$) samples closer to their respective prototypes and push false positive ($\mathbb{FP}$) samples apart from their affiliated prototypes. In addition, we propose a new prototypical diversity amplification loss to strengthen the model's capacity by amplifying the differences between different prototypes. \textbf{Finally}, we propose a prototype-guided rectification to rectify prediction by incorporating the representability of prototypes. Extensive experiments conducted on the benchmark dataset demonstrate the superior performance of our method compared to existing approaches. The code is available at https://github.com/kunli-cs/PCAN.
- Abstract(参考訳): マイクロ・アクション認識(MAR)は、社会的相互作用における非言語コミュニケーションの一形態として重要な役割を担い、人間のコミュニケーションや感情分析への応用に有望な可能性を秘めているため、注目を集めている。
しかしながら、現在のアプローチは、広範囲のカテゴリ範囲と微妙な視覚的差異から生じる、マイクロアクションの固有のあいまいさをしばしば見落としている。
これにより、マイクロアクション認識の精度を損なう。
本稿では,MARのあいまいさを解消し緩和するための,新しいプロトタイプキャリブレーション・アンビグラス・ネットワーク(\textbf{PCAN})を提案する。
文bf{Firstly} では、階層的なアクションツリーを用いて、あいまいなサンプルを識別し、身体レベルと行動レベルの両方を考慮して、偽陰性および偽陽性のあいまいなサンプルの別個の集合に分類する。
そこで,不明瞭なサンプルとそれに対応するプロトタイプとの距離を調節することにより,これらの不明瞭なサンプルを校正するために,あいまいなコントラスト改善モジュールを実装した。
このキャリブレーションプロセスは、偽陰性(\mathbb{FN}$)サンプルをそれぞれのプロトタイプに近づけ、偽正(\mathbb{FP}$)サンプルを関連するプロトタイプから分離することを目的としている。
さらに,異なるプロトタイプ間の差異を増幅することにより,モデルの能力を高めるため,新しいプロトタイプ型多様性増幅損失を提案する。
そこで本研究では,プロトタイプの表現性を組み込んで,予測を正すためのプロトタイプ誘導整形法を提案する。
ベンチマークデータセットで行った大規模な実験は,既存手法と比較して,提案手法の優れた性能を示すものである。
コードはhttps://github.com/kunli-cs/PCANで公開されている。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Negative Prototypes Guided Contrastive Learning for WSOD [8.102080369924911]
近年,画像レベルのアノテーションのみを持つ弱監視対象検出(WSOD)が注目されている。
本稿では,Native Prototypes Guided Contrastive Learning Architectureを提案する。
提案手法は最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-06-04T08:16:26Z) - Prototypical Contrastive Learning through Alignment and Uniformity for
Recommendation [6.790779112538357]
提案するアンダーライン・アライメントとアンダーライン・ユニフォーマル性によるインダーライン型コントラスト学習について述べる。
具体的には、まず、原点グラフから異なる拡張点間の整合性を確保するために、潜時空間としてプロトタイプを提案する。
明示的な負の欠如は、インスタンスとプロトタイプ間の整合性損失を直接最適化することで、次元的な崩壊の問題が容易に生じることを意味する。
論文 参考訳(メタデータ) (2024-02-03T08:19:26Z) - Decoupled Prototype Learning for Reliable Test-Time Adaptation [50.779896759106784]
テスト時間適応(TTA)は、推論中にトレーニング済みのソースモデルをターゲットドメインに継続的に適応させるタスクである。
1つの一般的なアプローチは、推定擬似ラベルによるクロスエントロピー損失を伴う微調整モデルである。
本研究は, 各試料の分類誤差を最小化することで, クロスエントロピー損失の脆弱性がラベルノイズを引き起こすことを明らかにした。
本稿では,プロトタイプ中心の損失計算を特徴とする新しいDPL法を提案する。
論文 参考訳(メタデータ) (2024-01-15T03:33:39Z) - Deep Incomplete Multi-view Clustering with Cross-view Partial Sample and
Prototype Alignment [50.82982601256481]
深層不完全なマルチビュークラスタリングのためのクロスビュー部分サンプルとプロトタイプアライメントネットワーク(CPSPAN)を提案する。
従来のコントラストベースの手法とは異なり、インスタンスとインスタンスの対応構築を導くために、ペア観測データアライメントを「プロキシ監視信号」として採用する。
論文 参考訳(メタデータ) (2023-03-28T02:31:57Z) - Rethinking Prototypical Contrastive Learning through Alignment,
Uniformity and Correlation [24.794022951873156]
我々は、アライメント、均一性、相関(PAUC)を通して、プロトタイプ表現を学ぶことを提案する。
具体的には,(1)正の原型から埋め込みを抽出するアライメント損失,(2)原型レベルの特徴を均一に分配するアライメント損失,(3)原型レベルの特徴間の多様性と識別性を増大させる相関損失を補正する。
論文 参考訳(メタデータ) (2022-10-18T22:33:12Z) - Few-shot Forgery Detection via Guided Adversarial Interpolation [56.59499187594308]
既存の偽造検出手法は、見知らぬ新しい偽造手法に適用した場合、大幅な性能低下に悩まされる。
本稿では,数発の偽造検出問題を克服するために,GAI(Guid Adversarial Interpolation)を提案する。
我々の手法は、多数派と少数派の偽造アプローチの選択に対して堅牢であることが検証されている。
論文 参考訳(メタデータ) (2022-04-12T16:05:10Z) - Discovering Distribution Shifts using Latent Space Representations [4.014524824655106]
新しい候補データセットに対するモデルの一般化性を評価するのは簡単ではない。
埋め込み空間幾何を用いて分布シフトを検出するための非パラメトリックフレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-04T19:00:16Z) - Toward Scalable and Unified Example-based Explanation and Outlier
Detection [128.23117182137418]
我々は,試行錯誤の予測に例ベースの説明を与えることのできる,プロトタイプベースの学生ネットワークのより広範な採用を論じる。
類似カーネル以外のプロトタイプベースのネットワークは,分類精度を損なうことなく,有意義な説明と有望な外乱検出結果が得られることを示す。
論文 参考訳(メタデータ) (2020-11-11T05:58:17Z) - Fundamental Tradeoffs between Invariance and Sensitivity to Adversarial
Perturbations [65.05561023880351]
敵の例は誤分類を引き起こすために作られた悪意のある入力である。
本稿では, 相補的障害モード, 不変性に基づく逆数例について検討する。
感度に基づく攻撃に対する防御は、不変性に基づく攻撃に対するモデルの精度を積極的に損なうことを示す。
論文 参考訳(メタデータ) (2020-02-11T18:50:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。