論文の概要: UAU-Net: Uncertainty-aware Representation Learning and Evidential Classification for Facial Action Unit Detection
- arxiv url: http://arxiv.org/abs/2604.21227v1
- Date: Thu, 23 Apr 2026 02:47:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.262815
- Title: UAU-Net: Uncertainty-aware Representation Learning and Evidential Classification for Facial Action Unit Detection
- Title(参考訳): UAU-Net: 顔行動単位検出のための不確実性認識表現学習と証拠分類
- Authors: Yuze Li, Zhilei Liu,
- Abstract要約: UAU-Netは不確実性を認識したAU検出フレームワークで、両方の段階で不確実性を明示的にモデル化する。
BP4DとdisFAの実験により、UAU-Netは強力なAU検出性能を発揮することが示された。
- 参考スコア(独自算出の注目度): 9.627381138509422
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial action unit (AU) detection remains challenging because it involves heterogeneous, AU-specific uncertainties arising at both the representation and decision stages. Recent methods have improved discriminative feature learning, but they often treat the AU representations as deterministic, overlooking uncertainty caused by visual noise, subject-dependent appearance variations, and ambiguous inter-AU relationships, all of which can substantially degrade robustness. Meanwhile, conventional point-estimation classifiers often provide poorly calibrated confidence, producing overconfident predictions, especially under the severe label imbalance typical of AU datasets. We propose UAU-Net, an Uncertainty-aware AU detection framework that explicitly models uncertainty at both stages. At the representation stage, we introduce CV-AFE, a conditional VAE (CVAE)-based AU feature extraction module that learns probabilistic AU representations by jointly estimating feature means and variances across multiple spatio-temporal scales; conditioning on AU labels further enables CV-AFE to capture uncertainty associated with inter-AU dependencies. At the decision stage, we design AB-ENN, an Asymmetric Beta Evidential Neural Network for multi-label AU detection, which parameterizes predictive uncertainty with Beta distributions and mitigates overconfidence via an asymmetric loss tailored to highly imbalanced binary labels. Extensive experiments on BP4D and DISFA show that UAU-Net achieves strong AU detection performance, and further analyses indicate that modeling uncertainty in both representation learning and evidential prediction improves robustness and reliability.
- Abstract(参考訳): 顔行動単位(AU)の検出は、表現と決定段階の両方で生じる異質なAU固有の不確実性を含むため、依然として困難である。
近年, 識別的特徴学習が改良されているが, 視覚ノイズ, 主観的外見の変化, あいまいなAU関係による不確かさを克服し, AU表現を決定論的に扱うことが多く, いずれも頑健さを著しく低下させる可能性がある。
一方、従来の点推定分類器は精度が低く、特にAUデータセットの重大なラベルの不均衡の下では、自信過剰な予測をもたらすことが多い。
両段階で不確実性を明示的にモデル化する不確実性認識型AU検出フレームワークであるUAU-Netを提案する。
本稿では,複数の時空間スケールにまたがる特徴手段と分散を共同で推定することにより,確率的AU表現を学習する条件付きVAE(CVAE)ベースのAU特徴抽出モジュールであるCV-AFEを紹介する。
決定段階では、多ラベルAU検出のための非対称ベータ証拠ニューラルネットワークAB-ENNを設計し、ベータ分布との予測の不確かさをパラメータ化し、高度に不均衡なバイナリラベルに調整された非対称損失による過信を軽減する。
BP4DとDisFAの大規模な実験により、UAU-Netは強力なAU検出性能を示し、さらに、表現学習と明らかな予測の両方におけるモデリングの不確実性により、堅牢性と信頼性が向上することを示した。
関連論文リスト
- Complementing Self-Consistency with Cross-Model Disagreement for Uncertainty Quantification [41.04503562937318]
大規模言語モデル(LLM)は、しばしば自信を持って不正確な応答を生成する。
AU(aleatoric uncertainty)を推定するための自己整合性は、モデルが過信されているときに崩壊する。
AUが低い場合, モデル間のセマンティックな不一致が, 正確な解に対して高いことを示す。
論文 参考訳(メタデータ) (2026-04-18T19:00:27Z) - Towards Trustworthy Depression Estimation via Disentangled Evidential Learning [50.22167852149165]
EviDepはうつ病の重症度を共同で定量化する明らかな学習フレームワークである。
EviDepは、堅牢な証拠合成を保証するために厳密な情報整合性を強制する。
最先端の予測精度と優れた不確実性校正を実現し、信頼できる臨床スクリーニングのための堅牢なフェールセーフメカニズムを提供する。
論文 参考訳(メタデータ) (2026-04-17T13:27:11Z) - Rethinking Uncertainty Quantification and Entanglement in Image Segmentation [8.952491535016444]
不確実性(UQ)は、医療画像セグメンテーションのような安全上重要な応用において重要である。
AU(確率的UNet、拡散など)やEU(アンサンブル、MCDropoutなど)のモデリングには多くの方法があるが、どのように相互作用するかは定かではない。
本稿では、幅広いAU-EUモデルの組み合わせを網羅した総合的な実証研究を行い、不確実性の絡み合いを定量化するための指標を提案し、下流UQタスクの両方を評価する。
論文 参考訳(メタデータ) (2026-03-19T11:43:26Z) - Agentic Uncertainty Quantification [76.94013626702183]
本稿では,言語化された不確実性をアクティブな双方向制御信号に変換する統合されたデュアルプロセスエージェントUQ(AUQ)フレームワークを提案する。
システム1(Uncertainty-Aware Memory, UAM)とシステム2(Uncertainty-Aware Reflection, UAR)は、これらの説明を合理的な手段として利用し、必要な時にのみターゲットの推論時間解決をトリガーする。
論文 参考訳(メタデータ) (2026-01-22T07:16:26Z) - Decision-Aware Trust Signal Alignment for SOC Alert Triage [0.0]
本稿では,SOC警告トリアージの信頼信号対応方式を提案する。
このフレームワークは、調整済みの信頼性、軽量不確実性、そしてコストに敏感な決定しきい値をコヒーレントな決定支持層に組み合わせている。
信頼度が不一致な表示によって偽陰性が大幅に増幅されるのに対し、コスト重み付き損失は決定整合信頼信号を持つモデル間での桁違いに減少することを示す。
論文 参考訳(メタデータ) (2026-01-08T01:41:54Z) - Towards Adversarial Robustness and Uncertainty Quantification in DINOv2-based Few-Shot Anomaly Detection [6.288045889067255]
DINOv2のような基礎モデルは、数発の異常検出において強い性能を示している。
本研究は, 敵攻撃と不確実性評価に関する最初の体系的研究である。
生の異常スコアは校正が不十分で、信頼性と正しさのギャップが明らかになり、安全クリティカルな使用が制限されることがわかりました。
論文 参考訳(メタデータ) (2025-10-15T15:06:45Z) - FADEL: Uncertainty-aware Fake Audio Detection with Evidential Deep Learning [9.960675988638805]
顕在学習を用いた偽音声検出(FADEL)という新しいフレームワークを提案する。
FADELはモデルの不確実性を予測に組み込んでおり、OODシナリオではより堅牢なパフォーマンスを実現している。
本研究では,異なるスプーフィングアルゴリズム間の平均不確かさと等誤差率(EER)の強い相関関係を解析し,不確かさ推定の有効性を示す。
論文 参考訳(メタデータ) (2025-04-22T07:40:35Z) - Facial Action Unit Detection by Adaptively Constraining Self-Attention and Causally Deconfounding Sample [53.23474626420103]
顔行動単位(AU)検出は、AUの微妙さ、ダイナミクス、多様性のため、依然として困難な課題である。
本稿では,自己注意重み分布を適応的に制限することで,AC2Dと呼ばれる新しいAU検出フレームワークを提案する。
提案手法は,最先端のAU検出手法と比較して,挑戦的なベンチマークによる競合性能を実現する。
論文 参考訳(メタデータ) (2024-10-02T05:51:24Z) - Be Your Own Neighborhood: Detecting Adversarial Example by the
Neighborhood Relations Built on Self-Supervised Learning [64.78972193105443]
本稿では,予測に有効な新しいAE検出フレームワークを提案する。
AEの異常な関係と拡張バージョンを区別して検出を行う。
表現を抽出し、ラベルを予測するために、既製の自己監視学習(SSL)モデルが使用される。
論文 参考訳(メタデータ) (2022-08-31T08:18:44Z) - Uncertainty-Driven Action Quality Assessment [11.958132175629368]
本稿では,複数の判定スコアの多様性を捉えるために,不確実性駆動型AQA (UD-AQA) という新しい確率モデルを提案する。
我々は,AQA回帰損失の再重み付けに使用される各予測の不確かさを推定する。
提案手法は,オリンピックイベントMTL-AQAとFineDivingの3つのベンチマークと,手術スキルJIGSAWSデータセットの3つのベンチマークで比較結果を得た。
論文 参考訳(メタデータ) (2022-07-29T07:21:15Z) - Exploring Robustness of Unsupervised Domain Adaptation in Semantic
Segmentation [74.05906222376608]
クリーンな画像とそれらの逆の例との一致を、出力空間における対照的な損失によって最大化する、逆向きの自己スーパービジョンUDA(ASSUDA)を提案する。
i) セマンティックセグメンテーションにおけるUDA手法のロバスト性は未解明のままであり, (ii) 一般的に自己スーパービジョン(回転やジグソーなど) は分類や認識などのイメージタスクに有効であるが, セグメンテーションタスクの識別的表現を学習する重要な監視信号の提供には失敗している。
論文 参考訳(メタデータ) (2021-05-23T01:50:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。