論文の概要: Beyond the Fold: Quantifying Split-Level Noise and the Case for Leave-One-Dataset-Out AU Evaluation
- arxiv url: http://arxiv.org/abs/2604.02162v1
- Date: Thu, 02 Apr 2026 15:28:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.884622
- Title: Beyond the Fold: Quantifying Split-Level Noise and the Case for Leave-One-Dataset-Out AU Evaluation
- Title(参考訳): フォールドを超えて:分割レベルノイズの定量化と残留1データセットAU評価の事例
- Authors: Saurabh Hinduja, Gurmeet Kaur, Maneesh Bilalpur, Jeffrey Cohn, Shaun Canavan,
- Abstract要約: クロスバリデーション自体が測定可能な分散をもたらすことを示す。
BP4D+では、3倍の主成分排他的分割を繰り返して、平均F1で平均0.065ドルという経験的なノイズフロアを生成する。
さらに、5つのAUデータセットにわたるLeave-One-Dataset-Outプロトコルを用いて、データセット間のロバスト性を評価する。
- 参考スコア(独自算出の注目度): 1.7159330469510958
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Subject-exclusive cross-validation is the standard evaluation protocol for facial Action Unit (AU) detection, yet reported improvements are often small. We show that cross-validation itself introduces measurable stochastic variance. On BP4D+, repeated 3-fold subject-exclusive splits produce an empirical noise floor of $\pm 0.065$ in average F1, with substantially larger variation for low-prevalence AUs. Operating-point metrics such as F1 fluctuate more than threshold-independent measures such as AUC, and model ranking can change under different fold assignments. We further evaluate cross-dataset robustness using a Leave-One-Dataset-Out (LODO) protocol across five AU datasets. LODO removes partition randomness and exposes domain-level instability that is not visible under single-dataset cross-validation. Together, these results suggest that gains often reported in cross-fold validation may fall within protocol variance. Leave-one-dataset-out cross-validation yields more stable and interpretable findings
- Abstract(参考訳): 被験者排他的クロスバリデーションは、顔アクションユニット(AU)検出の標準的な評価プロトコルであるが、報告されている改善は少ないことが多い。
クロスバリデーション自体が測定可能な確率的分散をもたらすことを示す。
BP4D+では、3倍の被験者排他的分割を繰り返して、平均F1で$\pm 0.065$のノイズフロアを発生させ、低頻度AUに対してかなり大きな変動をもたらす。
F1のようなオペレーティングポイントのメトリクスは、AUCのようなしきい値に依存しない尺度よりも変動し、モデルランキングは異なる折りたたみ割り当ての下で変更することができる。
さらに、5つのAUデータセットにわたるLeave-One-Dataset-Out(LODO)プロトコルを用いて、データセット間のロバスト性を評価する。
LODOはパーティションランダム性を取り除き、単一データセットのクロスバリデーションでは見えないドメインレベルの不安定性を公開する。
これらの結果は、クロスフォールド検証でしばしば報告されるゲインがプロトコルのばらつきに該当する可能性があることを示唆している。
leave-one-dataset-out cross-validation はより安定して解釈可能な結果をもたらす
関連論文リスト
- Towards One-for-All Anomaly Detection for Tabular Data [87.63505963517512]
タブラル異常検出(TAD)は多くの実世界の応用において重要である。
複数のソースデータセットに対して1回のトレーニングのみを必要とするフレームワークであるOFA-TADを提案する。
14ドメインの34のデータセットに対する実験により、OFA-TADはより優れた異常検出性能が得られることが示された。
論文 参考訳(メタデータ) (2026-03-15T14:42:05Z) - A Sample Efficient Conditional Independence Test in the Presence of Discretization [54.047334792855345]
離散化されたデータに直接条件付き独立テスト(CI)は、誤った結論につながる可能性がある。
最近の進歩は、観測データをバイナライズすることで、潜伏変数間の適切なCI関係を推測することを目指している。
そこで本研究では,バイナライゼーションプロセスに依存しないサンプル効率のCIテストを提案する。
論文 参考訳(メタデータ) (2025-06-10T12:41:26Z) - Mitigating covariate shift in non-colocated data with learned parameter priors [0.0]
textitFragmentation-induced co-shift remediation(FIcsR$)は、フラグメントの共変量分布と標準クロスバリデーションベースラインとの$f$-divergenceを最小限にする。
複数のデータクラス、40ドル以上のデータセット、および複数のシーケンス長にわたってバッチ化されたデータに対して、広範な分類実験を行います。
バッチとフォールド・オブ・ザ・アーティファクトに対する精度は、それぞれ5%以上と10%以上向上している。
論文 参考訳(メタデータ) (2024-11-10T15:48:29Z) - Federated Nonparametric Hypothesis Testing with Differential Privacy Constraints: Optimal Rates and Adaptive Tests [5.3595271893779906]
フェデレート学習は、さまざまな場所でデータが収集され分析される広範囲な設定で適用可能であることから、近年大きな注目を集めている。
分散差分プライバシー(DP)制約下でのホワイトノイズ・ウィズ・ドリフトモデルにおける非パラメトリック適合性試験について検討した。
論文 参考訳(メタデータ) (2024-06-10T19:25:19Z) - Mitigating Shortcut Learning with Diffusion Counterfactuals and Diverse Ensembles [104.60508550106618]
拡散確率モデル(DPM)を利用したアンサンブル多様化フレームワークDiffDivを提案する。
DPMは、相関した入力特徴を示すサンプルを用いて訓練しても、新しい特徴の組み合わせで画像を生成することができることを示す。
そこで本研究では,DPM誘導の多様化は,教師付き信号の追加を必要とせず,ショートカットキューへの依存を取り除くのに十分であることを示す。
論文 参考訳(メタデータ) (2023-11-23T15:47:33Z) - Conservative Prediction via Data-Driven Confidence Minimization [70.93946578046003]
機械学習の安全性クリティカルな応用においては、モデルが保守的であることが望ましいことが多い。
本研究では,不確実性データセットに対する信頼性を最小化するデータ駆動信頼性最小化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-08T07:05:36Z) - Data thinning for convolution-closed distributions [2.299914829977005]
本稿では,観測を2つ以上の独立した部分に分割する手法であるデータ薄型化を提案する。
教師なし学習手法の結果の検証には,データの薄化が有効であることを示す。
論文 参考訳(メタデータ) (2023-01-18T02:47:41Z) - Sparse Conditional Hidden Markov Model for Weakly Supervised Named
Entity Recognition [68.68300358332156]
雑音ラベリング機能を評価するために,スパース条件付き隠れマルコフモデル(Sparse-CHMM)を提案する。
Sparse-CHMMは、3段階のトレーニングパイプラインで教師なし学習によって最適化される。
5つの包括的なデータセットで平均F1スコアが3.01向上する。
論文 参考訳(メタデータ) (2022-05-27T20:47:30Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Fast calculation of Gaussian Process multiple-fold cross-validation
residuals and their covariances [0.6091702876917281]
高速離脱式を複数倍のクロスバリデーションに一般化する。
単純クリグフレームワークと普遍クリグフレームワークの両方において,クロスバリデーション残差の共分散構造を強調した。
本研究の結果は, 高速な多次元クロスバリデーションを可能にし, モデル診断において直接的な結果をもたらす。
論文 参考訳(メタデータ) (2021-01-08T17:02:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。