論文の概要: An Empirical Analysis of Optimization Dynamics and Sparsity Boundaries in Large-Scale Pedestrian Attribute Recognition
- arxiv url: http://arxiv.org/abs/2606.14770v1
- Date: Tue, 09 Jun 2026 04:54:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:32.063698
- Title: An Empirical Analysis of Optimization Dynamics and Sparsity Boundaries in Large-Scale Pedestrian Attribute Recognition
- Title(参考訳): 大規模歩行者属性認識における最適化ダイナミクスと空間境界の実証分析
- Authors: Houssam El Mir,
- Abstract要約: 本稿では,ResNet-18バックボーン上のマルチラベル音声損失ハイパーパラメータの体系的アブレーションについて述べる。
校正された構成 (alpha=0.50, gamma=2.0) は、BCEベースラインと一致する62.32%のマクロF1スコアを達成する。
我々は、0.1%未満の正のサンプル分画が世界的損失の再重み付けを非効率にするハードバウンダリであるスパーシティウォールを同定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pedestrian Attribute Recognition (PAR) is critical for video surveillance, enabling forensic search and re-identification systems. Extreme class imbalance remains a fundamental obstacle when merging PETA and PA-100K into a 109,000-image composite corpus, where minority attributes have positive sample fractions below 1%. This causes standard BCE optimization to suppress rare traits, a phenomenon we term the majority negative class cheating trap. We present a systematic ablation of Multi-Label Focal Loss hyperparameters (alpha and gamma) on a ResNet-18 backbone. A calibrated configuration (alpha=0.50, gamma=2.0) achieves a Macro F1-score of 62.32%, matching BCE baseline while preserving superior hard-example mining and convergence dynamics. Our approach uses pure loss-function engineering with zero computational overhead for edge deployment. We identify the Sparsity Wall, a hard boundary where positive sample fractions below 0.1% make global loss reweighting ineffective, requiring instance-level intervention.
- Abstract(参考訳): 歩行者属性認識(PAR)は、ビデオ監視において重要であり、法医学的な探索と再識別システムを可能にする。
PETAとPA-100Kを109,000イメージの複合コーパスに結合する際には、極端クラス不均衡が根本的な障害であり、少数属性は1%以下である。
これにより、標準のBCE最適化は希少な特性を抑えることができ、これは最も負のクラス不正トラップと呼ばれる現象である。
本稿では,ResNet-18のバックボーン上にマルチラベル音声損失ハイパーパラメータ(アルファとガンマ)の体系的アブレーションを示す。
校正された構成 (alpha=0.50, gamma=2.0) ではマクロF1スコアは62.32%に達し、BCEベースラインと一致する。
提案手法では,エッジ配置に計算オーバーヘッドをゼロとした純粋損失関数工学を用いる。
我々は、0.1%未満の正のサンプル分画がグローバルな損失の再重み付けを非効率にし、インスタンスレベルの介入を必要とするハードバウンダリであるスパーシティウォールを識別する。
関連論文リスト
- Automating the Expert Eye: A System-Agnostic Deep Learning Framework for Rare Event Discovery in Imbalanced Force Spectroscopy [0.0]
自動SMFSトリアージにおける極端なクラス不均衡を克服するために,システムに依存しない,解釈可能なディープラーニングフレームワークを提案する。
我々はこの枠組みをR. champanellensis cellulosomeの複雑な機械的展開経路で評価した。
経験的に二重重み付けされたトリアージシステムを実装することで、パイプラインは自動的に880のバックグラウンドノイズトレースを破棄した。
論文 参考訳(メタデータ) (2026-06-08T14:24:58Z) - Clipping Bottleneck: Stabilizing RLVR via Stochastic Recovery of Near-Boundary Signals [83.0127582612634]
Near-boundary Rescue (NSR) は最小限のプラグ・アンド・プレイの修正であり、失った信号を回復するために、アウト・オブ・バウンドトークンを保持する。
NSRはトレーニングの安定性を大幅に改善し、DAPOやGSPOといった強力なベースライン上で一貫したゲインを提供する。
論文 参考訳(メタデータ) (2026-05-21T16:45:31Z) - A Reproducible Log-Driven AutoML Framework for Interpretable Pipeline Optimization in Healthcare Risk Prediction [7.356849324535381]
本研究では、決定論的かつログ駆動の自動機械学習フレームワークであるyvsoucom-iterkitを紹介する。
18,000以上のパイプライン構成にわたるPima Indians DiabetesとStrokeデータセットの実験は、部分的に冗長な検索スペースを明らかにしている。
このフレームワークは、アンサンブルモデルを使用して、強力で安定したパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-05-19T16:57:56Z) - Singularity Avoidance in Inverse Kinematics: A Unified Treatment of Classical and Learning-based Methods [0.0]
学習ベースアプローチの急速な発展により古典特異性損なうIKを橋渡しする。
体系的な分類法は、幾何構造と堅牢性を保証することによってメソッドを分類する。
条件の整った目標でも純粋な学習手法が失敗することを示す。
論文 参考訳(メタデータ) (2026-04-15T02:14:01Z) - BadCLIP++: Stealthy and Persistent Backdoors in Multimodal Contrastive Learning [73.46118996284888]
マルチモーダル・コントラスト学習モデルに対するバックドア攻撃の研究は、ステルスネスと永続性という2つの大きな課題に直面している。
両課題に対処する統合フレームワークであるBadCLIP++を提案する。
ステルスネスのために,タスク関連領域付近に知覚不可能なパターンを埋め込むセマンティックフュージョンQRマイクロトリガーを導入する。
持続性については、半径縮小とセントロイドアライメントによるトリガ埋め込みを安定化する。
論文 参考訳(メタデータ) (2026-02-19T08:31:16Z) - SafeBench-Seq: A Homology-Clustered, CPU-Only Baseline for Protein Hazard Screening with Physicochemical/Composition Features and Cluster-Aware Confidence Intervals [26.81598226089532]
SafeBench-Seqはメタデータのみの再現可能なベンチマークと,すべて公開データから構築されたベースライン分類器である。
の脅威を近似するために、組み合わせたデータセットを40パーセントのIDでクラスタリングし、クラスタレベルのホールドアウトを実行します。
AUROC/AUPRCとスクリーニング操作点(TPR@1% FPR; FPR@95% TPR)の95%ブートストラップ信頼区間(n=200)を報告した。
我々は,ブライアスコア,期待誤差(ECE),15ビン,信頼性図を用いて,確率品質を定量化する。
論文 参考訳(メタデータ) (2025-12-19T12:51:31Z) - Closing the Approximation Gap of Partial AUC Optimization: A Tale of Two Formulations [121.39938773554523]
ROC曲線の下の領域(AUC)は、クラス不均衡と決定制約の両方を持つ実世界のシナリオにおける重要な評価指標である。
PAUC最適化の近似ギャップを埋めるために,2つの簡単なインスタンス単位のミニマックス修正を提案する。
得られたアルゴリズムは、サンプルサイズと典型的な一方方向と双方向のPAUCに対して$O(-2/3)$の収束率の線形パーイテレーション計算複雑性を享受する。
論文 参考訳(メタデータ) (2025-12-01T02:52:33Z) - DRL-Guided Neural Batch Sampling for Semi-Supervised Pixel-Level Anomaly Detection [0.0]
産業用視覚検査における異常検出は, 欠陥試料の不足により困難である。
本稿では,ニューラルバッチサンプリング,オートエンコーダ,予測器を統合した半教師付き深層強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-25T12:53:53Z) - Rethinking LLM Evaluation: Can We Evaluate LLMs with 200x Less Data? [82.09573568241724]
EssenceBenchは反復遺伝的アルゴリズム(GA)を利用した粗粒度フレームワーク
提案手法は, 再構成誤差が低く, 効率が著しく向上した, 優れた圧縮結果が得られる。
HellaSwagベンチマーク(10Kサンプル)では,25倍少ないサンプルを用いて,全モデルが5%以内の順位を保ち,わずか200倍少ないサンプルを用いて,95%未満のランキング保持シフトを達成している。
論文 参考訳(メタデータ) (2025-10-12T05:38:10Z) - ALoRE: Efficient Visual Adaptation via Aggregating Low Rank Experts [71.91042186338163]
ALoREは、Kroneckerによって構築された超複素パラメータ化空間をAggregate Low Rank Expertsに再利用する新しいPETL法である。
巧妙な設計のおかげで、ALoREは無視できる余分なパラメータを保持し、凍ったバックボーンに強制的にマージできる。
論文 参考訳(メタデータ) (2024-12-11T12:31:30Z) - Learning with Multiclass AUC: Theory and Algorithms [141.63211412386283]
ROC曲線 (AUC) の下の領域は、不均衡学習やレコメンダシステムといった問題に対するよく知られたランキング基準である。
本稿では,マルチクラスAUCメトリクスを最適化することで,多クラススコアリング関数を学習する問題について検討する。
論文 参考訳(メタデータ) (2021-07-28T05:18:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。