論文の概要: When a Zero-Shooter Cheats: Improving Age Estimation via Activation Steering
- arxiv url: http://arxiv.org/abs/2605.17658v1
- Date: Sun, 17 May 2026 21:20:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.302365
- Title: When a Zero-Shooter Cheats: Improving Age Estimation via Activation Steering
- Title(参考訳): ゼロショットチート:アクティベーションステアリングによる年齢推定の改善
- Authors: Erik Imgrund, Pia Hanfeld, Klim Kireev, Konrad Rieck,
- Abstract要約: 視覚言語モデル(VLM)は、人物を識別し、記憶された知識から年齢を推定する傾向がある。
この現象は、非有名人が有名人と誤認された場合に、かなり誤った予測をもたらす。
本稿では,VLMの隠れ状態に介入してショートカットを抑制するアクティベーションステアリング手法を提案する。
- 参考スコア(独自算出の注目度): 4.931984026341269
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Different age-related regulations have been proposed to protect minors from harmful content and interactions online. Automated age estimation is central to enforcing such regulations, and vision-language models (VLMs) achieve state-of-the-art performance on this task. However, we find that the zero-shot nature of VLM-based age estimation produces an unexpected side effect we call the identity shortcut: Instead of estimating age from visual features, VLMs tend to identify the depicted person and infer their age from memorized knowledge. This phenomenon leads to substantially incorrect predictions when non-celebrities are misidentified as celebrities. It also produces deceptively high robustness to noise and adversarial perturbations on celebrity images, which dominate popular benchmarks. To mitigate this, we propose an activation steering method that suppresses the shortcut by intervening on the hidden states of the VLM. This method improves age estimation accuracy for both memorized and unseen identities, reducing mean absolute error by up to 25% across popular benchmarks.
- Abstract(参考訳): ネット上の有害コンテンツやインタラクションから未成年者を守るために、年齢に関する異なる規制が提案されている。
自動年齢推定はそのような規則を強制する中心であり、視覚言語モデル(VLM)はこの課題に対して最先端のパフォーマンスを達成する。
視覚的特徴から年齢を推定する代わりに、VLMは人物を識別し、記憶された知識から年齢を推定する傾向がある。
この現象は、非有名人が有名人と誤認された場合に、かなり誤った予測をもたらす。
また、人気ベンチマークを支配している有名人の画像に対して、ノイズや敵対的な摂動に対する知覚的に高い堅牢性を生み出す。
そこで本研究では,VLMの隠れ状態に介入してショートカットを抑制するアクティベーションステアリング手法を提案する。
この方法では,記憶と見えない同一性の両方の年齢推定精度が向上し,一般的なベンチマークにおいて平均絶対誤差を最大25%低減する。
関連論文リスト
- The Illusion of Forgetting: Attack Unlearned Diffusion via Initial Latent Variable Optimization [51.835894707552946]
非学習型防衛は拡散モデル(DM)からNot-Safe-For-Work概念を浄化すると主張している
本研究では,未学習が言語記号と基礎知識のマッピングを部分的に破壊し,休眠記憶として残り続けることを示す。
IVOは、壊れたマッピングを再構築することで、これらの休眠記憶を再活性化する簡潔で強力な攻撃フレームワークである。
論文 参考訳(メタデータ) (2026-01-30T02:39:51Z) - Counterfactual VLA: Self-Reflective Vision-Language-Action Model with Adaptive Reasoning [71.19675094463834]
この作業では、モデルが実行前に計画されたアクションを推論し、修正することを可能にする、自己修正型のVLAフレームワークである、Counterfactual VLAを導入している。
CF-VLAはまず、駆動意図を要約した時間分割メタアクションを生成し、その後、メタアクションと視覚コンテキストの両方で条件付けられた反実的推論を実行する。
大規模運転データセットの実験では、CF-VLAは軌道精度を最大17.6%向上し、安全基準を20.5%向上し、適応的思考を示す。
論文 参考訳(メタデータ) (2025-12-30T19:04:17Z) - Towards an Automated Framework to Audit Youth Safety on TikTok [6.83645418303131]
本稿では,TikTokの執行機構が若者のアカウントに有害なコンテンツが露出することを抑える効果について検討する。
7000本以上のビデオを収集し、有害か有害かの分類を行い、そして年齢に応じたソックパペットアカウントを使って相互作用をシミュレートする。
予備的な結果は、成人と青少年のアカウント間のコンテンツ露出の最小限の差を示し、プラットフォームが年齢ベースで調整されていることを懸念している。
論文 参考訳(メタデータ) (2025-09-06T21:30:11Z) - CILF-CIAE: CLIP-driven Image-Language Fusion for Correcting Inverse Age Estimation [14.639340916340801]
年齢推定タスクは、画像中の顔の特徴を分析して、個人の年齢を予測することを目的としている。
既存のCLIPベースの年齢推定手法では、高いメモリ使用量が必要であり、エラーフィードバック機構が欠如している。
逆年齢推定(CILF-CIAE)のための新しいCLIP駆動画像言語融合法を提案する。
論文 参考訳(メタデータ) (2023-12-04T09:35:36Z) - Adaptive Mean-Residue Loss for Robust Facial Age Estimation [7.667560350473354]
本稿では,分布学習による顔年齢推定のための損失関数を提案する。
FG-NETとCLAP2016のデータセットでの実験結果により、提案された損失の有効性が検証された。
論文 参考訳(メタデータ) (2022-03-31T16:28:34Z) - LAE : Long-tailed Age Estimation [52.5745217752147]
まず、簡単な標準ベースラインを定式化し、事前トレーニング、データ拡張、モデルアーキテクチャなどのトリックを収集することで、はるかに強力なベースラインを構築します。
標準ベースラインと比較して,提案手法は推定誤差を著しく低減する。
本稿では,Long-tailed Age Estimation (LAE) という2段階の学習手法を提案する。
論文 参考訳(メタデータ) (2021-10-25T09:05:44Z) - FP-Age: Leveraging Face Parsing Attention for Facial Age Estimation in
the Wild [50.8865921538953]
年齢推定に顔のセマンティクスを明示的に組み込む手法を提案する。
我々は,顔解析に基づくネットワークを設計し,異なるスケールで意味情報を学習する。
提案手法は,既存の年齢推定手法を常に上回っていることを示す。
論文 参考訳(メタデータ) (2021-06-21T14:31:32Z) - Age Gap Reducer-GAN for Recognizing Age-Separated Faces [72.26969872180841]
本稿では,年齢変化に伴う顔と時間変化をマッチングする新しいアルゴリズムを提案する。
提案手法は,顔の年齢推定と年齢別顔の検証を組み合わせた統合フレームワークである。
論文 参考訳(メタデータ) (2020-11-11T16:43:32Z) - Temporal Sparse Adversarial Attack on Sequence-based Gait Recognition [56.844587127848854]
このような攻撃に対して,最先端の歩行認識モデルが脆弱であることを示す。
生成した対向ネットワークに基づくアーキテクチャを用いて、対向的な高品質な歩行シルエットやビデオフレームを意味的に生成する。
実験結果から, フレームの1分の1しか攻撃されない場合, 対象モデルの精度は劇的に低下することがわかった。
論文 参考訳(メタデータ) (2020-02-22T10:08:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。