論文の概要: CZL-CIAE: CLIP-driven Zero-shot Learning for Correcting Inverse Age
Estimation
- arxiv url: http://arxiv.org/abs/2312.01758v1
- Date: Mon, 4 Dec 2023 09:35:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-05 15:40:43.542709
- Title: CZL-CIAE: CLIP-driven Zero-shot Learning for Correcting Inverse Age
Estimation
- Title(参考訳): CZL-CIAE:CLIP駆動ゼロショット学習による逆年齢推定の補正
- Authors: Yuntao Shou, Wei Ai, Tao Meng, Keqin Li
- Abstract要約: 逆年齢推定(CZL-CIAE)のための新しいCLIP駆動ゼロショット学習法を提案する。
画像特徴とテキスト意味情報をそれぞれ抽出するCLIPモデルを導入し、それらを高度にセマンティックに整合した高次元特徴空間にマッピングする。
次に,画像のチャネル進化と空間的相互作用を実現するための新しいトランスフォーマーアーキテクチャを設計した。
最後に, 年齢予測の誤差率を低減するために, エンドツーエンドの誤差フィードバックを用いた可逆年齢推定手法を提案する。
- 参考スコア(独自算出の注目度): 15.4676247289299
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Zero-shot age estimation aims to learn feature information about age from
input images and make inferences about a given person's image or video frame
without specific sample data. The development of zero-shot age estimation can
improve the efficiency and accuracy of various applications (e.g., age
verification and secure access control, etc.), while also promoting research on
multi-modal and zero-shot learning in the social media field. For example,
zero-sample age estimation can be used to create social networks focused on
specific age groups. However, existing methods mainly focus on supervised,
labeled age estimation learning, and the prediction effect of zero-shot
learning is very poor. To tackle the above issues, we propose a novel
CLIP-driven Zero-shot Learning for Correcting Inverse Age Estimation
(CZL-CIAE). Specifically, we first introduce the CLIP model to extract image
features and text semantic information respectively, and map them into a highly
semantically aligned high-dimensional feature space. Next, we designed a new
Transformer architecture (i.e., FourierFormer) to achieve channel evolution and
spatial interaction of images, and to fuse image and text semantic information.
Finally, we introduce reversible age estimation, which uses end-to-end error
feedback to reduce the error rate of age predictions. Through extensive
experiments on multiple data sets, CZL-CIAE has achieved better age prediction
results.
- Abstract(参考訳): ゼロショット年齢推定は、入力画像から年齢の特徴情報を学び、特定のサンプルデータなしでその人の画像やビデオフレームの推測を行うことを目的としている。
ゼロショット年齢推定の開発は、様々なアプリケーション(例えば、年齢検証や安全なアクセス制御など)の効率と精度を向上させるとともに、ソーシャルメディア分野におけるマルチモーダルおよびゼロショット学習の研究を促進する。
例えば、ゼロサンプル年齢推定は、特定の年齢グループに焦点を当てたソーシャルネットワークの作成に使用できる。
しかし,従来の手法では教師付き,ラベル付き年齢推定学習が中心であり,ゼロショット学習の予測効果は極めて低い。
以上の課題に対処するため,CLIPによる逆年齢推定のためのゼロショット学習(CZL-CIAE)を提案する。
具体的には,まずクリップモデルを導入し,画像特徴とテキスト意味情報をそれぞれ抽出し,高度にセマンティクス的に整列した高次元特徴空間にマップする。
次に,画像のチャネル進化と空間的相互作用を実現し,画像とテキストのセマンティクス情報を融合するために,新しいトランスフォーマーアーキテクチャ(すなわちフーリエフォーマー)を設計した。
最後に、年齢予測の誤差率を低減するためにエンドツーエンドの誤差フィードバックを用いた可逆年齢推定を導入する。
複数のデータセットに関する広範な実験を通じて、CZL-CIAEはより優れた年齢予測結果を得た。
関連論文リスト
- Blind Dates: Examining the Expression of Temporality in Historical
Photographs [57.07335632641355]
マルチモーダル言語とビジョンモデルであるCLIPのオープンソース実装であるOpenCLIPを用いて、画像の日付を調査する。
我々は1950年から1999年までの39,866枚のグレースケールの歴史的プレス写真を含むtextitDe Boer Scene Detectionデータセットを使用している。
解析の結果、バス、車、猫、犬、そして人々が写っている画像はより正確に年代付けされており、時間的マーカーの存在が示唆されている。
論文 参考訳(メタデータ) (2023-10-10T13:51:24Z) - Exploring CLIP for Assessing the Look and Feel of Images [87.97623543523858]
ゼロショット方式で画像の品質知覚(ルック)と抽象知覚(フィール)の両方を評価するために,コントラスト言語-画像事前学習(CLIP)モデルを導入する。
以上の結果から,CLIPは知覚的評価によく適合する有意義な先行情報を捉えることが示唆された。
論文 参考訳(メタデータ) (2022-07-25T17:58:16Z) - No Token Left Behind: Explainability-Aided Image Classification and
Generation [79.4957965474334]
ここでは、CLIPが入力のすべての関連する意味的部分に焦点を当てることを保証するために、損失項を追加する新しい説明可能性に基づくアプローチを提案する。
本手法は, 追加訓練や微調整を伴わずに, 認識率の向上を図っている。
論文 参考訳(メタデータ) (2022-04-11T07:16:39Z) - Adaptive Mean-Residue Loss for Robust Facial Age Estimation [7.667560350473354]
本稿では,分布学習による顔年齢推定のための損失関数を提案する。
FG-NETとCLAP2016のデータセットでの実験結果により、提案された損失の有効性が検証された。
論文 参考訳(メタデータ) (2022-03-31T16:28:34Z) - LAE : Long-tailed Age Estimation [52.5745217752147]
まず、簡単な標準ベースラインを定式化し、事前トレーニング、データ拡張、モデルアーキテクチャなどのトリックを収集することで、はるかに強力なベースラインを構築します。
標準ベースラインと比較して,提案手法は推定誤差を著しく低減する。
本稿では,Long-tailed Age Estimation (LAE) という2段階の学習手法を提案する。
論文 参考訳(メタデータ) (2021-10-25T09:05:44Z) - FP-Age: Leveraging Face Parsing Attention for Facial Age Estimation in
the Wild [50.8865921538953]
年齢推定に顔のセマンティクスを明示的に組み込む手法を提案する。
我々は,顔解析に基づくネットワークを設計し,異なるスケールで意味情報を学習する。
提案手法は,既存の年齢推定手法を常に上回っていることを示す。
論文 参考訳(メタデータ) (2021-06-21T14:31:32Z) - using multiple losses for accurate facial age estimation [6.851375622634309]
本稿では,分類に基づく手法と比較して,年齢推定をシンプルかつ効果的に行う手法を提案する。
CVPR Chalearn 2016データセット上での年齢-粒度-ネットフレームワークの有効性を検証し,提案手法が個々の損失と比較して予測誤差を低減できることを示す。
論文 参考訳(メタデータ) (2021-06-17T11:18:16Z) - Hierarchical Attention-based Age Estimation and Bias Estimation [16.335191345543063]
顔画像に基づく年齢推定のための新しい深層学習手法を提案する。
提案手法は,現代的スキームを上回り,新しい最先端の年齢推定精度を提供する。
論文 参考訳(メタデータ) (2021-03-17T19:41:34Z) - The Age of Correlated Features in Supervised Learning based Forecasting [14.471447024994113]
本稿では,情報新鮮度が教師あり学習に基づく予測に与える影響を分析する。
これらの応用において、ニューラルネットワークは、複数の相関した特徴に基づいて時間変化目標(例えば、太陽エネルギー)を予測するように訓練される。
情報理論的なアプローチを用いて,最小の学習損失が特徴の年齢の関数であることを証明した。
論文 参考訳(メタデータ) (2021-02-27T00:10:49Z) - Continual Learning for Blind Image Quality Assessment [80.55119990128419]
ブラインド画像品質評価(BIQA)モデルは、サブポピュレーションシフトに継続的に適応できない。
最近の研究では、利用可能なすべての人間評価のIQAデータセットの組み合わせに関するBIQAメソッドのトレーニングが推奨されている。
モデルがIQAデータセットのストリームから継続的に学習するBIQAの継続的学習を策定する。
論文 参考訳(メタデータ) (2021-02-19T03:07:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。