論文の概要: Privacy-preserving Online AutoML for Domain-Specific Face Detection
- arxiv url: http://arxiv.org/abs/2203.08399v1
- Date: Wed, 16 Mar 2022 05:11:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-17 14:48:57.810595
- Title: Privacy-preserving Online AutoML for Domain-Specific Face Detection
- Title(参考訳): ドメイン固有の顔検出のためのプライバシー保護オンラインオートML
- Authors: Chenqian Yan, Yuge Zhang, Quanlu Zhang, Yaming Yang, Xinyang Jiang,
Yuqing Yang, Baoyuan Wang
- Abstract要約: 我々は、顔検出のための新しいプライバシー保護オンラインAutoMLフレームワークである"HyperFD"を紹介した。
中心となる部分では、データセットのメタ機能表現とその学習パラダイムが提案されている。
HyperFDのおかげで、各ローカルタスク(クライアント)は、プラットフォームに生画像をアップロードすることなく、以前のタスクの"経験"を効果的に活用できます。
- 参考スコア(独自算出の注目度): 19.265241359551347
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the impressive progress of general face detection, the tuning of
hyper-parameters and architectures is still critical for the performance of a
domain-specific face detector. Though existing AutoML works can speedup such
process, they either require tuning from scratch for a new scenario or do not
consider data privacy. To scale up, we derive a new AutoML setting from a
platform perspective. In such setting, new datasets sequentially arrive at the
platform, where an architecture and hyper-parameter configuration is
recommended to train the optimal face detector for each dataset. This, however,
brings two major challenges: (1) how to predict the best configuration for any
given dataset without touching their raw images due to the privacy concern? and
(2) how to continuously improve the AutoML algorithm from previous tasks and
offer a better warm-up for future ones? We introduce "HyperFD", a new
privacy-preserving online AutoML framework for face detection. At its core
part, a novel meta-feature representation of a dataset as well as its learning
paradigm is proposed. Thanks to HyperFD, each local task (client) is able to
effectively leverage the learning "experience" of previous tasks without
uploading raw images to the platform; meanwhile, the meta-feature extractor is
continuously learned to better trade off the bias and variance. Extensive
experiments demonstrate the effectiveness and efficiency of our design.
- Abstract(参考訳): 一般的な顔検出の顕著な進歩にもかかわらず、ハイパーパラメータとアーキテクチャのチューニングは、ドメイン固有の顔検出の性能に依然として不可欠である。
既存のAutoMLはそのようなプロセスを高速化できるが、新しいシナリオをスクラッチからチューニングする必要があるか、データプライバシを考慮していない。
スケールアップするために、プラットフォームの観点から新しいAutoML設定を導出します。
この設定では、新しいデータセットがシーケンシャルにプラットフォームに到着し、各データセットの最適な顔検出器をトレーニングするためにアーキテクチャとハイパーパラメータの設定が推奨される。
しかし、これは2つの大きな課題をもたらしている。 1) プライバシー上の懸念から、生の画像に触れることなく、データセットに対して最適な設定を予測する方法?
2) 従来のタスクからAutoMLアルゴリズムを継続的に改善し、将来のタスクにより良いウォームアップを提供するには、どうすればよいのか?
我々は、顔検出のための新しいプライバシー保護オンラインAutoMLフレームワークである"HyperFD"を紹介した。
中心となる部分では、データセットのメタ機能表現とその学習パラダイムが提案されている。
hyperfdのおかげで、各ローカルタスク(クライアント)は、プラットフォームに生のイメージをアップロードすることなく、以前のタスクの学習“経験”を効果的に活用することができる。
大規模な実験は、我々の設計の有効性と効率を実証する。
関連論文リスト
- Federated Face Forgery Detection Learning with Personalized Representation [63.90408023506508]
ディープジェネレータ技術は、区別がつかない高品質のフェイクビデオを制作し、深刻な社会的脅威をもたらす可能性がある。
従来の偽造検出手法は、データを直接集中的に訓練する。
本稿では,個人化表現を用いた新しいフェデレーション顔偽造検出学習を提案する。
論文 参考訳(メタデータ) (2024-06-17T02:20:30Z) - OT-VP: Optimal Transport-guided Visual Prompting for Test-Time Adaptation [8.425690424016986]
視覚変換器(ViT)は、表現の学習において顕著な能力を示したが、未知の領域に適用した場合、その性能は損なわれる。
我々のアプローチであるOT-VP(Optimal Transport-guided Test-Time Visual Prompting)は、テスト時の迅速な学習を活用して、ターゲットドメインとソースドメインの整合を図り、これらの問題に対処する。
OT-VPは、学習したプロンプトトークンが4つしかなく、3つのスタイリスティックデータセットで最先端のパフォーマンスを上回っている。
論文 参考訳(メタデータ) (2024-06-12T18:30:03Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Learning Semantic Proxies from Visual Prompts for Parameter-Efficient Fine-Tuning in Deep Metric Learning [13.964106147449051]
既存のソリューションは、既存の画像データセット上でトレーニング済みのモデルを微調整することに集中している。
我々は、事前学習された視覚変換器(ViT)における視覚プロンプト(VPT)の学習に基づく、新しい効果的なフレームワークを提案する。
セマンティック情報を用いた新しい近似が代表的能力よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-02-04T04:42:05Z) - p-Laplacian Adaptation for Generative Pre-trained Vision-Language Models [10.713680139939354]
大きなコーパスで事前訓練された視覚言語モデル(VLM)は、下流のタスクで顕著な成功を収めている。
PETLはフル微調整の代替として注目されている。
グラフニューラルネットワーク(GNN)において,$p$-Laplacianメッセージパッシングを利用する新しいアダプタアーキテクチャである$p$-adapterを提案する。
論文 参考訳(メタデータ) (2023-12-17T05:30:35Z) - Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - Regularized Mask Tuning: Uncovering Hidden Knowledge in Pre-trained
Vision-Language Models [89.07925369856139]
我々は,学習可能な選択によってネットワークパラメータをマスクする,正規化マスクチューニングと呼ばれる新しいタイプのチューニング手法を設計する。
神経経路にインスパイアされた我々は、下流タスクに必要な知識は、既にトレーニング済みの重みの中に存在するが、上流のトレーニング済みの段階では隠されていると論じる。
平均2.56%のパラメータをマスキングすることで、ゼロショットのCLIPと比較して18.73%のパフォーマンス改善を実現しています。
論文 参考訳(メタデータ) (2023-07-27T17:56:05Z) - Few-Shot Model Adaptation for Customized Facial Landmark Detection,
Segmentation, Stylization and Shadow Removal [46.69915243199898]
Few-Shot Model Adaptation (FSMA)フレームワークを提案し、Faces上のいくつかの重要なタスクでその可能性を実証する。
FSMAはまず、大規模なラベルなしデータを使用して対向自動エンコーダを訓練することによって、堅牢な顔画像埋め込みを取得する。
特徴適応と融合層を備えており、最小限のアノテート画像を用いて目的のタスクに効率的に適応する。
論文 参考訳(メタデータ) (2021-04-19T17:15:56Z) - Pre-Trained Models for Heterogeneous Information Networks [57.78194356302626]
異種情報ネットワークの特徴を捉えるための自己教師付き事前学習・微調整フレームワークPF-HINを提案する。
PF-HINは4つのデータセットにおいて、各タスクにおける最先端の代替よりも一貫して、大幅に優れています。
論文 参考訳(メタデータ) (2020-07-07T03:36:28Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Virtual to Real adaptation of Pedestrian Detectors [9.432150710329607]
ViPeDは、ビデオゲームGTA V - Grand Theft Auto Vのグラフィカルエンジンで収集された新しい合成画像セットである。
本稿では,歩行者検出作業に適した2つの異なる領域適応手法を提案する。
実験によると、ViPeDでトレーニングされたネットワークは、実世界のデータでトレーニングされた検出器よりも、目に見えない現実世界のシナリオを一般化できる。
論文 参考訳(メタデータ) (2020-01-09T14:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。