論文の概要: One-Shot Learning for Periocular Recognition: Exploring the Effect of
Domain Adaptation and Data Bias on Deep Representations
- arxiv url: http://arxiv.org/abs/2307.05128v1
- Date: Tue, 11 Jul 2023 09:10:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-12 15:45:42.654032
- Title: One-Shot Learning for Periocular Recognition: Exploring the Effect of
Domain Adaptation and Data Bias on Deep Representations
- Title(参考訳): 近視認識のためのワンショット学習 : ドメイン適応とデータバイアスが深部表現に及ぼす影響を探る
- Authors: Kevin Hernandez-Diaz, Fernando Alonso-Fernandez, Josef Bigun
- Abstract要約: 広範に使用されているCNNモデルにおける深部表現の挙動をワンショット近視認識のための極端データ不足下で検討する。
我々は、バイオメトリックデータセットで訓練されたネットワークを数百万の画像で活用し、最先端の結果を改善した。
SIFTのような従来のアルゴリズムは、限られたデータでCNNより優れている。
- 参考スコア(独自算出の注目度): 59.17685450892182
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One weakness of machine-learning algorithms is the need to train the models
for a new task. This presents a specific challenge for biometric recognition
due to the dynamic nature of databases and, in some instances, the reliance on
subject collaboration for data collection. In this paper, we investigate the
behavior of deep representations in widely used CNN models under extreme data
scarcity for One-Shot periocular recognition, a biometric recognition task. We
analyze the outputs of CNN layers as identity-representing feature vectors. We
examine the impact of Domain Adaptation on the network layers' output for
unseen data and evaluate the method's robustness concerning data normalization
and generalization of the best-performing layer. We improved state-of-the-art
results that made use of networks trained with biometric datasets with millions
of images and fine-tuned for the target periocular dataset by utilizing
out-of-the-box CNNs trained for the ImageNet Recognition Challenge and standard
computer vision algorithms. For example, for the Cross-Eyed dataset, we could
reduce the EER by 67% and 79% (from 1.70% and 3.41% to 0.56% and 0.71%) in the
Close-World and Open-World protocols, respectively, for the periocular case. We
also demonstrate that traditional algorithms like SIFT can outperform CNNs in
situations with limited data or scenarios where the network has not been
trained with the test classes like the Open-World mode. SIFT alone was able to
reduce the EER by 64% and 71.6% (from 1.7% and 3.41% to 0.6% and 0.97%) for
Cross-Eyed in the Close-World and Open-World protocols, respectively, and a
reduction of 4.6% (from 3.94% to 3.76%) in the PolyU database for the
Open-World and single biometric case.
- Abstract(参考訳): 機械学習アルゴリズムの弱点のひとつは、新しいタスクのためにモデルをトレーニングする必要があることだ。
これは、データベースの動的な性質と、場合によってはデータ収集のための主題コラボレーションに依存するため、生体認証に特有の課題を示す。
本稿では,広範に用いられているcnnモデルにおいて,生体認証タスクであるone-shot periocular recognitionの限界データ不足下での深部表現の挙動について検討する。
CNN層の出力を特徴ベクトルとして解析する。
ドメイン適応が未取得データに対するネットワーク層の出力に与える影響を検証し、最良処理層のデータの正規化と一般化に関するロバスト性を評価する。
我々は,imagenet 認識課題や標準コンピュータビジョンアルゴリズムでトレーニングされたアウト・オブ・ボックス cnn を利用して,数百万の画像を用いたバイオメトリックデータセットでトレーニングされたネットワークを使用し,ターゲットのペオクチュアルデータセットに微調整された最新結果を改善した。
例えば、Cross-Eyedデータセットの場合、眼周囲のケースでは、EERを67%、EERを79%(それぞれ1.70%と3.41%から0.56%と0.71%)削減できる。
また、SIFTのような従来のアルゴリズムは、限られたデータや、Open-Worldモードのようなテストクラスでネットワークが訓練されていないシナリオでCNNを上回ります。
sift単独では、eerを64%、71.6%削減し(3.41%から0.6%、0.97%)、open-worldおよびopen-worldプロトコルでは4.6%(3.94%から3.76%)、open-worldおよびsingle biometricケースでは4.6%削減できた。
関連論文リスト
- Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Deep-Learning Framework for Optimal Selection of Soil Sampling Sites [0.0]
この研究は、画像処理におけるディープラーニングの最近の進歩を活用して、フィールドの重要な特性を示す最適な位置を見つける。
本フレームワークは,自己保持機構をバックボーンとするエンコーダデコーダアーキテクチャで構築されている。
このモデルはテストデータセットにおいて、平均精度99.52%、IoU平均インターセクション57.35%、Dice Coefficient平均71.47%という驚くべき結果を得た。
論文 参考訳(メタデータ) (2023-09-02T16:19:21Z) - Improving CNN-based Person Re-identification using score Normalization [2.462953128215087]
本稿では,CNNに基づく特徴抽出手法とXQDA(Cross-view Quadratic Discriminant Analysis)を組み合わせたPRe-IDを提案する。
提案手法は、VIPeR、GRID、CUHK01、VIPeR、PRID450Sの4つの挑戦的データセットで検証される。
論文 参考訳(メタデータ) (2023-07-01T18:12:27Z) - Semantic segmentation of surgical hyperspectral images under geometric
domain shifts [69.91792194237212]
本稿では、幾何学的アウト・オブ・ディストリビューション(OOD)データの存在下で、最先端のセマンティックセグメンテーションネットワークを初めて分析する。
有機移植(Organ transplantation)と呼ばれる専用の拡張技術により、一般化可能性にも対処する。
提案手法は,SOA DSCの最大67 % (RGB) と90% (HSI) を改善し,実際のOODテストデータ上での分配内性能と同等の性能を示す。
論文 参考訳(メタデータ) (2023-03-20T09:50:07Z) - Personalized Decentralized Multi-Task Learning Over Dynamic
Communication Graphs [59.96266198512243]
本稿では,正と負の相関関係を持つタスクに対する分散・フェデレーション学習アルゴリズムを提案する。
本アルゴリズムでは,タスク間の相関関係を自動的に計算し,コミュニケーショングラフを動的に調整して相互に有益なタスクを接続し,互いに悪影響を及ぼす可能性のあるタスクを分離する。
合成ガウスデータセットと大規模セレブ属性(CelebA)データセットについて実験を行った。
論文 参考訳(メタデータ) (2022-12-21T18:58:24Z) - CASS: Cross Architectural Self-Supervision for Medical Image Analysis [0.0]
Cross Architectural Self-Supervisionは、トランスフォーマーとCNNを同時に活用する、新しい自己教師型学習アプローチである。
既存の最先端の自己教師型学習手法と比較して,CASSのトレーニング済みCNNを実証的に示し,トランスフォーマーは100%ラベル付きデータで平均8.5%を得た。
論文 参考訳(メタデータ) (2022-06-08T21:25:15Z) - Improved Aggregating and Accelerating Training Methods for Spatial Graph
Neural Networks on Fraud Detection [0.0]
本稿では,CARE-GNNをResidual Layered CARE-GNN(RLC-GNN)と呼ばれるディープモデルに拡張する改良されたディープアーキテクチャを提案する。
RLC-GNNの3つの課題は、近隣情報の利用が制限に達すること、訓練の難しさ、およびノードの特徴や外部パターンに関する包括的な考慮の欠如である。
YelpとAmazonのデータセットで実験が行われる。
論文 参考訳(メタデータ) (2022-02-14T09:51:35Z) - Exploiting Shared Representations for Personalized Federated Learning [54.65133770989836]
本稿では,クライアント間の共有データ表現と,クライアント毎のユニークなローカルヘッダを学習するための,新しいフェデレーション学習フレームワークとアルゴリズムを提案する。
提案アルゴリズムは, クライアント間の分散計算能力を利用して, 表現の更新毎に低次元の局所パラメータに対して, 多数の局所更新を行う。
この結果は、データ分布間の共有低次元表現を学習することを目的とした、幅広い種類の問題に対するフェデレーション学習以上の関心を持っている。
論文 参考訳(メタデータ) (2021-02-14T05:36:25Z) - Quasi-Global Momentum: Accelerating Decentralized Deep Learning on
Heterogeneous Data [77.88594632644347]
ディープラーニングモデルの分散トレーニングは、ネットワーク上でデータプライバシとデバイス上での学習を可能にする重要な要素である。
現実的な学習シナリオでは、異なるクライアントのローカルデータセットに異質性が存在することが最適化の課題となる。
本稿では,この分散学習の難しさを軽減するために,運動量に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2021-02-09T11:27:14Z) - Combining Deep Transfer Learning with Signal-image Encoding for
Multi-Modal Mental Wellbeing Classification [2.513785998932353]
本稿では,複数のマルチモーダルデータセット上で感情状態認識を行う際の限界に対処する枠組みを提案する。
5-point Likertスケールで評価された実世界の幸福度を推定する際のモデル性能は,我々のフレームワークを用いて向上できることを示す。
論文 参考訳(メタデータ) (2020-11-20T13:37:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。