論文の概要: Harnessing Geometric Constraints from Auxiliary Labels to Improve
Embedding Functions for One-Shot Learning
- arxiv url: http://arxiv.org/abs/2103.03862v1
- Date: Fri, 5 Mar 2021 18:27:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-08 15:06:21.451263
- Title: Harnessing Geometric Constraints from Auxiliary Labels to Improve
Embedding Functions for One-Shot Learning
- Title(参考訳): 補助ラベルからの幾何学的制約を利用したワンショット学習のための埋め込み関数の改善
- Authors: Anand Ramakrishnan, Minh Pham, and Jacob Whitehill
- Abstract要約: 本稿では,手動で注釈付きまたは自動検出された補助ラベルを用いて深層モデルで学習した埋め込み空間に新しい幾何学的制約を導入する。
提案されたTL+PDP+FBV損失(97.5, 72.6, 93.1, 70.5%)では, 99.7, 86.2, 99.4, 79.3%の検証精度が向上した。
- 参考スコア(独自算出の注目度): 21.445455835823626
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We explore the utility of harnessing auxiliary labels (e.g., facial
expression) to impose geometric structure when training embedding models for
one-shot learning (e.g., for face verification). We introduce novel geometric
constraints on the embedding space learned by a deep model using either
manually annotated or automatically detected auxiliary labels. We contrast
their performances (AUC) on four different face datasets(CK+, VGGFace-2, Tufts
Face, and PubFig). Due to the additional structure encoded in the embedding
space, our methods provide a higher verification accuracy (99.7, 86.2, 99.4,
and 79.3% with our proposed TL+PDP+FBV loss, versus 97.5, 72.6, 93.1, and 70.5%
using a standard Triplet Loss on the four datasets, respectively). Our method
is implemented purely in terms of the loss function. It does not require any
changes to the backbone of the embedding functions.
- Abstract(参考訳): ワンショット学習(例:顔認証)のための埋め込みモデルを訓練する際に、補助ラベル(例:顔表現)を利用して幾何学的構造を付与する有用性を検討する。
本稿では,手動で注釈付きまたは自動検出された補助ラベルを用いて深層モデルで学習した埋め込み空間に新しい幾何学的制約を導入する。
私たちは4つの異なる顔データセット(CK+、VGGFace-2、Tufts Face、PubFig)でパフォーマンス(AUC)を比較します。
埋め込み空間にエンコードされた追加の構造により、我々の手法はより高い検証精度(99.7, 86.2, 99.4, 79.3%、提案されたTL+PDP+FBV損失に対して97.5, 72.6, 93.1, 70.5%)を提供する。
本手法は純粋に損失関数を用いて実装する。
組み込み関数のバックボーンを変更する必要はない。
関連論文リスト
- On-the-fly Point Feature Representation for Point Clouds Analysis [7.074010861305738]
そこで我々は,曲線特徴生成モジュールを通じて,豊富な幾何学的情報を明示的にキャプチャするOn-the-fly Point Feature Representation (OPFR)を提案する。
また、三角形集合に基づく局所座標系を近似した局所参照コンストラクタモジュールを導入する。
OPFRは推論に1.56ms(バニラPFHより65倍速い)と0.012M以上のパラメータしか必要とせず、様々なバックボーン用の汎用的なプラグアンドプレイモジュールとして機能する。
論文 参考訳(メタデータ) (2024-07-31T04:57:06Z) - Gradient Boosting Mapping for Dimensionality Reduction and Feature Extraction [2.778647101651566]
教師あり学習における根本的な問題は、優れた特徴や距離尺度を見つけることである。
本稿では,弱い学習者の出力が埋め込みを定義する,教師付き次元削減手法を提案する。
組込み座標は教師付き学習タスクにより良い機能を提供することを示す。
論文 参考訳(メタデータ) (2024-05-14T10:23:57Z) - LoLep: Single-View View Synthesis with Locally-Learned Planes and
Self-Attention Occlusion Inference [66.45326873274908]
本稿では,1枚のRGB画像から局所学習平面を回帰してシーンを正確に表現するLoLepを提案する。
MINEと比較して、LPIPSは4.8%-9.0%、RVは73.9%-83.5%である。
論文 参考訳(メタデータ) (2023-07-23T03:38:55Z) - Integral Continual Learning Along the Tangent Vector Field of Tasks [112.02761912526734]
本稿では,特殊データセットからの情報を段階的に組み込んだ軽量連続学習手法を提案する。
ソースデータセットの0.4%まで小さく、小さな固定サイズのメモリバッファを保持しており、単純な再サンプリングによって更新される。
提案手法は,異なるデータセットに対して,様々なバッファサイズで高い性能を実現する。
論文 参考訳(メタデータ) (2022-11-23T16:49:26Z) - A High-Accuracy Unsupervised Person Re-identification Method Using
Auxiliary Information Mined from Datasets [53.047542904329866]
マルチモーダルな特徴学習のためのデータセットから抽出した補助情報を利用する。
本稿では,Restricted Label Smoothing Cross Entropy Loss (RLSCE), Weight Adaptive Triplet Loss (WATL), Dynamic Training Iterations (DTI)の3つの効果的なトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-05-06T10:16:18Z) - Tactile Grasp Refinement using Deep Reinforcement Learning and Analytic
Grasp Stability Metrics [70.65363356763598]
解析的把握安定性指標が強化学習アルゴリズムの強力な最適化目標であることを示す。
幾何的および力量に依存しないグリップ安定性の指標を組み合わせることで、カブイドの平均成功率は95.4%となることを示す。
第2の実験では,触覚情報を持たないベースラインよりも,接触フィードバックで訓練したグリップリファインメントアルゴリズムが最大6.6%向上することを示した。
論文 参考訳(メタデータ) (2021-09-23T09:20:19Z) - SelfVoxeLO: Self-supervised LiDAR Odometry with Voxel-based Deep Neural
Networks [81.64530401885476]
本稿では,これら2つの課題に対処するために,自己教師型LiDARオドメトリー法(SelfVoxeLO)を提案する。
具体的には、生のLiDARデータを直接処理する3D畳み込みネットワークを提案し、3D幾何パターンをよりよく符号化する特徴を抽出する。
我々は,KITTIとApollo-SouthBayという2つの大規模データセット上での手法の性能を評価する。
論文 参考訳(メタデータ) (2020-10-19T09:23:39Z) - PropagationNet: Propagate Points to Curve to Learn Structure Information [79.65125870257009]
熱マップ回帰に基づく構造注入型顔アライメントアルゴリズムを提案する。
また,地中条件下での採鉱・採鉱の難しさを強調したFocal Wing Lossを提案する。
提案手法では,WFLWでは平均誤差が4.05%,300Wでは平均誤差が2.93%,COFWでは平均誤差が3.71%となる。
論文 参考訳(メタデータ) (2020-06-25T11:08:59Z) - SALD: Sign Agnostic Learning with Derivatives [42.43016094317574]
本稿では,生データから直接形状の暗黙的ニューラル表現を学習するSALDを紹介する。
2つの挑戦的データセット上での形状空間学習におけるSALDの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-09T16:54:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。