論文の概要: Producing augmentation-invariant embeddings from real-life imagery
- arxiv url: http://arxiv.org/abs/2112.03415v1
- Date: Mon, 6 Dec 2021 23:20:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 13:32:25.472894
- Title: Producing augmentation-invariant embeddings from real-life imagery
- Title(参考訳): 実生活画像からの拡張不変埋め込みの生成
- Authors: Sergio Manuel Papadakis and Sanjay Addicam
- Abstract要約: 本稿では,実写画像から特徴量の多い埋め込み空間を効率的に生成する方法を提案する。
生成された機能は、ソーシャルメディアに現れる実生活のケースで使用される拡張とは無関係に設計されている。
このアプローチを使用することで、2021年のFacebook AI Image similarity Challenge: Descriptor Trackで2位を獲得しました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article presents an efficient way to produce feature-rich,
high-dimensionality embedding spaces from real-life images. The features
produced are designed to be independent from augmentations used in real-life
cases which appear on social media. Our approach uses convolutional neural
networks (CNN) to produce an embedding space. An ArcFace head was used to train
the model by employing automatically produced augmentations. Additionally, we
present a way to make an ensemble out of different embeddings containing the
same semantic information, a way to normalize the resulting embedding using an
external dataset, and a novel way to perform quick training of these models
with a high number of classes in the ArcFace head. Using this approach we
achieved the 2nd place in the 2021 Facebook AI Image Similarity Challenge:
Descriptor Track.
- Abstract(参考訳): 本稿では,実物画像から機能豊富な高次元埋め込み空間を作成するための効率的な方法を提案する。
生成された機能は、ソーシャルメディアに現れる現実のケースで使用される拡張とは独立して設計されている。
我々の手法は畳み込みニューラルネットワーク(CNN)を用いて埋め込み空間を生成する。
ArcFaceヘッドは、自動生成された拡張を使用してモデルをトレーニングするために使用された。
さらに、同じ意味情報を含む異なる組込みからアンサンブルを作成する方法、外部データセットを用いて結果の組込みを正規化する方法、arcfaceヘッドに多数のクラスを持つこれらのモデルの素早いトレーニングを実行する新しい方法を提案する。
このアプローチを使用することで、2021年のFacebook AI Image similarity Challenge: Descriptor Trackで2位を獲得しました。
関連論文リスト
- Data Augmentation and Transfer Learning Approaches Applied to Facial
Expressions Recognition [0.3481985817302898]
本稿では,認識タスクの性能を向上させる新しいデータ拡張手法を提案する。
我々は、感情タイプごとに新しい合成画像を生成することができるGANモデルをスクラッチから構築する。
拡張データセットでは、異なるアーキテクチャで事前訓練された畳み込みニューラルネットワークを微調整します。
論文 参考訳(メタデータ) (2024-02-15T14:46:03Z) - DNS SLAM: Dense Neural Semantic-Informed SLAM [92.39687553022605]
DNS SLAMは、ハイブリッド表現を備えた新しいRGB-DセマンティックSLAMアプローチである。
本手法は画像に基づく特徴抽出と多視点幾何制約を統合し,外観の細部を改良する。
実験により, 合成データと実世界のデータ追跡の両面において, 最先端の性能が得られた。
論文 参考訳(メタデータ) (2023-11-30T21:34:44Z) - Intra- & Extra-Source Exemplar-Based Style Synthesis for Improved Domain
Generalization [21.591831983223997]
セマンティックセグメンテーションにおけるドメインの一般化を改善するために,先進的なスタイル合成パイプラインを提案する。
提案手法は,StyleGAN2インバージョンのためのマスク付きノイズエンコーダに基づく。
データシフトの種類によって、ドライブシーンセマンティックセマンティックセグメンテーションの最大12.4%のmIoU改善を実現しています。
論文 参考訳(メタデータ) (2023-07-02T19:56:43Z) - Learning Structured Output Representations from Attributes using Deep
Conditional Generative Models [0.0]
本稿では,条件付き変分オートエンコーダアーキテクチャを再現し,属性を条件付き画像でトレーニングする。
毛髪の色や眼鏡などの特徴の異なる新しい顔と、異なる鳥類種のサンプルを創り出そうとする。
論文 参考訳(メタデータ) (2023-04-30T17:25:31Z) - Learning Versatile 3D Shape Generation with Improved AR Models [91.87115744375052]
自己回帰(AR)モデルはグリッド空間の関節分布をモデル化することにより2次元画像生成において印象的な結果を得た。
本稿では3次元形状生成のための改良された自己回帰モデル(ImAM)を提案する。
論文 参考訳(メタデータ) (2023-03-26T12:03:18Z) - HQ3DAvatar: High Quality Controllable 3D Head Avatar [65.70885416855782]
本稿では,高フォトリアリスティックなデジタルヘッドアバターを構築するための新しいアプローチを提案する。
本手法はニューラルネットワークによってパラメータ化された暗黙関数を用いて標準空間を学習する。
テスト時,本手法は単眼のRGBビデオによって駆動される。
論文 参考訳(メタデータ) (2023-03-25T13:56:33Z) - Optimizing CAD Models with Latent Space Manipulation [4.180840853105103]
本稿では,StyleCLIPを拡張し,CADモデルをボクセルモデルとして動作させる。
各種CADモデルの把持性を最適化し,自動化関連特徴を最適化するためのシステムの有効性を実証する。
論文 参考訳(メタデータ) (2023-03-09T08:25:09Z) - InvGAN: Invertible GANs [88.58338626299837]
InvGANはInvertible GANの略で、高品質な生成モデルの潜在空間に実際の画像を埋め込むことに成功した。
これにより、画像のインペイント、マージ、オンラインデータ拡張を実行できます。
論文 参考訳(メタデータ) (2021-12-08T21:39:00Z) - OSLO: On-the-Sphere Learning for Omnidirectional images and its
application to 360-degree image compression [59.58879331876508]
全方向画像の表現モデルの学習について検討し、全方向画像の深層学習モデルで使用される数学的ツールを再定義するために、HEALPixの球面一様サンプリングの特性を利用することを提案する。
提案したオン・ザ・スフィア・ソリューションは、等方形画像に適用された類似の学習モデルと比較して、13.7%のビットレートを節約できる圧縮ゲインを向上させる。
論文 参考訳(メタデータ) (2021-07-19T22:14:30Z) - Locally Masked Convolution for Autoregressive Models [107.4635841204146]
LMConvは標準的な2Dコンボリューションの簡単な修正であり、任意のマスクを画像の各位置の重みに適用することができる。
我々は,パラメータを共有するが生成順序が異なる分布推定器のアンサンブルを学習し,全画像密度推定の性能を向上させる。
論文 参考訳(メタデータ) (2020-06-22T17:59:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。