論文の概要: 3rd Place Solution to "Google Landmark Retrieval 2020"
- arxiv url: http://arxiv.org/abs/2008.10480v2
- Date: Tue, 25 Aug 2020 03:44:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 12:09:03.172243
- Title: 3rd Place Solution to "Google Landmark Retrieval 2020"
- Title(参考訳): googleのランドマーク検索2020」の3位決定
- Authors: Ke Mei, Lei li, Jinchang Xu, Yanhua Cheng, Yugeng Lin
- Abstract要約: 本稿では,Google Landmark Retrieval 2020チャレンジに対する3位の詳細ソリューションについて紹介する。
メカニカルラーニングを用いたデータクリーニングとモデルの探索に重点を置いている。
我々はCorner-Cutmixと呼ばれるデータ拡張手法を採用し、モデルがマルチスケールで隠蔽されたランドマーク画像を認識する能力を向上する。
- 参考スコア(独自算出の注目度): 11.78419680436906
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image retrieval is a fundamental problem in computer vision. This paper
presents our 3rd place detailed solution to the Google Landmark Retrieval 2020
challenge. We focus on the exploration of data cleaning and models with metric
learning. We use a data cleaning strategy based on embedding clustering.
Besides, we employ a data augmentation method called Corner-Cutmix, which
improves the model's ability to recognize multi-scale and occluded landmark
images. We show in detail the ablation experiments and results of our method.
- Abstract(参考訳): 画像検索はコンピュータビジョンの基本的な問題である。
本稿では,Google Landmark Retrieval 2020チャレンジに対する3位の詳細ソリューションについて紹介する。
データクリーニングとメトリック学習によるモデルの探索に重点を置いている。
我々は,クラスタリングの組込みに基づくデータクリーニング戦略を用いる。
さらに,データ拡張手法である corner-cutmix を用いることで,マルチスケールおよびオクルードランドマーク画像の認識能力を向上させる。
本手法のアブレーション実験と結果について詳述する。
関連論文リスト
- Improving Image Recognition by Retrieving from Web-Scale Image-Text Data [68.63453336523318]
本稿では,メモリから抽出した各サンプルの重要性を学習するアテンションベースのメモリモジュールを提案する。
既存の手法と比較して,提案手法は無関係な検索例の影響を排除し,入力クエリに有益であるものを保持する。
我々は、ImageNet-LT、Places-LT、Webvisionのデータセットで最先端の精度を実現していることを示す。
論文 参考訳(メタデータ) (2023-04-11T12:12:05Z) - A Triplet-loss Dilated Residual Network for High-Resolution
Representation Learning in Image Retrieval [0.0]
ローカライゼーションなどのいくつかのアプリケーションでは、画像検索が最初のステップとして使用される。
本論文では,トレーニング可能なパラメータが少ない,単純かつ効率的な画像検索システムを提案する。
提案手法は三重項損失を有する拡張残差畳み込みニューラルネットワークの利点である。
論文 参考訳(メタデータ) (2023-03-15T07:01:44Z) - 2nd Place Solution to Google Landmark Retrieval 2020 [15.620571007364362]
本稿では,Google Landmark Retrieval Competition 2020における第2位のソリューションについて述べる。
後処理を伴わないランドマーク検索のためのグローバル特徴モデルのトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-07-11T10:14:14Z) - Deep Image Deblurring: A Survey [165.32391279761006]
低レベルのコンピュータビジョンにおいて、デブロアリングは古典的な問題であり、ぼやけた入力画像からシャープなイメージを復元することを目的としている。
近年のディープラーニングの進歩は、この問題の解決に大きな進歩をもたらした。
論文 参考訳(メタデータ) (2022-01-26T01:31:30Z) - Unsupervised Part Discovery from Contrastive Reconstruction [90.88501867321573]
自己監督型視覚表現学習の目標は、強く伝達可能な画像表現を学習することである。
対象部分の発見とセグメンテーションに対する教師なしアプローチを提案する。
本手法は, 細粒度, 視覚的に異なるカテゴリ間でセマンティックな部分を生成する。
論文 参考訳(メタデータ) (2021-11-11T17:59:42Z) - Clustering by Maximizing Mutual Information Across Views [62.21716612888669]
本稿では,共同表現学習とクラスタリングを組み合わせた画像クラスタリングのための新しいフレームワークを提案する。
提案手法は,様々な画像データセットにおける最先端の単一ステージクラスタリング手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-24T15:36:49Z) - LID 2020: The Learning from Imperfect Data Challenge Results [242.86700551532272]
Imperfect Dataワークショップからの学習は、新しいアプローチの開発に刺激を与え、促進することを目的としている。
我々は、弱教師付き学習環境における最先端のアプローチを見つけるために、3つの課題を編成する。
この技術的レポートは、課題のハイライトを要約している。
論文 参考訳(メタデータ) (2020-10-17T13:06:12Z) - 1st Place Solution to Google Landmark Retrieval 2020 [0.0]
本稿は、Kaggleに関するGoogle Landmark Retrieval 2020コンペティションの第1位となるソリューションを提示する。
このソリューションは、多数のランドマーククラスを分類するためのメトリックラーニングに基づいており、2つのトレインデータセットによるトランスファーラーニングを使用している。
論文 参考訳(メタデータ) (2020-08-24T05:45:20Z) - Rethinking Data Augmentation for Image Super-resolution: A Comprehensive
Analysis and a New Strategy [21.89072742618842]
超分解能タスクに適用された既存の拡張手法を包括的に分析する。
我々は、低解像度のパッチをカットし、それに対応する高解像度の画像領域にペーストするCutBlurを提案する。
提案手法は, 様々なシナリオにおいて連続的に, 性能を著しく向上させる。
論文 参考訳(メタデータ) (2020-04-01T13:49:38Z) - Two-stage Discriminative Re-ranking for Large-scale Landmark Retrieval [24.630337893857]
大規模ランドマーク画像検索のための効率的なパイプラインを提案する。
我々のアプローチは、コサインソフトマックスロスで訓練された畳み込みニューラルネットワークを用いて、特徴空間に画像を埋め込むことに基づいている。
私たちの方法では、Google Landmark Retrieval 2019チャレンジで1位、KaggleでのGoogle Landmark Recognition 2019チャレンジで3位を獲得しました。
論文 参考訳(メタデータ) (2020-03-25T04:23:18Z) - GridMask Data Augmentation [76.79300104795966]
本稿では,新しいデータ拡張手法であるGridMaskを提案する。
情報除去を利用して、様々なコンピュータビジョンタスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2020-01-13T07:27:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。