論文の概要: Google Landmark Recognition 2020 Competition Third Place Solution
- arxiv url: http://arxiv.org/abs/2010.05350v1
- Date: Sun, 11 Oct 2020 21:30:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 13:51:47.117018
- Title: Google Landmark Recognition 2020 Competition Third Place Solution
- Title(参考訳): google landmark recognition 2020コンペティション3位決定
- Authors: Qishen Ha, Bo Liu, Fuxu Liu, Peiyuan Liao
- Abstract要約: われわれは、Google Landmark Recognition 2020コンペティションの3位となるソリューションを提示する。
これは、サブセンターのArcFaceモデルのみのグローバル機能のアンサンブルである。
クラスサイズの調律可能なマージン関数群であるArcFace損失の動的マージンを導入する。
- 参考スコア(独自算出の注目度): 5.1215007533994
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present our third place solution to the Google Landmark Recognition 2020
competition. It is an ensemble of global features only Sub-center ArcFace
models. We introduce dynamic margins for ArcFace loss, a family of tune-able
margin functions of class size, designed to deal with the extreme imbalance in
GLDv2 dataset. Progressive finetuning and careful postprocessing are also key
to the solution. Our two submissions scored 0.6344 and 0.6289 on private
leaderboard, both ranking third place out of 736 teams.
- Abstract(参考訳): われわれは、Google Landmark Recognition 2020コンペティションの3位となるソリューションを提示する。
サブセンターのArcFaceモデルのみのグローバル機能のアンサンブルである。
GLDv2データセットの極端不均衡に対処するために設計された,クラスサイズのチューニング可能なマージン関数のファミリーであるArcFace損失の動的マージンを導入する。
プログレッシブな微調整と注意深い後処理もソリューションの鍵です。
2つの提案は、プライベート・リーダーボードで 0.6344 と 0.6289 を記録し、どちらも736チーム中3位にランクインした。
関連論文リスト
- VoxelKP: A Voxel-based Network Architecture for Human Keypoint
Estimation in LiDAR Data [53.638818890966036]
textitVoxelKPは、LiDARデータにおける人間のキーポイント推定に適した、完全にスパースなネットワークアーキテクチャである。
本研究では,人間の各インスタンス内のキーポイント間の空間的相関を学習するために,スパースボックスアテンションを導入する。
鳥の視線を符号化する2次元格子に3次元ボクセルを投影する際に, 絶対的な3次元座標を利用するために空間符号化を組み込んだ。
論文 参考訳(メタデータ) (2023-12-11T23:50:14Z) - 3rd Place Solution for PVUW2023 VSS Track: A Large Model for Semantic
Segmentation on VSPW [68.56017675820897]
本稿では,PVUW2023 VSSトラックの3位解について紹介する。
ビデオセマンティックセグメンテーションの課題を解決するために,様々な画像レベルの視覚的バックボーンとセグメンテーションヘッドを探索した。
論文 参考訳(メタデータ) (2023-06-04T07:50:38Z) - 1st Place Solution of The Robust Vision Challenge (RVC) 2022 Semantic
Segmentation Track [67.56316745239629]
本報告では,ECCV 2022におけるロバストビジョンチャレンジのセマンティックセグメンテーション課題に対する勝利解について述べる。
本手法では,エンコーダとしてFAN-B-Hybridモデルを採用し,セグメンテーションフレームワークとしてSegformerを使用している。
提案手法は,マルチドメインセグメンテーションタスクの強力なベースラインとして機能し,今後の作業に役立てることができる。
論文 参考訳(メタデータ) (2022-10-23T20:52:22Z) - 2nd Place Solution to Google Landmark Retrieval 2020 [15.620571007364362]
本稿では,Google Landmark Retrieval Competition 2020における第2位のソリューションについて述べる。
後処理を伴わないランドマーク検索のためのグローバル特徴モデルのトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-07-11T10:14:14Z) - Meta Balanced Network for Fair Face Recognition [51.813457201437195]
我々は、データとアルゴリズムの両方の側面からバイアスを体系的に科学的に研究する。
本稿では,メタバランスネットワーク(MBN)と呼ばれるメタ学習アルゴリズムを提案する。
大規模な実験により、MBNは偏見を緩和し、顔認識において異なる肌のトーンを持つ人々に対してよりバランスの取れたパフォーマンスを学ぶことができた。
論文 参考訳(メタデータ) (2022-05-13T10:25:44Z) - Google Landmark Retrieval 2021 Competition Third Place Solution [5.2576738414324335]
我々は、検索と認識トラックの両方に対して、Google Landmark Challenges 2021にソリューションを提示する。
どちらのソリューションも、動的マージンを持つSub-center ArcFaceに基づくトランスフォーマーとConvNetモデルのアンサンブルである。
論文 参考訳(メタデータ) (2021-10-09T17:56:40Z) - 3rd Place Solution to Google Landmark Recognition Competition 2021 [17.59843220514826]
Google Landmark Recognition 2021コンペティションのソリューションを紹介します。
アンサンブルされたモデルは、民間のリーダーボードで0.489点を獲得し、2021年のGoogleランドマーク認識コンペティションで3位となった。
論文 参考訳(メタデータ) (2021-10-06T14:17:54Z) - 2nd Place Solution to Google Landmark Recognition Competition 2021 [0.0]
そこで我々は,Kaggleで開かれたGoogle Landmark Recognition 2021 Challengeに,その解決策を提示する。
Swin, CSWin, EfficientNet B7 モデルの完全なパイプラインは、プライベートなリーダーボードで 0.4907 を獲得し、コンペで2位になるのに役立ちます。
論文 参考訳(メタデータ) (2021-10-06T10:28:38Z) - 1st Place Solution to Google Landmark Retrieval 2020 [0.0]
本稿は、Kaggleに関するGoogle Landmark Retrieval 2020コンペティションの第1位となるソリューションを提示する。
このソリューションは、多数のランドマーククラスを分類するためのメトリックラーニングに基づいており、2つのトレインデータセットによるトランスファーラーニングを使用している。
論文 参考訳(メタデータ) (2020-08-24T05:45:20Z) - DeepMark++: Real-time Clothing Detection at the Edge [55.41644538483948]
本稿では,迅速な衣服検出とキーポイント推定を実現するための単一ステージアプローチを提案する。
提案手法は,マルチターゲットネットワークであるCenterNetをベースとして,性能向上のためのポストプロセッシング技術をいくつか導入する。
私たちの最も正確なモデルは、DeepFashion2データセットの最先端ソリューションに匹敵する結果を達成します。
論文 参考訳(メタデータ) (2020-06-01T04:36:57Z) - PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation [111.7241018610573]
私たちは、インスタンスセグメンテーションのための新しいエンドツーエンドボトムアップアーキテクチャであるPointGroupを紹介します。
我々は2分岐ネットワークを設計し、ポイントの特徴を抽出し、セマンティックラベルとオフセットを予測し、各ポイントをそれぞれのインスタンスセントロイドに向けてシフトさせる。
クラスタリングコンポーネントは、元のおよびオフセットシフトされた点座標セットの両方を利用するために、その相補的な強度を利用する。
ScanNet v2 と S3DIS の2つの挑戦的データセットに対する広範な実験を行い、ScanNet v2 と S3DIS が最も高い性能を達成し、63.6% と 64.0% の2つを以前のベストが達成した54.9% と54.4% と比較した。
論文 参考訳(メタデータ) (2020-04-03T16:26:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。