論文の概要: D^2LV: A Data-Driven and Local-Verification Approach for Image Copy
Detection
- arxiv url: http://arxiv.org/abs/2111.07090v1
- Date: Sat, 13 Nov 2021 10:56:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 09:16:06.021168
- Title: D^2LV: A Data-Driven and Local-Verification Approach for Image Copy
Detection
- Title(参考訳): d^2lv: 画像コピー検出のためのデータ駆動および局所検証手法
- Authors: Wenhao Wang, Yifan Sun, Weipu Zhang, Yi Yang
- Abstract要約: 画像類似性チャレンジ:マッチングトラック - NeurIPS'21で競合する、データ駆動で局所的な検証手法が提案されている。
D2LVでは、教師なし事前訓練が一般的に使用される教師付き訓練に取って代わる。
提案されたアプローチは、Facebook AI Image similarity Challenge: Matching Trackで1,103人中1位にランクインしている。
- 参考スコア(独自算出の注目度): 36.473577708618976
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image copy detection is of great importance in real-life social media. In
this paper, a data-driven and local-verification (D^2LV) approach is proposed
to compete for Image Similarity Challenge: Matching Track at NeurIPS'21. In
D^2LV, unsupervised pre-training substitutes the commonly-used supervised one.
When training, we design a set of basic and six advanced transformations, and a
simple but effective baseline learns robust representation. During testing, a
global-local and local-global matching strategy is proposed. The strategy
performs local-verification between reference and query images. Experiments
demonstrate that the proposed method is effective. The proposed approach ranks
first out of 1,103 participants on the Facebook AI Image Similarity Challenge:
Matching Track. The code and trained models are available at
https://github.com/WangWenhao0716/ISC-Track1-Submission.
- Abstract(参考訳): 画像コピー検出は、実生活のソーシャルメディアにおいて非常に重要である。
本稿では、NeurIPS'21における画像類似性チャレンジ:マッチングトラックと競合するデータ駆動局所検証(D^2LV)手法を提案する。
d^2lvでは、教師なし事前訓練は教師なしのものと置き換えられる。
トレーニングでは,基本および6つの高度な変換セットを設計し,シンプルだが効果的なベースラインが堅牢な表現を学習する。
テスト中、グローバルローカルおよびローカルグローバルマッチング戦略が提案されている。
この戦略は参照画像とクエリ画像の局所的検証を行う。
提案手法が有効であることを示す実験を行った。
提案されたアプローチは、Facebook AI Image similarity Challenge: Matching Trackで1,103人中1位である。
コードとトレーニングされたモデルはhttps://github.com/WangWenhao0716/ISC-Track1-Submissionで公開されている。
関連論文リスト
- ForgeryTTT: Zero-Shot Image Manipulation Localization with Test-Time Training [42.58645429356456]
ソーシャルメディアは、現実的なフェイク画像に悩まされているため、コンテンツを信頼するのは難しい。
これらの偽物を検出するアルゴリズムは、特定のデータセットでトレーニングされているため、新しい現実世界のシナリオでは失敗することが多い。
ForgeryTTTは、画像中の操作された領域を識別するためにテスト時間トレーニングを利用する最初の方法である。
論文 参考訳(メタデータ) (2024-10-05T04:41:55Z) - Towards Seamless Adaptation of Pre-trained Models for Visual Place Recognition [72.35438297011176]
視覚的位置認識のための事前学習モデル(VPR)のシームレスな適応を実現する新しい手法を提案する。
具体的には、地域を識別するための有意義なランドマークに焦点を当てたグローバルな特徴とローカルな特徴の両方を得るために、ハイブリッド適応法を設計する。
実験結果から,本手法はトレーニングデータやトレーニング時間が少なく,最先端の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-02-22T12:55:01Z) - MOCA: Self-supervised Representation Learning by Predicting Masked Online Codebook Assignments [72.6405488990753]
自己教師付き学習は、ビジョントランスフォーマーネットワークの欲求を軽減できる。
所望のプロパティを統一する単段および単段のMOCAを提案する。
我々は,様々な評価プロトコルにおいて,低照度設定と強力な実験結果に対して,最先端の新たな結果を得る。
論文 参考訳(メタデータ) (2023-07-18T15:46:20Z) - Few-Shot Learning with Visual Distribution Calibration and Cross-Modal
Distribution Alignment [47.53887941065894]
事前訓練された視覚言語モデルは、数ショット学習に関する多くの研究にインスピレーションを与えている。
少数の訓練画像だけで、視覚的特徴分布は画像のクラス非関連情報によって容易に妨げられる。
本稿では,画像の空間的注意マップを生成するSelective Attackモジュールを提案する。
論文 参考訳(メタデータ) (2023-05-19T05:45:17Z) - 1st Place Solution for ECCV 2022 OOD-CV Challenge Image Classification
Track [64.49153847504141]
OOD-CVチャレンジは配布外一般化タスクである。
この課題では、私たちのコアソリューションは、ノイズラベル学習が強いテスト時間ドメイン適応法である、と要約することができます。
テスト時間拡張戦略とモデルアンサンブル戦略を統合することで、OOD-CVチャレンジの画像分類リーダーボードに第一位にランクインする。
論文 参考訳(メタデータ) (2023-01-12T03:44:30Z) - 3rd Place: A Global and Local Dual Retrieval Solution to Facebook AI
Image Similarity Challenge [2.4340897078287815]
本稿では、Facebook AIによって組織された画像類似度チャレンジ(ISC)2021のマッチングトラックに対する3番目のソリューションを提案する。
本稿では,グローバルな記述子とローカルな記述子を組み合わせたマルチブランチ検索手法を提案する。
本稿では,グローバルな特徴と局所的な特徴の相補的な優位性を示すアブレーション実験について述べる。
論文 参考訳(メタデータ) (2021-12-04T16:25:24Z) - Bag of Tricks and A Strong baseline for Image Copy Detection [36.473577708618976]
画像コピー検出には,トリックの袋と強力なベースラインが提案されている。
我々は、異なるクエリのスコアを安定させるために、記述子ストレッチ戦略を設計する。
提案されたベースラインは、Facebook AI Image similarity Challenge: Descriptor Trackの参加者526人中3位である。
論文 参考訳(メタデータ) (2021-11-13T13:58:43Z) - DetCo: Unsupervised Contrastive Learning for Object Detection [64.22416613061888]
教師なしのコントラスト学習は,CNNを用いた画像表現学習において大きな成功を収めている。
我々は,グローバルイメージとローカルイメージパッチのコントラストをフルに検討する,DetCoという新しいコントラスト学習手法を提案する。
DetCoは1倍のスケジュールでMask RCNN-C4/FPN/RetinaNet上で1.6/1.2/1.0 APで教師付き手法を一貫して上回っている。
論文 参考訳(メタデータ) (2021-02-09T12:47:20Z) - Un-Mix: Rethinking Image Mixtures for Unsupervised Visual Representation
Learning [108.999497144296]
近年の先進的な教師なし学習手法では,同じ画像から2つの「ビュー」を学習表現として比較するために,サイムズ様の枠組みを用いている。
この研究は、教師なし学習においてラベル空間上の距離の概念を巻き込み、正対と負対のソフトな類似度をモデルに認識させることを目的としている。
その概念的単純さにもかかわらず、この解 -- 教師なし画像混合(Un-Mix)により、変換された入力と対応する新しいラベル空間からより微妙でより堅牢で一般化された表現を学習できることを実証的に示す。
論文 参考訳(メタデータ) (2020-03-11T17:59:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。