論文の概要: Parametric Instance Classification for Unsupervised Visual Feature
Learning
- arxiv url: http://arxiv.org/abs/2006.14618v1
- Date: Thu, 25 Jun 2020 17:59:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 03:31:45.378124
- Title: Parametric Instance Classification for Unsupervised Visual Feature
Learning
- Title(参考訳): 教師なし視覚特徴学習のためのパラメトリックインスタンス分類
- Authors: Yue Cao, Zhenda Xie, Bin Liu, Yutong Lin, Zheng Zhang, Han Hu
- Abstract要約: 本稿では、教師なし視覚特徴学習のためのパラメトリックインスタンス分類(PIC)を提案する。
二重ブランチの非パラメトリックな方法でインスタンス識別を行う最先端のアプローチとは異なり、PICは直接1ブランチのパラメトリックのインスタンス分類を実行する。
単純なPICフレームワークは最先端のアプローチと同じくらい効果的であることを示す。
- 参考スコア(独自算出の注目度): 33.24745456711699
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents parametric instance classification (PIC) for unsupervised
visual feature learning. Unlike the state-of-the-art approaches which do
instance discrimination in a dual-branch non-parametric fashion, PIC directly
performs a one-branch parametric instance classification, revealing a simple
framework similar to supervised classification and without the need to address
the information leakage issue. We show that the simple PIC framework can be as
effective as the state-of-the-art approaches, i.e. SimCLR and MoCo v2, by
adapting several common component settings used in the state-of-the-art
approaches. We also propose two novel techniques to further improve
effectiveness and practicality of PIC: 1) a sliding-window data scheduler,
instead of the previous epoch-based data scheduler, which addresses the
extremely infrequent instance visiting issue in PIC and improves the
effectiveness; 2) a negative sampling and weight update correction approach to
reduce the training time and GPU memory consumption, which also enables
application of PIC to almost unlimited training images. We hope that the PIC
framework can serve as a simple baseline to facilitate future study.
- Abstract(参考訳): 本稿では、教師なし視覚特徴学習のためのパラメトリックインスタンス分類(PIC)を提案する。
二重ブランチの非パラメトリックな方法でインスタンス識別を行う最先端のアプローチとは異なり、PICは直接1ブランチのパラメトリックのインスタンス分類を実行し、教師付き分類に似た単純なフレームワークを明らかにし、情報漏洩問題に対処する必要がない。
我々は,このシンプルなPICフレームワークが,最先端のアプローチ,すなわちSimCLRとMoCo v2と同等に効果的であることを示し,最先端のアプローチで使用されるいくつかの共通コンポーネント設定を適用した。
PICの有効性と実用性をさらに向上する2つの新しい手法を提案する。
1)スライディングウインドウデータスケジューラは,前回のエポックベースのデータスケジューラの代わりに,picの極めて稀なインスタンス訪問問題に対処し,その効果を向上させる。
2) トレーニング時間とGPUメモリ消費を削減し, PICをほぼ無制限のトレーニング画像に適用する, 負サンプリングと重み更新補正手法を提案する。
PICフレームワークが,今後の研究を促進するためのシンプルなベースラインとして機能できることを願っている。
関連論文リスト
- Towards Self-Supervised FG-SBIR with Unified Sample Feature Alignment and Multi-Scale Token Recycling [11.129453244307369]
FG-SBIRは、埋め込み空間におけるスケッチと対応する画像の距離を最小化することを目的としている。
両領域間のギャップを狭める効果的なアプローチを提案する。
主に、イントラサンプルとインターサンプルの両方を共有する統一的な相互情報共有を促進する。
論文 参考訳(メタデータ) (2024-06-17T13:49:12Z) - Intra-task Mutual Attention based Vision Transformer for Few-Shot Learning [12.5354658533836]
人間は、ほんのわずかの例に晒された後に、新しい、目に見えない画像を正確に分類する能力を持っている。
人工ニューラルネットワークモデルでは、限られたサンプルを持つ2つのイメージを区別する最も関連性の高い特徴を決定することが課題である。
本稿では,サポートとクエリサンプルをパッチに分割するタスク内相互注意手法を提案する。
論文 参考訳(メタデータ) (2024-05-06T02:02:57Z) - Symmetrical Bidirectional Knowledge Alignment for Zero-Shot Sketch-Based
Image Retrieval [69.46139774646308]
本稿ではゼロショットスケッチベース画像検索(ZS-SBIR)の問題点について検討する。
目に見えないカテゴリのスケッチをクエリとして使用して、同じカテゴリのイメージにマッチさせることが目的だ。
ゼロショットスケッチに基づく画像検索(SBKA)のための新しい対称双方向知識アライメントを提案する。
論文 参考訳(メタデータ) (2023-12-16T04:50:34Z) - Learning to Mask and Permute Visual Tokens for Vision Transformer
Pre-Training [59.923672191632065]
我々はMasked and Permuted Vision Transformer(MaPeT)という自己教師型事前学習手法を提案する。
MaPeTは、自動回帰および置換予測を使用して、パッチ内依存関係をキャプチャする。
以上の結果から,MaPeTはImageNet上での競合性能を実証した。
論文 参考訳(メタデータ) (2023-06-12T18:12:19Z) - COTS: Collaborative Two-Stream Vision-Language Pre-Training Model for
Cross-Modal Retrieval [59.15034487974549]
画像テキスト検索のための新しいコラボレーティブな2ストリームビジョン言語事前学習モデルCOTSを提案する。
我々のCOTSは,2ストリーム方式の中で最も高い性能を達成し,推論の速度は10,800倍に向上した。
重要なことは、我々のCOTSはテキストからビデオへの検索にも適用でき、広く使われているMSR-VTTデータセットに新たな最先端技術をもたらすことである。
論文 参考訳(メタデータ) (2022-04-15T12:34:47Z) - Towards Unsupervised Sketch-based Image Retrieval [126.77787336692802]
本稿では,教師なし表現学習とスケッチ写真領域アライメントを同時に行う新しいフレームワークを提案する。
このフレームワークは,新しい教師なし設定では優れた性能を達成し,ゼロショット設定では最先端以上の性能を発揮する。
論文 参考訳(メタデータ) (2021-05-18T02:38:22Z) - Train a One-Million-Way Instance Classifier for Unsupervised Visual
Representation Learning [45.510042484456854]
本稿では、パラメトリックなインスタンスレベルの計算を用いて、データセット内のすべての画像を識別するプリテキストタスクを備えた、単純な教師なし視覚表現学習法を提案する。
全体的なフレームワークは教師付き分類モデルのレプリカであり、セマンティッククラス(犬、鳥、船など)はインスタンスIDに置き換えられる。
数千のセマンティックラベルから数百万のインスタンスラベルへの分類タスクのスケールアップは、1)大規模ソフトマックス分類器、2)インスタンスサンプルの頻度の低い訪問による緩やかな収束、3)ノイズの多い大量の負のクラスなど、特定の課題をもたらす。
論文 参考訳(メタデータ) (2021-02-09T14:44:18Z) - Transformer Guided Geometry Model for Flow-Based Unsupervised Visual
Odometry [38.20137500372927]
対画像からの情報を扱う2つのカメラポーズ推定器からなる手法を提案する。
画像シーケンスでは、Transformerライクな構造を採用して、局所的な時間ウィンドウ上にジオメトリモデルを構築する。
対向画像間の関係を利用するために,f2fpe(flow-to-flow pose estimator)を提案する。
論文 参考訳(メタデータ) (2020-12-08T19:39:26Z) - Unsupervised Learning of Visual Features by Contrasting Cluster
Assignments [57.33699905852397]
ペア比較の計算を必要とせず,コントラスト的手法を生かしたオンラインアルゴリズムSwaVを提案する。
本手法では,クラスタ割り当て間の一貫性を保ちながら,同時にデータをクラスタ化する。
我々の方法は大規模で小さなバッチで訓練でき、無制限のデータにスケールできる。
論文 参考訳(メタデータ) (2020-06-17T14:00:42Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。