論文の概要: Unsupervised learning based object detection using Contrastive Learning
- arxiv url: http://arxiv.org/abs/2402.13465v1
- Date: Wed, 21 Feb 2024 01:44:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-22 17:34:28.871629
- Title: Unsupervised learning based object detection using Contrastive Learning
- Title(参考訳): コントラスト学習を用いた教師なし学習に基づく物体検出
- Authors: Chandan Kumar, Jansel Herrera-Gerena, John Just, Matthew Darr, Ali
Jannesari
- Abstract要約: 本研究では,教師なし・自己教師型学習を通じて,単段階物体検出装置を訓練するための画期的な手法を提案する。
我々の最先端のアプローチはラベリングプロセスに革命をもたらす可能性を秘めており、手動アノテーションに関連する時間とコストを大幅に削減する。
我々は、画像間のコントラスト学習という概念を創始し、重要な位置情報の取得を可能にした。
- 参考スコア(独自算出の注目度): 6.912349403119665
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training image-based object detectors presents formidable challenges, as it
entails not only the complexities of object detection but also the added
intricacies of precisely localizing objects within potentially diverse and
noisy environments. However, the collection of imagery itself can often be
straightforward; for instance, cameras mounted in vehicles can effortlessly
capture vast amounts of data in various real-world scenarios. In light of this,
we introduce a groundbreaking method for training single-stage object detectors
through unsupervised/self-supervised learning.
Our state-of-the-art approach has the potential to revolutionize the labeling
process, substantially reducing the time and cost associated with manual
annotation. Furthermore, it paves the way for previously unattainable research
opportunities, particularly for large, diverse, and challenging datasets
lacking extensive labels.
In contrast to prevalent unsupervised learning methods that primarily target
classification tasks, our approach takes on the unique challenge of object
detection. We pioneer the concept of intra-image contrastive learning alongside
inter-image counterparts, enabling the acquisition of crucial location
information essential for object detection. The method adeptly learns and
represents this location information, yielding informative heatmaps. Our
results showcase an outstanding accuracy of \textbf{89.2\%}, marking a
significant breakthrough of approximately \textbf{15x} over random
initialization in the realm of unsupervised object detection within the field
of computer vision.
- Abstract(参考訳): 画像に基づく物体検出の訓練は、オブジェクト検出の複雑さだけでなく、潜在的に多様で騒がしい環境でオブジェクトを正確にローカライズする複雑さも伴うため、驚くべき課題となっている。
例えば、車両に搭載されたカメラは、様々な現実世界のシナリオにおいて、膨大なデータを無益にキャプチャすることができる。
そこで本研究では,教師なし・自己教師型学習を通じて,単段階物体検出器を訓練するための地中破壊手法を提案する。
我々の最先端のアプローチはラベリングプロセスに革命をもたらす可能性を秘めており、手動アノテーションに関連する時間とコストを大幅に削減する。
さらに、これまで達成できなかった研究機会、特に広範囲なラベルの欠如した大規模で多様で挑戦的なデータセットへの道を開く。
分類タスクを主目的とする非教師なし学習手法が一般的であるのに対し,本手法はオブジェクト検出というユニークな課題に挑む。
我々は、画像間のコントラスト学習の概念を開拓し、物体検出に不可欠な重要な位置情報の取得を可能にした。
この方法は、この位置情報を十分に学習し、表現し、情報的ヒートマップを生成する。
その結果、コンピュータビジョンの分野における教師なし物体検出の分野におけるランダム初期化よりも、およそ \textbf{15x} の画期的なブレークスルーを示す、 \textbf{89.2\%} の優れた精度を示すことができた。
関連論文リスト
- Interactive Masked Image Modeling for Multimodal Object Detection in Remote Sensing [2.0528748158119434]
マルチモーダル学習は、異なるデータモダリティの機能を統合するために使用することができ、それによって検出精度が向上する。
本稿では,事前学習手法としてMasked Image Modeling (MIM) を提案する。
そこで本稿では,リモートセンシングにおけるオブジェクト検出に特に有用である,異なるトークン間のインタラクションを確立するための対話型MIM手法を提案する。
論文 参考訳(メタデータ) (2024-09-13T14:50:50Z) - PEEKABOO: Hiding parts of an image for unsupervised object localization [7.161489957025654]
教師なしの方法でオブジェクトをローカライズすることは、重要な視覚情報がないために大きな課題となる。
教師なしオブジェクトローカライゼーションのための単段階学習フレームワークPEEKABOOを提案する。
キーとなるアイデアは、画像の一部を選択的に隠し、残りの画像情報を活用して、明示的な監督なしにオブジェクトの位置を推測することである。
論文 参考訳(メタデータ) (2024-07-24T20:35:20Z) - Towards Self-Supervised Learning of Global and Object-Centric
Representations [4.36572039512405]
自己スーパービジョンを用いた構造化対象中心表現の学習における重要な側面について論じる。
CLEVRデータセットに関するいくつかの実験を通じて、私たちの洞察を検証します。
論文 参考訳(メタデータ) (2022-03-11T15:18:47Z) - Robust Region Feature Synthesizer for Zero-Shot Object Detection [87.79902339984142]
我々は,クラス内セマンティック・ディバージングコンポーネントとクラス間構造保存コンポーネントを含む,新しいゼロショットオブジェクト検出フレームワークを構築した。
リモートセンシング画像においてゼロショット物体検出を行う最初の研究である。
論文 参考訳(メタデータ) (2022-01-01T03:09:15Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - A Survey of Self-Supervised and Few-Shot Object Detection [19.647681501581225]
自己教師付き手法は、オブジェクト検出などの下流タスクにうまく転送されるラベルのないデータから表現を学習することを目的としている。
ほとんどショットされていないオブジェクト検出は、ほとんどデータを持たない新しい(見えない)オブジェクトクラスのモデルをトレーニングすることです。
本調査では, 少数ショット・自己監督型物体検出における最新のアプローチを概観し, 特徴付けする。
論文 参考訳(メタデータ) (2021-10-27T18:55:47Z) - Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-04-07T05:42:11Z) - Few-Cost Salient Object Detection with Adversarial-Paced Learning [95.0220555274653]
本稿では,少数のトレーニング画像にのみ手動アノテーションを応用して,効果的なサルエント物体検出モデルを学習することを提案する。
我々は,このタスクを,少額の有能な物体検出とみなし,少数のコストの学習シナリオを促進するために,APL(Adversarialpaced Learning)ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-05T14:15:49Z) - Data Augmentation for Object Detection via Differentiable Neural
Rendering [71.00447761415388]
注釈付きデータが乏しい場合、堅牢なオブジェクト検出器を訓練することは困難です。
この問題に対処する既存のアプローチには、ラベル付きデータからラベル付きデータを補間する半教師付き学習が含まれる。
オブジェクト検出のためのオフラインデータ拡張手法を導入し、新しいビューでトレーニングデータを意味的に補間する。
論文 参考訳(メタデータ) (2021-03-04T06:31:06Z) - Self-supervised Segmentation via Background Inpainting [96.10971980098196]
移動可能なカメラで撮影された単一の画像で、自己教師付き検出とセグメンテーションのアプローチを導入する。
我々は、提案に基づくセグメンテーションネットワークのトレーニングに利用する自己教師付き損失関数を利用する。
本手法は,標準ベンチマークから視覚的に切り離された画像の人間の検出とセグメント化に応用し,既存の自己監督手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-11-11T08:34:40Z) - Co-training for On-board Deep Object Detection [0.0]
人間のラベル付きバウンディングボックスを頼りにすることにより、最高のディープビジョンベースのオブジェクト検出器を教師付きで訓練する。
共同学習は、未ラベル画像における自己ラベルオブジェクトの半教師付き学習手法である。
我々は、協調学習がオブジェクトのラベル付けを緩和し、タスクに依存しないドメイン適応と単独で作業するためのパラダイムであることを示す。
論文 参考訳(メタデータ) (2020-08-12T19:08:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。