論文の概要: Reinforcement Learning for Improving Object Detection
- arxiv url: http://arxiv.org/abs/2008.08005v1
- Date: Tue, 18 Aug 2020 16:20:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 21:03:50.519322
- Title: Reinforcement Learning for Improving Object Detection
- Title(参考訳): 物体検出改善のための強化学習
- Authors: Siddharth Nayak and Balaraman Ravindran
- Abstract要約: 我々は,事前学習ネットワークのオブジェクト検出性能を向上させるために,適用すべき特定の前処理量を選択するObjectRLというアルゴリズムを導入する。
ObjectRLの主な動機は、人間の目にとって良いように見える画像が、物体を検出するための訓練済みの物体検出器にとって、必ずしも最適であるとは限らないことである。
- 参考スコア(独自算出の注目度): 22.06211725256875
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The performance of a trained object detection neural network depends a lot on
the image quality. Generally, images are pre-processed before feeding them into
the neural network and domain knowledge about the image dataset is used to
choose the pre-processing techniques. In this paper, we introduce an algorithm
called ObjectRL to choose the amount of a particular pre-processing to be
applied to improve the object detection performances of pre-trained networks.
The main motivation for ObjectRL is that an image which looks good to a human
eye may not necessarily be the optimal one for a pre-trained object detector to
detect objects.
- Abstract(参考訳): トレーニングされたオブジェクト検出ニューラルネットワークの性能は、画像の品質に大きく依存します。
一般的に、画像はニューラルネットワークに入力する前に前処理され、画像データセットに関するドメイン知識が前処理テクニックの選択に使用される。
本稿では,事前学習したネットワークのオブジェクト検出性能を向上させるために,特定の事前処理量を選択するObjectRLというアルゴリズムを提案する。
objectrlの主な動機は、人間の目によく見える画像が、事前に訓練された物体検出器が物体を検出するのに最適なものとは限らないことである。
関連論文リスト
- Label-Free Synthetic Pretraining of Object Detectors [67.17371526567325]
そこで本稿では,SOLID(Synthetic Optimization layout with Instance Detection)という新しい手法を提案する。
筆者らのSOLIDアプローチは,(1)シーンアレンジメントを最適化した非ラベルの3Dモデルを用いた合成画像の生成,(2)"インスタンス検出"タスクにおけるオブジェクト検出の事前学習,の2つの主要コンポーネントから構成される。
当社のアプローチでは,事前学習のためのセマンティックラベルは必要とせず,任意の3Dモデルを使用することが可能である。
論文 参考訳(メタデータ) (2022-08-08T16:55:17Z) - Neural Architecture Adaptation for Object Detection by Searching Channel
Dimensions and Mapping Pre-trained Parameters [17.090405682103167]
ほとんどのオブジェクト検出フレームワークは、元来画像分類用に設計されたバックボーンアーキテクチャを使用する。
最近のニューラルアーキテクチャサーチ(NAS)研究は、オブジェクト検出に特化したバックボーンの自動設計が全体的な精度を向上させることを実証している。
本稿では,検出目的のために与えられたバックボーンを最適化するニューラルアーキテクチャ適応手法を提案する。
論文 参考訳(メタデータ) (2022-06-17T02:01:56Z) - Simple Open-Vocabulary Object Detection with Vision Transformers [51.57562920090721]
本稿では,画像テキストモデルをオープン語彙オブジェクト検出に転送するための強力なレシピを提案する。
我々は、最小限の修正、コントラスト的な画像テキスト事前学習、エンドツーエンド検出細調整を備えた標準のVision Transformerアーキテクチャを使用する。
我々は、ゼロショットテキスト条件とワンショット画像条件オブジェクト検出において、非常に強力な性能を達成するために必要な適応戦略と正規化を提供する。
論文 参考訳(メタデータ) (2022-05-12T17:20:36Z) - Hybrid Optimized Deep Convolution Neural Network based Learning Model
for Object Detection [0.0]
物体の識別はコンピュータビジョンにおける最も基本的で難しい問題の1つである。
近年,ディープラーニングに基づく物体検出技術が大衆の関心を集めている。
本研究では,自律型物体検出システムを構築するために,独自のディープラーニング分類手法を用いる。
提案するフレームワークは検出精度0.9864であり、現在の技術よりも高い。
論文 参考訳(メタデータ) (2022-03-02T04:39:37Z) - Semantic-Aware Generation for Self-Supervised Visual Representation
Learning [116.5814634936371]
セマンティック・アウェア・ジェネレーション(SaGe)は、生成した画像に保存される詳細よりも、よりリッチなセマンティクスを促進する。
SaGeは、ターゲットネットワークをビュー特有の特徴で補完することで、集中的なデータ拡張によって引き起こされるセマンティックな劣化を軽減する。
我々は、ImageNet-1K上でSaGeを実行し、近接検定、線形分類、微視的画像認識を含む5つの下流タスクで事前訓練されたモデルを評価する。
論文 参考訳(メタデータ) (2021-11-25T16:46:13Z) - Pix2seq: A Language Modeling Framework for Object Detection [12.788663431798588]
Pix2Seqはオブジェクト検出のためのシンプルで汎用的なフレームワークである。
我々はニューラルネットをトレーニングし、画像を認識し、所望のシーケンスを生成する。
私たちのアプローチは主に、ニューラルネットワークがオブジェクトの場所と場所を知っていれば、その読み方を教える必要がある、という直感に基づいています。
論文 参考訳(メタデータ) (2021-09-22T17:26:36Z) - Rectifying the Shortcut Learning of Background: Shared Object
Concentration for Few-Shot Image Recognition [101.59989523028264]
Few-Shot画像分類は、大規模なデータセットから学んだ事前学習された知識を利用して、一連の下流分類タスクに取り組むことを目的としている。
本研究では,Few-Shot LearningフレームワークであるCOSOCを提案する。
論文 参考訳(メタデータ) (2021-07-16T07:46:41Z) - A Simple and Effective Use of Object-Centric Images for Long-Tailed
Object Detection [56.82077636126353]
シーン中心画像における物体検出を改善するために,物体中心画像を活用する。
私たちは、シンプルで驚くほど効果的なフレームワークを提示します。
我々の手法は、レアオブジェクトのオブジェクト検出(およびインスタンスセグメンテーション)の精度を相対的に50%(および33%)向上させることができる。
論文 参考訳(メタデータ) (2021-02-17T17:27:21Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Improving Object Detection in Art Images Using Only Style Transfer [5.156484100374058]
アートイメージにおけるオブジェクト(特に人)のローカライズのためのニューラルネットワークのトレーニングプロセスを提案し,評価する。
AdaInスタイルの転送を使用してCOCOデータセットの画像を変更し、トレーニングと検証のための大規模なデータセットを生成します。
その結果、最先端の技術が大幅に改善され、ニューラルネットワークをトレーニングしてアート画像を処理するデータセットを作成するための新しい方法が前進しました。
論文 参考訳(メタデータ) (2021-02-12T13:48:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。