論文の概要: PrObeD: Proactive Object Detection Wrapper
- arxiv url: http://arxiv.org/abs/2310.18788v1
- Date: Sat, 28 Oct 2023 19:25:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 16:29:27.832214
- Title: PrObeD: Proactive Object Detection Wrapper
- Title(参考訳): PrObeD:プロアクティブオブジェクト検出ラッパー
- Authors: Vishal Asnani, Abhinav Kumar, Suya You, Xiaoming Liu
- Abstract要約: PrObeDはエンコーダ・デコーダアーキテクチャで構成されており、エンコーダネットワークは入力画像の暗号化のために画像依存の信号テンプレートを生成する。
本稿では,プロアクティブな手法に基づくラッパーPrObeDを提案する。
PrObeDの適用後,MS-COCO,CAMO,COD$10$K,NC$4$Kのデータセットを用いた実験を行った。
- 参考スコア(独自算出の注目度): 15.231600709902127
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Previous research in $2D$ object detection focuses on various tasks,
including detecting objects in generic and camouflaged images. These works are
regarded as passive works for object detection as they take the input image as
is. However, convergence to global minima is not guaranteed to be optimal in
neural networks; therefore, we argue that the trained weights in the object
detector are not optimal. To rectify this problem, we propose a wrapper based
on proactive schemes, PrObeD, which enhances the performance of these object
detectors by learning a signal. PrObeD consists of an encoder-decoder
architecture, where the encoder network generates an image-dependent signal
termed templates to encrypt the input images, and the decoder recovers this
template from the encrypted images. We propose that learning the optimum
template results in an object detector with an improved detection performance.
The template acts as a mask to the input images to highlight semantics useful
for the object detector. Finetuning the object detector with these encrypted
images enhances the detection performance for both generic and camouflaged. Our
experiments on MS-COCO, CAMO, COD$10$K, and NC$4$K datasets show improvement
over different detectors after applying PrObeD. Our models/codes are available
at https://github.com/vishal3477/Proactive-Object-Detection.
- Abstract(参考訳): これまでの2d$オブジェクト検出の研究は、ジェネリック画像やカモフラージュ画像中のオブジェクトの検出など、さまざまなタスクに焦点を当てている。
これらの作品は、入力画像がそのままであるように、オブジェクト検出のためのパッシブな作業と見なされる。
しかし、大域的最小値への収束はニューラルネットワークにおいて最適であると保証されていないため、物体検出器のトレーニングされた重量は最適ではないと論じる。
この問題を解決するために,プロアクティブなスキーム PrObeD に基づくラッパーを提案する。
PrObeDはエンコーダ・デコーダアーキテクチャで構成されており、エンコーダネットワークは入力画像の暗号化のために画像依存信号と呼ばれるテンプレートを生成し、デコーダは暗号化画像からこのテンプレートを復元する。
最適テンプレートを学習すると、検出性能が改善されたオブジェクト検出器が得られる。
テンプレートは入力画像のマスクとして機能し、オブジェクト検出器に有用なセマンティクスを強調する。
これらの暗号化画像でオブジェクト検出器を微細化することで、ジェネリックとカモフラーグの両方の検出性能が向上する。
PrObeDの適用後,MS-COCO,CAMO,COD$10$K,NC$4$Kのデータセットを用いた実験を行った。
私たちのモデル/コードはhttps://github.com/vishal3477/proactive-object-detectionで利用可能です。
関連論文リスト
- Improving the matching of deformable objects by learning to detect
keypoints [6.4587163310833855]
本研究では,非剛性画像対応タスクにおける正しいマッチング数を増やすための新しい学習キーポイント検出手法を提案する。
我々はエンドツーエンドの畳み込みニューラルネットワーク(CNN)をトレーニングし、考慮された記述子により適したキーポイント位置を見つける。
実験により,本手法は検出手法と併用して多数の記述子の平均マッチング精度を向上させることを示した。
また,本手法を,現在利用可能な最も優れたキーポイント検出器と同等に動作する複雑な実世界のタスクオブジェクト検索に適用する。
論文 参考訳(メタデータ) (2023-09-01T13:02:19Z) - Detector Guidance for Multi-Object Text-to-Image Generation [61.70018793720616]
Detector Guidance(DG)は、潜在オブジェクト検出モデルを統合して、生成プロセス中に異なるオブジェクトを分離する。
人間の評価は、DGが対立する概念の融合を防ぐのに8-22%の利点をもたらすことを示した。
論文 参考訳(メタデータ) (2023-06-04T02:33:12Z) - Learning Remote Sensing Object Detection with Single Point Supervision [17.12725535531483]
Pointly Supervised Object Detection (PSOD) は、ボックスレベルの監視対象検出と比較してラベリングコストが低いため、かなりの関心を集めている。
本研究では,RS画像に適したPSOD法を提案する。
提案手法は,最先端の画像レベルとポイントレベルの教師付き検出法と比較して性能が大幅に向上し,PSODとボックスレベルの教師付きオブジェクト検出の差を低減できる。
論文 参考訳(メタデータ) (2023-05-23T15:06:04Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Fewer is More: Efficient Object Detection in Large Aerial Images [59.683235514193505]
本稿では,検出者がより少ないパッチに注目するのに対して,より効率的な推論とより正確な結果を得るのに役立つObjectness Activation Network(OAN)を提案する。
OANを用いて、5つの検出器は3つの大規模な空中画像データセットで30.0%以上のスピードアップを取得する。
我々はOANをドライブシーン物体検出と4Kビデオ物体検出に拡張し,検出速度をそれぞれ112.1%,75.0%向上させた。
論文 参考訳(メタデータ) (2022-12-26T12:49:47Z) - Adversarially-Aware Robust Object Detector [85.10894272034135]
本稿では,ロバスト検出器 (RobustDet) を提案する。
本モデルは, クリーン画像の検出能力を維持しながら, 傾きを効果的に解き, 検出堅牢性を著しく向上させる。
論文 参考訳(メタデータ) (2022-07-13T13:59:59Z) - Robust and Accurate Object Detection via Adversarial Learning [111.36192453882195]
この研究は、逆の例を探索することで、物体検出器の微調整段階を補強する。
提案手法は,オブジェクト検出ベンチマークにおいて,最先端のEfficientDetsの性能を+1.1mAP向上させる。
論文 参考訳(メタデータ) (2021-03-23T19:45:26Z) - D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and
Localization [108.8592577019391]
画像スプライシング偽造検出は、画像指紋によって改ざんされた領域と非改ざんされた領域を区別するグローバルバイナリ分類タスクである。
画像スプライシングフォージェリ検出のためのデュアルエンコーダU-Net(D-Unet)という,固定されていないエンコーダと固定エンコーダを用いた新しいネットワークを提案する。
D-Unetと最先端技術の比較実験において、D-Unetは画像レベルおよび画素レベルの検出において他の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-03T10:54:02Z) - Detective: An Attentive Recurrent Model for Sparse Object Detection [25.5804429439316]
ディテクティヴ(英: Detective)は、画像中の物体を連続的に識別する注意オブジェクト検出器である。
Detectiveはスパースオブジェクト検出器で、オブジェクトインスタンス毎に単一のバウンディングボックスを生成する。
ハンガリーのアルゴリズムに基づく学習機構と,局所化と分類タスクのバランスをとる損失を提案する。
論文 参考訳(メタデータ) (2020-04-25T17:41:52Z) - Plug & Play Convolutional Regression Tracker for Video Object Detection [37.47222104272429]
ビデオオブジェクト検出ターゲットは、オブジェクトのバウンディングボックスを同時にローカライズし、所定のビデオ内のクラスを識別する。
ビデオオブジェクト検出の課題のひとつは、ビデオ全体にわたるすべてのオブジェクトを一貫して検出することだ。
ビデオオブジェクト検出タスクのためのPlug & Playスケール適応型畳み込みレグレッショントラッカーを提案する。
論文 参考訳(メタデータ) (2020-03-02T15:57:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。