論文の概要: Unsupervised Object Detection with Theoretical Guarantees
- arxiv url: http://arxiv.org/abs/2406.07284v2
- Date: Thu, 24 Oct 2024 08:09:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-25 16:43:14.117936
- Title: Unsupervised Object Detection with Theoretical Guarantees
- Title(参考訳): 理論的保証を用いた教師なし物体検出
- Authors: Marian Longa, João F. Henriques,
- Abstract要約: 我々は、教師なしオブジェクト検出アーキテクチャを開発し、学習された変数が、小さなシフトまでの真のオブジェクト位置に対応することを証明した。
理論的予測は個々のピクセルの精度まで検証する。
現行のSOTAオブジェクト検出法とは異なり,提案手法の予測誤差は常に理論的境界内にある。
- 参考スコア(独自算出の注目度): 15.779730667509915
- License:
- Abstract: Unsupervised object detection using deep neural networks is typically a difficult problem with few to no guarantees about the learned representation. In this work we present the first unsupervised object detection method that is theoretically guaranteed to recover the true object positions up to quantifiable small shifts. We develop an unsupervised object detection architecture and prove that the learned variables correspond to the true object positions up to small shifts related to the encoder and decoder receptive field sizes, the object sizes, and the widths of the Gaussians used in the rendering process. We perform detailed analysis of how the error depends on each of these variables and perform synthetic experiments validating our theoretical predictions up to a precision of individual pixels. We also perform experiments on CLEVR-based data and show that, unlike current SOTA object detection methods (SAM, CutLER), our method's prediction errors always lie within our theoretical bounds. We hope that this work helps open up an avenue of research into object detection methods with theoretical guarantees.
- Abstract(参考訳): ディープニューラルネットワークを用いた教師なしオブジェクト検出は、学習された表現に関する保証がほとんど、あるいは全くない難しい問題である。
本研究では, 理論上, 定量化可能な小シフトまでの真の物体位置を復元することが保証された最初の教師なし物体検出法を提案する。
我々は、教師なしオブジェクト検出アーキテクチャを開発し、学習した変数が、エンコーダとデコーダの受容フィールドサイズ、オブジェクトサイズ、レンダリングプロセスで使用されるガウスの幅に関連する小さなシフトまで、真のオブジェクト位置に対応することを証明した。
誤差がそれぞれの変数にどのように依存するかを詳細に分析し、各画素の精度まで理論予測を検証した合成実験を行う。
また,従来のSOTAオブジェクト検出法(SAM, CutLER)とは異なり,提案手法の予測誤差は常に理論的境界内にあることを示す。
この研究が、理論的保証のある物体検出手法の研究の道を開くのに役立つことを願っている。
関連論文リスト
- On the Inherent Robustness of One-Stage Object Detection against Out-of-Distribution Data [6.7236795813629]
画像データ中の未知物体を検出する新しい検出アルゴリズムを提案する。
モデルによって抽出された特徴に対する次元の呪いの影響を軽減するために、教師付き次元削減技術を利用する。
これは高解像度の特徴マップを用いて、教師なしの方法で潜在的に未知の物体を識別する。
論文 参考訳(メタデータ) (2024-11-07T10:15:25Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Fast and Accurate Object Detection on Asymmetrical Receptive Field [0.0]
本稿では,物体検出精度を受容場の変化の観点から改善する手法を提案する。
YOLOv5の頭部の構造は、非対称なプール層を付加することによって改変される。
本稿では, 従来の YOLOv5 モデルと比較し, いくつかのパラメータから解析する。
論文 参考訳(メタデータ) (2023-03-15T23:59:18Z) - A Review of Uncertainty Calibration in Pretrained Object Detectors [5.440028715314566]
多クラス設定における事前訓練対象検出アーキテクチャの不確実性校正特性について検討する。
公平でバイアスのない,繰り返し可能な評価を実現するためのフレームワークを提案する。
検出器のキャリブレーションが低い理由について、新しい知見を提供する。
論文 参考訳(メタデータ) (2022-10-06T14:06:36Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - ODDObjects: A Framework for Multiclass Unsupervised Anomaly Detection on
Masked Objects [0.0]
ODDObjectsは、COCOスタイルのデータセットでトレーニングされた教師なしオートエンコーダを使用して、さまざまなカテゴリの異常を検出するように設計されている。
このフレームワークはオートエンコーダによる異常検出に関する以前の作業を拡張し、オブジェクト認識データセットでトレーニングされた最先端のモデルを比較する。
論文 参考訳(メタデータ) (2021-04-26T01:13:28Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - End-to-End Object Detection with Transformers [88.06357745922716]
本稿では,オブジェクト検出を直接セット予測問題とみなす新しい手法を提案する。
我々のアプローチは検出パイプラインを合理化し、手作業で設計された多くのコンポーネントの必要性を効果的に除去する。
この新しいフレームワークの主な構成要素は、Detection TRansformerまたはDETRと呼ばれ、セットベースのグローバルな損失である。
論文 参考訳(メタデータ) (2020-05-26T17:06:38Z) - BiDet: An Efficient Binarized Object Detector [96.19708396510894]
本稿では,効率的な物体検出のためのバイナライズニューラルネットワークのBiDetを提案する。
我々のBiDetは、冗長除去による物体検出にバイナリニューラルネットワークの表現能力を完全に活用している。
我々の手法は、最先端のバイナリニューラルネットワークを大きなマージンで上回る。
論文 参考訳(メタデータ) (2020-03-09T08:16:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。