論文の概要: Learning a Metacognition for Object Detection
- arxiv url: http://arxiv.org/abs/2110.03105v1
- Date: Wed, 6 Oct 2021 23:37:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-09 09:12:03.164107
- Title: Learning a Metacognition for Object Detection
- Title(参考訳): 物体検出のためのメタ認知の学習
- Authors: Marlene Berke, Mario Belledonne, Zhangir Azerbayez, Julian
Jara-Ettinger
- Abstract要約: メタ認知によりオブジェクト認識モデルを強化する教師なしモデルを提案する。
我々は、様々な最先端の物体検出ニューラルネットワーク上でMETAGENをテストする。
我々は,METAGENがニューラルネットワークの正確なメタ認知表現を素早く学習することを発見した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In contrast to object recognition models, humans do not blindly trust their
perception when building representations of the world, instead recruiting
metacognition to detect percepts that are unreliable or false, such as when we
realize that we mistook one object for another. We propose METAGEN, an
unsupervised model that enhances object recognition models through a
metacognition. Given noisy output from an object-detection model, METAGEN
learns a meta-representation of how its perceptual system works and uses it to
infer the objects in the world responsible for the detections. METAGEN achieves
this by conditioning its inference on basic principles of objects that even
human infants understand (known as Spelke principles: object permanence,
cohesion, and spatiotemporal continuity). We test METAGEN on a variety of
state-of-the-art object detection neural networks. We find that METAGEN quickly
learns an accurate metacognitive representation of the neural network, and that
this improves detection accuracy by filling in objects that the detection model
missed and removing hallucinated objects. This approach enables generalization
to out-of-sample data and outperforms comparison models that lack a
metacognition.
- Abstract(参考訳): 物体認識モデルとは対照的に、人類は世界の表現を構築する際に自分の知覚を盲目的に信頼せず、その代わりにメタ認知を雇い、信頼できない、または偽の知覚を検出する。
本稿ではメタ認知によりオブジェクト認識モデルを強化する教師なしモデルであるMeTAGENを提案する。
物体検出モデルからノイズが生じると、METAGENは知覚システムがどのように機能するかのメタ表現を学び、検出に責任がある世界の物体を推測する。
メタゲンは、人間の幼児でも理解できる対象の基本的な原理(オブジェクトの永続性、凝集性、時空間連続性)に基づいて推論を行うことでこれを達成する。
我々は、様々な最先端物体検出ニューラルネットワーク上でMETAGENをテストする。
我々は,METAGENがニューラルネットワークの正確なメタ認知表現を素早く学習し,検出モデルが見逃したオブジェクトを埋め込んで幻覚オブジェクトを除去することにより検出精度を向上させることを発見した。
このアプローチは、サンプル外データの一般化を可能にし、メタ認知に欠ける比較モデルを上回る。
関連論文リスト
- Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。
本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文 参考訳(メタデータ) (2024-10-31T13:13:32Z) - Unsupervised Model Diagnosis [49.36194740479798]
本稿では,ユーザガイドを使わずに,意味論的対実的説明を生成するために,Unsupervised Model Diagnosis (UMO)を提案する。
提案手法は意味論における変化を特定し可視化し,その変化を広範囲なテキストソースの属性と照合する。
論文 参考訳(メタデータ) (2024-10-08T17:59:03Z) - Spatial Coherence Loss: All Objects Matter in Salient and Camouflaged Object Detection [3.03995893427722]
正確な意味分析を行うには、学習のどの段階でも現れる全てのオブジェクトレベルの予測を学習する必要がある。
本稿では,隣接画素間の相互応答を広範に使用する単一応答損失関数に組み込んだ新しい損失関数である空間コヒーレンス損失(SCLoss)を提案する。
論文 参考訳(メタデータ) (2024-02-28T20:27:49Z) - S$^3$-MonoDETR: Supervised Shape&Scale-perceptive Deformable Transformer for Monocular 3D Object Detection [21.96072831561483]
本稿では,モノクロ3次元物体検出のためのSupervised Shape&Scale-perceptive Deformable Attention' (S$3$-DA) モジュールを提案する。
これにより、S$3$-DAは、任意のカテゴリに属するクエリポイントに対する受容的フィールドを効果的に推定し、堅牢なクエリ機能を生成することができる。
KITTIとOpenデータセットの実験では、S$3$-DAが検出精度を大幅に向上することが示された。
論文 参考訳(メタデータ) (2023-09-02T12:36:38Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - A Tri-Layer Plugin to Improve Occluded Detection [100.99802831241583]
本研究では,2段階物体検出装置の頭部検出のための単純な''モジュールを提案し,部分閉塞物体のリコールを改善する。
モジュールは、ターゲットオブジェクト、オクルーダー、オクラデーのセグメンテーションマスクの三層を予測し、それによってターゲットオブジェクトのマスクをより正確に予測することができる。
また,COCO評価データセットを構築し,部分閉塞オブジェクトと分離オブジェクトのリコール性能を測定した。
論文 参考訳(メタデータ) (2022-10-18T17:59:51Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Saccade Mechanisms for Image Classification, Object Detection and
Tracking [12.751552698602744]
生体視覚からのササード機構を用いて、ディープニューラルネットワークを分類や物体検出の問題をより効率的にする方法について検討する。
提案手法は、注意駆動型視覚処理とササードのアイデアに基づいており、注意に影響された眼球運動のミニチュア化を図っている。
論文 参考訳(メタデータ) (2022-06-10T13:50:34Z) - Self-Supervised Object Detection via Generative Image Synthesis [106.65384648377349]
本稿では,自己教師対象検出のための制御可能なGANを用いたエンドツーエンド分析合成フレームワークを提案する。
オブジェクトの合成と検出を学習するために、ボックスアノテーションを使用せずに、実世界のイメージのコレクションを使用します。
我々の研究は、制御可能なGAN画像合成という新しいパラダイムを導入することで、自己教師対象検出の分野を前進させる。
論文 参考訳(メタデータ) (2021-10-19T11:04:05Z) - Diagnosing Rarity in Human-Object Interaction Detection [6.129776019898014]
ヒューマン・オブジェクト・インタラクション(HOI)検出はコンピュータビジョンにおける中核的なタスクである。
目標は、すべての人間と物体のペアをローカライズし、それらの相互作用を認識することである。
動詞「名詞」によって定義される相互作用は、長い尾の視覚的認識課題につながる。
論文 参考訳(メタデータ) (2020-06-10T08:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。