論文の概要: MetaCOG: Learning a Metacognition to Recover What Objects Are Actually
There
- arxiv url: http://arxiv.org/abs/2110.03105v3
- Date: Tue, 29 Aug 2023 18:15:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-31 18:34:19.829380
- Title: MetaCOG: Learning a Metacognition to Recover What Objects Are Actually
There
- Title(参考訳): MetaCOG: メタ認知を学習して、実際に何があるのかを発見
- Authors: Marlene Berke, Zhangir Azerbayev, Mario Belledonne, Zenna Tavares,
Julian Jara-Ettinger
- Abstract要約: 本稿では,その信頼性の表現を学習することで,物体検出器の堅牢性を高めるメタCOGを提案する。
具体的には、MetaCOGは階層的な確率モデルであり、3Dシーンにおけるオブジェクトの関節分布を表現する。
その結果,MetaCOGは検出における誤差のレベルによって頑健であることが判明した。
- 参考スコア(独自算出の注目度): 2.4374097382908477
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans not only form representations about the world based on what we see,
but also learn meta-cognitive representations about how our own vision works.
This enables us to recognize when our vision is unreliable (e.g., when we
realize that we are experiencing a visual illusion) and enables us to question
what we see. Inspired by this human capacity, we present MetaCOG: a model that
increases the robustness of object detectors by learning representations of
their reliability, and does so without feedback. Specifically, MetaCOG is a
hierarchical probabilistic model that expresses a joint distribution over the
objects in a 3D scene and the outputs produced by a detector. When paired with
an off-the-shelf object detector, MetaCOG takes detections as input and infers
the detector's tendencies to miss objects of certain categories and to
hallucinate objects that are not actually present, all without access to
ground-truth object labels. When paired with three modern neural object
detectors, MetaCOG learns useful and accurate meta-cognitive representations,
resulting in improved performance on the detection task. Additionally, we show
that MetaCOG is robust to varying levels of error in the detections. Our
results are a proof-of-concept for a novel approach to the problem of
correcting a faulty vision system's errors. The model code, datasets, results,
and demos are available:
https://osf.io/8b9qt/?view_only=8c1b1c412c6b4e1697e3c7859be2fce6
- Abstract(参考訳): 人間は、見るものに基づいて世界についての表現を形成するだけでなく、私たちのビジョンがどのように機能するかについてのメタ認知的な表現を学ぶ。
これにより、視覚がいつ信頼できないか(例えば、視覚錯覚を経験していると気付いたとき)を認識し、何が見えるかに疑問を呈することができる。
この人間の能力にインスパイアされたMetaCOGは、信頼性の表現を学習することでオブジェクト検出器の堅牢性を高めるモデルであり、フィードバックなしでそれを行う。
具体的には、MetaCOGは階層的な確率モデルであり、3Dシーンにおけるオブジェクトと検出器によって生成された出力の関節分布を表現する。
市販のオブジェクト検出器と組み合わせると、MetaCOGは入力として検出を行い、検出器の傾向を推測し、特定のカテゴリのオブジェクトを見逃し、実際に存在しないオブジェクトを幻覚させる。
現代の3つのニューラルオブジェクト検出器と組み合わせることで、MetaCOGは有用で正確なメタ認知表現を学び、検出タスクのパフォーマンスが向上する。
さらに,MetaCOGは検出における誤差のレベルによって堅牢であることを示す。
本結果は,故障した視覚系の誤りを訂正する問題に対する新しいアプローチの実証である。
モデルコード、データセット、結果、デモは、https://osf.io/8b9qt/?
view_only=8c1b1c412c6b4e1697e3c7859be2fce6
関連論文リスト
- Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。
本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文 参考訳(メタデータ) (2024-10-31T13:13:32Z) - Unsupervised Model Diagnosis [49.36194740479798]
本稿では,ユーザガイドを使わずに,意味論的対実的説明を生成するために,Unsupervised Model Diagnosis (UMO)を提案する。
提案手法は意味論における変化を特定し可視化し,その変化を広範囲なテキストソースの属性と照合する。
論文 参考訳(メタデータ) (2024-10-08T17:59:03Z) - Spatial Coherence Loss: All Objects Matter in Salient and Camouflaged Object Detection [3.03995893427722]
正確な意味分析を行うには、学習のどの段階でも現れる全てのオブジェクトレベルの予測を学習する必要がある。
本稿では,隣接画素間の相互応答を広範に使用する単一応答損失関数に組み込んだ新しい損失関数である空間コヒーレンス損失(SCLoss)を提案する。
論文 参考訳(メタデータ) (2024-02-28T20:27:49Z) - S$^3$-MonoDETR: Supervised Shape&Scale-perceptive Deformable Transformer for Monocular 3D Object Detection [21.96072831561483]
本稿では,モノクロ3次元物体検出のためのSupervised Shape&Scale-perceptive Deformable Attention' (S$3$-DA) モジュールを提案する。
これにより、S$3$-DAは、任意のカテゴリに属するクエリポイントに対する受容的フィールドを効果的に推定し、堅牢なクエリ機能を生成することができる。
KITTIとOpenデータセットの実験では、S$3$-DAが検出精度を大幅に向上することが示された。
論文 参考訳(メタデータ) (2023-09-02T12:36:38Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - A Tri-Layer Plugin to Improve Occluded Detection [100.99802831241583]
本研究では,2段階物体検出装置の頭部検出のための単純な''モジュールを提案し,部分閉塞物体のリコールを改善する。
モジュールは、ターゲットオブジェクト、オクルーダー、オクラデーのセグメンテーションマスクの三層を予測し、それによってターゲットオブジェクトのマスクをより正確に予測することができる。
また,COCO評価データセットを構築し,部分閉塞オブジェクトと分離オブジェクトのリコール性能を測定した。
論文 参考訳(メタデータ) (2022-10-18T17:59:51Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Saccade Mechanisms for Image Classification, Object Detection and
Tracking [12.751552698602744]
生体視覚からのササード機構を用いて、ディープニューラルネットワークを分類や物体検出の問題をより効率的にする方法について検討する。
提案手法は、注意駆動型視覚処理とササードのアイデアに基づいており、注意に影響された眼球運動のミニチュア化を図っている。
論文 参考訳(メタデータ) (2022-06-10T13:50:34Z) - Self-Supervised Object Detection via Generative Image Synthesis [106.65384648377349]
本稿では,自己教師対象検出のための制御可能なGANを用いたエンドツーエンド分析合成フレームワークを提案する。
オブジェクトの合成と検出を学習するために、ボックスアノテーションを使用せずに、実世界のイメージのコレクションを使用します。
我々の研究は、制御可能なGAN画像合成という新しいパラダイムを導入することで、自己教師対象検出の分野を前進させる。
論文 参考訳(メタデータ) (2021-10-19T11:04:05Z) - Diagnosing Rarity in Human-Object Interaction Detection [6.129776019898014]
ヒューマン・オブジェクト・インタラクション(HOI)検出はコンピュータビジョンにおける中核的なタスクである。
目標は、すべての人間と物体のペアをローカライズし、それらの相互作用を認識することである。
動詞「名詞」によって定義される相互作用は、長い尾の視覚的認識課題につながる。
論文 参考訳(メタデータ) (2020-06-10T08:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。