論文の概要: Commonsense Knowledge Assisted Deep Learning with Application to
Size-Related Fine-Grained Object Detection
- arxiv url: http://arxiv.org/abs/2303.09026v6
- Date: Mon, 11 Sep 2023 02:52:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-09-12 22:00:39.056573
- Title: Commonsense Knowledge Assisted Deep Learning with Application to
Size-Related Fine-Grained Object Detection
- Title(参考訳): 深層学習を支援するコモンセンス知識と細粒度物体検出への応用
- Authors: Pu Zhang, Bin Liu
- Abstract要約: 本稿では,一つの画像が同一のカテゴリのオブジェクトを含むが,サイズが異なるシナリオに焦点を当てる。
本稿では,カテゴリラベルだけでなく,実際のサイズも認識できる軽量なアプローチを提案する。
- 参考スコア(独自算出の注目度): 13.70864229992383
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we focus on a scenario where a single image contains objects
of the same category but varying sizes, and we propose a lightweight approach
that can not only recognize their category labels but also their real sizes.
Our approach utilizes commonsense knowledge to assist a deep neural network
(DNN) based coarse-grained object detector to achieve accurate size-related
fine-grained detection. Specifically, we introduce a commonsense knowledge
inference module (CKIM) that maps the coarse-grained labels produced by the DL
detector to size-related fine-grained labels. Experimental results demonstrate
that our approach achieves accurate fine-grained detections with a reduced
amount of annotated data, and smaller model size, compared with baseline
methods. Our code is available at: https://github.com/ZJLAB-AMMI/CKIM.
- Abstract(参考訳): 本稿では,一つの画像が同一のカテゴリのオブジェクトを含むが,異なるサイズのオブジェクトを含むシナリオに着目し,そのカテゴリラベルだけでなく,実際のサイズも認識できる軽量なアプローチを提案する。
提案手法では,深部ニューラルネットワーク(DNN)を用いた粗粒度物体検出器を用いて,精度の高い粒度検出を行う。
具体的には,dl検出器が生成する粗粒度ラベルをサイズ関連細粒度ラベルにマッピングするcommonsense knowledge inference module (ckim)を提案する。
実験の結果,アノテートされたデータ量が少なく,モデルサイズも小さく,精度の高い細粒度検出が可能となった。
私たちのコードは、https://github.com/ZJLAB-AMMI/CKIM.comで利用可能です。
関連論文リスト
- Semi-Supervised and Long-Tailed Object Detection with CascadeMatch [91.86787064083012]
そこで我々はCascadeMatchと呼ばれる新しい擬似ラベル型検出器を提案する。
我々の検出器は、プログレッシブな信頼しきい値を持つ多段検出ヘッドを備えたカスケードネットワークアーキテクチャを備えている。
CascadeMatchは、長い尾のオブジェクト検出の処理において、既存の最先端の半教師付きアプローチを超越していることを示す。
論文 参考訳(メタデータ) (2023-05-24T07:09:25Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - RFLA: Gaussian Receptive Field based Label Assignment for Tiny Object
Detection [45.10513110142015]
現在のアンカーベースまたはアンカーフリーなラベル割り当てパラダイムは、多くのアウトリーな小さな基底真理サンプルを発生させる。
本稿では,小物体検出のためのガウス受容場に基づくラベルアサインメント(RFLA)戦略を提案する。
当社のアプローチは、AI-TODデータセットの4.0APポイントで最先端の競合より優れています。
論文 参考訳(メタデータ) (2022-08-18T09:35:56Z) - Compare learning: bi-attention network for few-shot learning [6.559037166322981]
距離学習と呼ばれる数ショットの学習手法の1つは、画像のペアが同じカテゴリに属しているかどうかを判断するために、まず遠距離計量を学習することで、この課題に対処する。
本稿では, インスタンスの埋め込みの類似性を正確に, グローバルかつ効率的に測定できる, Bi-attention Network という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T07:39:10Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z) - MLF-SC: Incorporating multi-layer features to sparse coding for anomaly
detection [2.2276675054266395]
画像の異常は、カーペットの上の小さな穴から大きな汚れまで、様々なスケールで発生する。
広く使われている異常検出方法の1つであるスパースコーディング(sparse coding)は、画像のスパース表現に使用されるパッチサイズから外れた異常を扱う際に問題となる。
本稿では,マルチスケール機能をスパース符号化に取り入れ,異常検出の性能を向上させることを提案する。
論文 参考訳(メタデータ) (2021-04-09T10:20:34Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。