論文の概要: Commonsense Knowledge Assisted Deep Learning for Resource-constrained
and Fine-grained Object Detection
- arxiv url: http://arxiv.org/abs/2303.09026v4
- Date: Wed, 24 May 2023 13:39:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 01:52:34.478541
- Title: Commonsense Knowledge Assisted Deep Learning for Resource-constrained
and Fine-grained Object Detection
- Title(参考訳): 資源制約および細粒度物体検出のためのコモンセンス知識支援深層学習
- Authors: Pu Zhang, Bin Liu
- Abstract要約: 本稿では,コモンセンスの知識を応用して,粗粒度検出の精度向上を支援する手法を提案する。
本手法は,アノテートデータの量が少なく,モデルサイズも小さく,高精度な粒度検出を実現する。
- 参考スコア(独自算出の注目度): 10.11482186385971
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper addresses fine-grained object detection in scenarios with limited
computing resources, such as edge computing. Deep learning (DL), particularly
through the use of deep neural networks (DNNs), has become the primary approach
to object detection. However, obtaining accurate fine-grained detection
requires a large DNN model and a significant amount of annotated data,
presenting a challenge for modern DL object detectors in resource-constrained
cases. To address this issue, we propose an approach that utilizes commonsense
knowledge to assist a coarse-grained object detector in achieving accurate
fine-grained detection results. Specifically, we introduce a commonsense
knowledge inference module (CKIM) that processes the coarse-grained labels
produced by a benchmark coarse-grained DL detector to generate fine-grained
labels. Our CKIM explores both crisp-rule and fuzzy-rule based inference
methods, with the latter being employed to handle ambiguity in the target
semantic labels. We implement our method based on two modern DL detectors,
including Mobilenet-SSD, and YOLOv7-tiny. Experimental results demonstrate that
our approach achieves accurate fine-grained detections with a reduced amount of
annotated data, and smaller model size. Our code is available at
https://github.com/ZJLAB-AMMI/CKIM.
- Abstract(参考訳): 本稿では,エッジコンピューティングなどの限られた計算資源を有するシナリオにおけるきめ細かい物体検出について述べる。
ディープラーニング(DL)、特にディープニューラルネットワーク(DNN)の使用は、オブジェクト検出の主要なアプローチとなっている。
しかしながら、正確なきめ細かな検出を得るには、大きなdnnモデルとかなりの量の注釈データが必要であり、リソース制約のあるケースでは現代のdlオブジェクト検出器が課題となる。
そこで本研究では,コモンセンスの知識を生かして粗粒物体検出装置の精度向上を支援する手法を提案する。
具体的には,ベンチマーク粗粒度dl検出器が生成する粗粒度ラベルを処理して細粒度ラベルを生成するcommonsense knowledge inference module (ckim)を提案する。
CKIMではクリップルールとファジィルールに基づく推論手法の両方を探索し、後者はターゲットセマンティックラベルのあいまいさを扱うために使用される。
我々はmobilenet-ssdとyolov7-tinyを含む2つの現代のdl検出器に基づいて本手法を実装した。
実験の結果,アノテートされたデータ量が少なく,モデルサイズも小さく,正確な細粒度検出が可能となった。
私たちのコードはhttps://github.com/ZJLAB-AMMI/CKIMで公開されています。
関連論文リスト
- Semi-Supervised and Long-Tailed Object Detection with CascadeMatch [91.86787064083012]
そこで我々はCascadeMatchと呼ばれる新しい擬似ラベル型検出器を提案する。
我々の検出器は、プログレッシブな信頼しきい値を持つ多段検出ヘッドを備えたカスケードネットワークアーキテクチャを備えている。
CascadeMatchは、長い尾のオブジェクト検出の処理において、既存の最先端の半教師付きアプローチを超越していることを示す。
論文 参考訳(メタデータ) (2023-05-24T07:09:25Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - RFLA: Gaussian Receptive Field based Label Assignment for Tiny Object
Detection [45.10513110142015]
現在のアンカーベースまたはアンカーフリーなラベル割り当てパラダイムは、多くのアウトリーな小さな基底真理サンプルを発生させる。
本稿では,小物体検出のためのガウス受容場に基づくラベルアサインメント(RFLA)戦略を提案する。
当社のアプローチは、AI-TODデータセットの4.0APポイントで最先端の競合より優れています。
論文 参考訳(メタデータ) (2022-08-18T09:35:56Z) - Compare learning: bi-attention network for few-shot learning [6.559037166322981]
距離学習と呼ばれる数ショットの学習手法の1つは、画像のペアが同じカテゴリに属しているかどうかを判断するために、まず遠距離計量を学習することで、この課題に対処する。
本稿では, インスタンスの埋め込みの類似性を正確に, グローバルかつ効率的に測定できる, Bi-attention Network という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T07:39:10Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z) - MLF-SC: Incorporating multi-layer features to sparse coding for anomaly
detection [2.2276675054266395]
画像の異常は、カーペットの上の小さな穴から大きな汚れまで、様々なスケールで発生する。
広く使われている異常検出方法の1つであるスパースコーディング(sparse coding)は、画像のスパース表現に使用されるパッチサイズから外れた異常を扱う際に問題となる。
本稿では,マルチスケール機能をスパース符号化に取り入れ,異常検出の性能を向上させることを提案する。
論文 参考訳(メタデータ) (2021-04-09T10:20:34Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。