論文の概要: Commonsense Knowledge Assisted Deep Learning with Application to
Size-Related Fine-Grained Object Detection
- arxiv url: http://arxiv.org/abs/2303.09026v5
- Date: Thu, 8 Jun 2023 03:14:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-09 19:22:20.964726
- Title: Commonsense Knowledge Assisted Deep Learning with Application to
Size-Related Fine-Grained Object Detection
- Title(参考訳): 深層学習を支援するコモンセンス知識と細粒度物体検出への応用
- Authors: Pu Zhang, Bin Liu
- Abstract要約: 本稿では,エッジコンピューティングなどの限られた計算資源を持つシナリオにおける細粒度物体検出について述べる。
本稿では,コモンセンスの知識を利用して,粗粒度物体検出器の精度の高い粒度検出を行う手法を提案する。
実験により,アノテートデータの量が少なく,モデルサイズも小さく,高精度な検出が可能であることが確認された。
- 参考スコア(独自算出の注目度): 10.11482186385971
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper addresses fine-grained object detection in scenarios with limited
computing resources, such as edge computing. In particular, we focus on a
scenario where a single image contains objects of the same category but varying
sizes, and we desire an algorithm that can not only recognize the physical
class of objects but also detect their size. Deep learning (DL), particularly
through the use of deep neural networks (DNNs), has become the primary approach
to object detection. However, obtaining accurate fine-grained detection
requires a large DNN model and a significant amount of annotated data,
presenting a challenge to solve our problem particularly for
resource-constrained scenarios. To this end, we propose an approach that
utilizes commonsense knowledge to assist a coarse-grained object detector in
achieving accurate size-related fine-grained detection results. Specifically,
we introduce a commonsense knowledge inference module (CKIM) that processes the
coarse-grained labels produced by a benchmark coarse-grained DL detector to
generate size-related fine-grained labels. Our CKIM explores both crisp-rule
and fuzzy-rule based inference methods, with the latter being employed to
handle ambiguity in the target size-related labels. We implement our method
based on two modern DL detectors, including Mobilenet-SSD, and YOLOv7-tiny.
Experimental results demonstrate that our approach achieves accurate
fine-grained detections with a reduced amount of annotated data, and smaller
model size. Our code is available at https://github.com/ZJLAB-AMMI/CKIM.
- Abstract(参考訳): 本稿では,エッジコンピューティングなどの限られた計算資源を有するシナリオにおけるきめ細かい物体検出について述べる。
特に、ひとつの画像が同一のカテゴリのオブジェクトを含むが、サイズが異なるシナリオに焦点を当て、物理的なオブジェクトのクラスを認識できるだけでなく、そのサイズも検出できるアルゴリズムを欲しがる。
ディープラーニング(DL)、特にディープニューラルネットワーク(DNN)の使用は、オブジェクト検出の主要なアプローチとなっている。
しかし, 高精度検出には大量のDNNモデルと大量のアノテートデータが必要であるため, 特に資源制約のあるシナリオでは, この問題の解決が困難である。
そこで本研究では,コモンセンスの知識を生かして粗粒物体検出装置の高精度な粒度検出を実現する手法を提案する。
具体的には、ベンチマーク粗粒度dl検出器が生成する粗粒度ラベルを処理し、粒度関連微粒度ラベルを生成するcommonsense knowledge inference module(ckim)を提案する。
我々のCKIMはクリップルールとファジィルールに基づく推論手法の両方を探索し、後者はターゲットサイズ関連ラベルのあいまいさを扱うために使用される。
我々はmobilenet-ssdとyolov7-tinyを含む2つの現代のdl検出器に基づいて本手法を実装した。
実験の結果,アノテートされたデータ量が少なく,モデルサイズも小さく,正確な細粒度検出が可能となった。
私たちのコードはhttps://github.com/ZJLAB-AMMI/CKIMで公開されています。
関連論文リスト
- Semi-Supervised and Long-Tailed Object Detection with CascadeMatch [91.86787064083012]
そこで我々はCascadeMatchと呼ばれる新しい擬似ラベル型検出器を提案する。
我々の検出器は、プログレッシブな信頼しきい値を持つ多段検出ヘッドを備えたカスケードネットワークアーキテクチャを備えている。
CascadeMatchは、長い尾のオブジェクト検出の処理において、既存の最先端の半教師付きアプローチを超越していることを示す。
論文 参考訳(メタデータ) (2023-05-24T07:09:25Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - RFLA: Gaussian Receptive Field based Label Assignment for Tiny Object
Detection [45.10513110142015]
現在のアンカーベースまたはアンカーフリーなラベル割り当てパラダイムは、多くのアウトリーな小さな基底真理サンプルを発生させる。
本稿では,小物体検出のためのガウス受容場に基づくラベルアサインメント(RFLA)戦略を提案する。
当社のアプローチは、AI-TODデータセットの4.0APポイントで最先端の競合より優れています。
論文 参考訳(メタデータ) (2022-08-18T09:35:56Z) - Compare learning: bi-attention network for few-shot learning [6.559037166322981]
距離学習と呼ばれる数ショットの学習手法の1つは、画像のペアが同じカテゴリに属しているかどうかを判断するために、まず遠距離計量を学習することで、この課題に対処する。
本稿では, インスタンスの埋め込みの類似性を正確に, グローバルかつ効率的に測定できる, Bi-attention Network という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T07:39:10Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z) - MLF-SC: Incorporating multi-layer features to sparse coding for anomaly
detection [2.2276675054266395]
画像の異常は、カーペットの上の小さな穴から大きな汚れまで、様々なスケールで発生する。
広く使われている異常検出方法の1つであるスパースコーディング(sparse coding)は、画像のスパース表現に使用されるパッチサイズから外れた異常を扱う際に問題となる。
本稿では,マルチスケール機能をスパース符号化に取り入れ,異常検出の性能を向上させることを提案する。
論文 参考訳(メタデータ) (2021-04-09T10:20:34Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。