論文の概要: Commonsense Knowledge Assisted Deep Learning for Resource-constrained
and Fine-grained Object Detection
- arxiv url: http://arxiv.org/abs/2303.09026v1
- Date: Thu, 16 Mar 2023 01:39:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 17:11:57.639950
- Title: Commonsense Knowledge Assisted Deep Learning for Resource-constrained
and Fine-grained Object Detection
- Title(参考訳): 資源制約および細粒度物体検出のためのコモンセンス知識支援深層学習
- Authors: Pu Zhang, Bin Liu
- Abstract要約: 本稿では,コモンセンスの知識を活用し,粗粒度物体検出器の高精度検出を支援する手法を提案する。
実験の結果,提案手法は,精度,モデルサイズ,処理遅延の点で,ベンチマーク検出器よりも優れていた。
- 参考スコア(独自算出の注目度): 10.11482186385971
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we consider fine-grained image object detection in
resource-constrained cases such as edge computing. Deep learning (DL), namely
learning with deep neural networks (DNNs), has become the dominating approach
to object detection. To achieve accurate fine-grained detection, one needs to
employ a large enough DNN model and a vast amount of data annotations, which
brings a challenge for using modern DL object detectors in resource-constrained
cases. To this end, we propose an approach, which leverages commonsense
knowledge to assist a coarse-grained object detector to get accurate
fine-grained detection results. Specifically, we introduce a commonsense
knowledge inference module (CKIM) to process coarse-grained lables given by a
benchmark DL detector to produce fine-grained lables. We consider both
crisp-rule and fuzzy-rule based inference in our CKIM; the latter is used to
handle ambiguity in the target semantic labels. We implement our method based
on several modern DL detectors, namely YOLOv4, Mobilenetv3-SSD and YOLOv7-tiny.
Experiment results show that our approach outperforms benchmark detectors
remarkably in terms of accuracy, model size and processing latency.
- Abstract(参考訳): 本稿では,エッジコンピューティングなどの資源制約のあるケースにおける微細な画像オブジェクト検出について考察する。
ディープラーニング(DL)、すなわちディープニューラルネットワーク(DNN)による学習は、オブジェクト検出において支配的なアプローチとなっている。
正確なきめ細かい検出を実現するには、十分に大きなDNNモデルと大量のデータアノテーションを使用する必要がある。
そこで本研究では,コモンセンスの知識を活用し,粗粒度物体検出器の高精度検出を支援する手法を提案する。
具体的には,ベンチマークDL検出器によって得られた粗粒度ラベレを処理し,微細粒度ラベレを生成するコモンセンス知識推論モジュール(CKIM)を導入する。
我々はckimにおいて、spash-rule とファジィ-rule に基づく推論の両方を考慮し、後者は対象意味ラベルの曖昧さを扱うために使用される。
本手法は, YOLOv4, Mobilenetv3-SSD, YOLOv7-tinyという, 最新のDL検出器を用いて実装した。
実験結果から,提案手法は精度,モデルサイズ,処理遅延の点でベンチマーク検出器よりも優れていた。
関連論文リスト
- Semi-Supervised and Long-Tailed Object Detection with CascadeMatch [91.86787064083012]
そこで我々はCascadeMatchと呼ばれる新しい擬似ラベル型検出器を提案する。
我々の検出器は、プログレッシブな信頼しきい値を持つ多段検出ヘッドを備えたカスケードネットワークアーキテクチャを備えている。
CascadeMatchは、長い尾のオブジェクト検出の処理において、既存の最先端の半教師付きアプローチを超越していることを示す。
論文 参考訳(メタデータ) (2023-05-24T07:09:25Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - RFLA: Gaussian Receptive Field based Label Assignment for Tiny Object
Detection [45.10513110142015]
現在のアンカーベースまたはアンカーフリーなラベル割り当てパラダイムは、多くのアウトリーな小さな基底真理サンプルを発生させる。
本稿では,小物体検出のためのガウス受容場に基づくラベルアサインメント(RFLA)戦略を提案する。
当社のアプローチは、AI-TODデータセットの4.0APポイントで最先端の競合より優れています。
論文 参考訳(メタデータ) (2022-08-18T09:35:56Z) - Compare learning: bi-attention network for few-shot learning [6.559037166322981]
距離学習と呼ばれる数ショットの学習手法の1つは、画像のペアが同じカテゴリに属しているかどうかを判断するために、まず遠距離計量を学習することで、この課題に対処する。
本稿では, インスタンスの埋め込みの類似性を正確に, グローバルかつ効率的に測定できる, Bi-attention Network という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T07:39:10Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z) - MLF-SC: Incorporating multi-layer features to sparse coding for anomaly
detection [2.2276675054266395]
画像の異常は、カーペットの上の小さな穴から大きな汚れまで、様々なスケールで発生する。
広く使われている異常検出方法の1つであるスパースコーディング(sparse coding)は、画像のスパース表現に使用されるパッチサイズから外れた異常を扱う際に問題となる。
本稿では,マルチスケール機能をスパース符号化に取り入れ,異常検出の性能を向上させることを提案する。
論文 参考訳(メタデータ) (2021-04-09T10:20:34Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。