論文の概要: Commonsense Knowledge Assisted Deep Learning for Resource-constrained
and Fine-grained Object Detection
- arxiv url: http://arxiv.org/abs/2303.09026v4
- Date: Wed, 24 May 2023 13:39:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 01:52:34.478541
- Title: Commonsense Knowledge Assisted Deep Learning for Resource-constrained
and Fine-grained Object Detection
- Title(参考訳): 資源制約および細粒度物体検出のためのコモンセンス知識支援深層学習
- Authors: Pu Zhang, Bin Liu
- Abstract要約: 本稿では,コモンセンスの知識を応用して,粗粒度検出の精度向上を支援する手法を提案する。
本手法は,アノテートデータの量が少なく,モデルサイズも小さく,高精度な粒度検出を実現する。
- 参考スコア(独自算出の注目度): 10.11482186385971
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper addresses fine-grained object detection in scenarios with limited
computing resources, such as edge computing. Deep learning (DL), particularly
through the use of deep neural networks (DNNs), has become the primary approach
to object detection. However, obtaining accurate fine-grained detection
requires a large DNN model and a significant amount of annotated data,
presenting a challenge for modern DL object detectors in resource-constrained
cases. To address this issue, we propose an approach that utilizes commonsense
knowledge to assist a coarse-grained object detector in achieving accurate
fine-grained detection results. Specifically, we introduce a commonsense
knowledge inference module (CKIM) that processes the coarse-grained labels
produced by a benchmark coarse-grained DL detector to generate fine-grained
labels. Our CKIM explores both crisp-rule and fuzzy-rule based inference
methods, with the latter being employed to handle ambiguity in the target
semantic labels. We implement our method based on two modern DL detectors,
including Mobilenet-SSD, and YOLOv7-tiny. Experimental results demonstrate that
our approach achieves accurate fine-grained detections with a reduced amount of
annotated data, and smaller model size. Our code is available at
https://github.com/ZJLAB-AMMI/CKIM.
- Abstract(参考訳): 本稿では,エッジコンピューティングなどの限られた計算資源を有するシナリオにおけるきめ細かい物体検出について述べる。
ディープラーニング(DL)、特にディープニューラルネットワーク(DNN)の使用は、オブジェクト検出の主要なアプローチとなっている。
しかしながら、正確なきめ細かな検出を得るには、大きなdnnモデルとかなりの量の注釈データが必要であり、リソース制約のあるケースでは現代のdlオブジェクト検出器が課題となる。
そこで本研究では,コモンセンスの知識を生かして粗粒物体検出装置の精度向上を支援する手法を提案する。
具体的には,ベンチマーク粗粒度dl検出器が生成する粗粒度ラベルを処理して細粒度ラベルを生成するcommonsense knowledge inference module (ckim)を提案する。
CKIMではクリップルールとファジィルールに基づく推論手法の両方を探索し、後者はターゲットセマンティックラベルのあいまいさを扱うために使用される。
我々はmobilenet-ssdとyolov7-tinyを含む2つの現代のdl検出器に基づいて本手法を実装した。
実験の結果,アノテートされたデータ量が少なく,モデルサイズも小さく,正確な細粒度検出が可能となった。
私たちのコードはhttps://github.com/ZJLAB-AMMI/CKIMで公開されています。
関連論文リスト
- GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty
Estimation [59.05097963821385]
本稿では,ジェネレーティブなラベルの不確実性推定フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
提案手法を様々な人気ベース3D検出器に組み込んで,その性能がOpenデータセットとKITTIデータセット上での最先端に著しく向上していることを確認する。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - Double-Dot Network for Antipodal Grasp Detection [20.21384585441404]
本稿では,Double-Dot Network (DD-Net) という,対足足歩行検出のための新しい深層学習手法を提案する。
これは、経験的にプリセットされたアンカーに依存しない最近のアンカーフリーなオブジェクト検出フレームワークに従っている。
このような指先をローカライズするために効果的なCNNアーキテクチャを導入し、改良のための補助センターの助けを借りて、把握候補を正確かつ堅牢に推測する。
論文 参考訳(メタデータ) (2021-08-03T14:21:17Z) - Unsupervised Object Detection with LiDAR Clues [70.73881791310495]
本稿では,LiDARの手がかりを用いた非教師対象検出のための最初の実用的手法を提案する。
提案手法では,まず3次元点雲に基づく候補オブジェクトセグメントを生成する。
そして、セグメントラベルを割り当て、セグメントラベルネットワークを訓練する反復的なセグメントラベル処理を行う。
ラベル付けプロセスは、長い尾とオープンエンドの分布の問題を軽減するために慎重に設計されている。
論文 参考訳(メタデータ) (2020-11-25T18:59:54Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Boosting Weakly Supervised Object Detection with Progressive Knowledge
Transfer [40.23657486941391]
弱教師付き物体検出精度を高めるための効果的な知識伝達フレームワークを提案する。
情報源領域からの知識を一級普遍検出器で反復的に伝達し,対象領域検出器を学習する。
我々は、VOCテストセットで59.7%のmAPと、完全に教師されたFaster RCNNを再トレーニングした後で60.2%のmAPを達成した。
論文 参考訳(メタデータ) (2020-07-15T20:38:25Z) - BiDet: An Efficient Binarized Object Detector [96.19708396510894]
本稿では,効率的な物体検出のためのバイナライズニューラルネットワークのBiDetを提案する。
我々のBiDetは、冗長除去による物体検出にバイナリニューラルネットワークの表現能力を完全に活用している。
我々の手法は、最先端のバイナリニューラルネットワークを大きなマージンで上回る。
論文 参考訳(メタデータ) (2020-03-09T08:16:16Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z) - Progressive Object Transfer Detection [84.48927705173494]
本稿では,新しいプログレッシブオブジェクト転送検出(POTD)フレームワークを提案する。
第一に、POTDは様々なドメインの様々なオブジェクトを効果的にプログレッシブな検出手順に活用することができる。
第2に、POTDは2つの微妙な転送段階、すなわち、LSTD(low-Shot Transfer Detection)とWSTD(Weakly Supervised Transfer Detection)から構成される。
論文 参考訳(メタデータ) (2020-02-12T00:16:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。