論文の概要: Towards Commonsense Knowledge based Fuzzy Systems for Supporting
Size-Related Fine-Grained Object Detection
- arxiv url: http://arxiv.org/abs/2303.09026v7
- Date: Mon, 29 Jan 2024 04:20:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 23:06:04.133619
- Title: Towards Commonsense Knowledge based Fuzzy Systems for Supporting
Size-Related Fine-Grained Object Detection
- Title(参考訳): ファジィ・ファジィ・システムによる細粒度物体検出支援に向けて
- Authors: Pu Zhang, Tianhua Chen, Bin Liu
- Abstract要約: 本稿では,軽量な深層ニューラルネットワークベース粗粒物体検出支援のための共通知識推論モジュール(CKIM)を提案する。
具体的には、ひとつの画像が類似のカテゴリのオブジェクトを含むが、サイズが異なるシナリオに焦点を当てる。
提案手法は, 注釈付きデータが少なく, モデルサイズも小さく, 高精度な粒度検出を実現する。
- 参考スコア(独自算出の注目度): 13.510102802440255
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Deep learning has become the dominating approach for object detection. To
achieve accurate fine-grained detection, one needs to employ a large enough
model and a vast amount of data annotations. In this paper, we propose a
commonsense knowledge inference module (CKIM) which leverages commonsense
knowledge to assist a lightweight deep neural network base coarse-grained
object detector to achieve accurate fine-grained detection. Specifically, we
focus on a scenario where a single image contains objects of similar categories
but varying sizes, and we establish a size-related commonsense knowledge
inference module (CKIM) that maps the coarse-grained labels produced by the DL
detector to size-related fine-grained labels. Considering that rule-based
systems are one of the popular methods of knowledge representation and
reasoning, our experiments explored two types of rule-based CKIMs, implemented
using crisp-rule and fuzzy-rule approaches, respectively. Experimental results
demonstrate that compared with baseline methods, our approach achieves accurate
fine-grained detection with a reduced amount of annotated data and smaller
model size. Our code is available at: https://github.com/ZJLAB-AMMI/CKIM.
- Abstract(参考訳): ディープラーニングはオブジェクト検出において支配的なアプローチとなっている。
正確なきめ細かい検出を実現するには、十分なモデルと膨大な量のデータアノテーションを使う必要がある。
本稿では,コモンセンス・ナレッジ・推論・モジュール (CKIM) を提案する。このモジュールは,コモンセンス・ナレッジを利用して,軽量のディープニューラルネットワークベース粗粒物体検出器の精度向上を支援する。
具体的には、同一画像が類似するカテゴリのオブジェクトを含むが、サイズが異なるシナリオに注目し、dl検出器が生成する粗粒度ラベルをサイズ関連細粒度ラベルにマッピングする、サイズ関連共通センス知識推論モジュール(ckim)を確立する。
ルールベースシステムは知識表現と推論の一般的な方法の1つであることを考慮し,ルールベースCKIMの2つのタイプについて検討した。
実験により,本手法はベースライン法と比較して,アノテートデータ量が少なく,モデルサイズも小さい精度で精度良く検出できることがわかった。
私たちのコードは、https://github.com/ZJLAB-AMMI/CKIM.comで利用可能です。
関連論文リスト
- Semi-Supervised and Long-Tailed Object Detection with CascadeMatch [91.86787064083012]
そこで我々はCascadeMatchと呼ばれる新しい擬似ラベル型検出器を提案する。
我々の検出器は、プログレッシブな信頼しきい値を持つ多段検出ヘッドを備えたカスケードネットワークアーキテクチャを備えている。
CascadeMatchは、長い尾のオブジェクト検出の処理において、既存の最先端の半教師付きアプローチを超越していることを示す。
論文 参考訳(メタデータ) (2023-05-24T07:09:25Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - RFLA: Gaussian Receptive Field based Label Assignment for Tiny Object
Detection [45.10513110142015]
現在のアンカーベースまたはアンカーフリーなラベル割り当てパラダイムは、多くのアウトリーな小さな基底真理サンプルを発生させる。
本稿では,小物体検出のためのガウス受容場に基づくラベルアサインメント(RFLA)戦略を提案する。
当社のアプローチは、AI-TODデータセットの4.0APポイントで最先端の競合より優れています。
論文 参考訳(メタデータ) (2022-08-18T09:35:56Z) - Compare learning: bi-attention network for few-shot learning [6.559037166322981]
距離学習と呼ばれる数ショットの学習手法の1つは、画像のペアが同じカテゴリに属しているかどうかを判断するために、まず遠距離計量を学習することで、この課題に対処する。
本稿では, インスタンスの埋め込みの類似性を正確に, グローバルかつ効率的に測定できる, Bi-attention Network という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T07:39:10Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z) - MLF-SC: Incorporating multi-layer features to sparse coding for anomaly
detection [2.2276675054266395]
画像の異常は、カーペットの上の小さな穴から大きな汚れまで、様々なスケールで発生する。
広く使われている異常検出方法の1つであるスパースコーディング(sparse coding)は、画像のスパース表現に使用されるパッチサイズから外れた異常を扱う際に問題となる。
本稿では,マルチスケール機能をスパース符号化に取り入れ,異常検出の性能を向上させることを提案する。
論文 参考訳(メタデータ) (2021-04-09T10:20:34Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。