論文の概要: Building Flyweight FLIM-based CNNs with Adaptive Decoding for Object
Detection
- arxiv url: http://arxiv.org/abs/2306.14840v2
- Date: Thu, 5 Oct 2023 09:22:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-06 22:02:20.607700
- Title: Building Flyweight FLIM-based CNNs with Adaptive Decoding for Object
Detection
- Title(参考訳): 物体検出のための適応デコードを用いたフライ級FLIMベースCNNの構築
- Authors: Leonardo de Melo Joao, Azael de Melo e Sousa, Bianca Martins dos
Santos, Silvio Jamil Ferzoli Guimaraes, Jancarlo Ferreira Gomes, Ewa Kijak,
Alexandre Xavier Falcao
- Abstract要約: 本研究では、ユーザ描画マーカーからオブジェクトを検出するために、畳み込みニューラルネットワーク(CNN)層を構築する方法を提案する。
糞便サンプルの顕微鏡画像におけるSchistosomiasis mansoni卵の検出と,衛星画像における船舶の検出に対処する。
我々のCNNは、SOTAオブジェクト検出器より数千倍も小さく、CPU実行に適している。
- 参考スコア(独自算出の注目度): 40.97322222472642
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State-of-the-art (SOTA) object detection methods have succeeded in several
applications at the price of relying on heavyweight neural networks, which
makes them inefficient and inviable for many applications with computational
resource constraints. This work presents a method to build a Convolutional
Neural Network (CNN) layer by layer for object detection from user-drawn
markers on discriminative regions of representative images. We address the
detection of Schistosomiasis mansoni eggs in microscopy images of fecal
samples, and the detection of ships in satellite images as application
examples. We could create a flyweight CNN without backpropagation from very few
input images. Our method explores a recent methodology, Feature Learning from
Image Markers (FLIM), to build convolutional feature extractors (encoders) from
marker pixels. We extend FLIM to include a single-layer adaptive decoder, whose
weights vary with the input image -- a concept never explored in CNNs. Our CNN
weighs thousands of times less than SOTA object detectors, being suitable for
CPU execution and showing superior or equivalent performance to three methods
in five measures.
- Abstract(参考訳): sota(state-of-the-art)オブジェクト検出手法は、重み付きニューラルネットワークに依存する価格で、いくつかのアプリケーションで成功している。
本研究では,代表画像の識別領域上のユーザ描画マーカーからオブジェクトを検出するために,畳み込みニューラルネットワーク(CNN)層を構築する手法を提案する。
糞便サンプルの顕微鏡画像におけるSchistosomiasis mansoni卵の検出と,衛星画像中の船舶の検出を応用例として扱う。
ごく少数の入力画像のバックプロパゲーションなしに、フライウェイトなCNNを作成することができる。
本研究では,画像マーカ(flim)から特徴学習を行い,マーカ画素から畳み込み特徴抽出器(エンコーダ)を構築する手法を提案する。
flimを拡張して、入力画像によって重みが異なる単層適応デコーダを含むようにした。
私たちのcnnはsomaオブジェクト検出器の何千倍も重く、cpuの実行に適しており、5つの尺度で3つの方法に匹敵する性能を示している。
関連論文リスト
- Deep Dynamic Scene Deblurring from Optical Flow [53.625999196063574]
汚れは視覚的により快適な写真を提供し、写真がより便利になる。
非均一な曖昧さを数学的にモデル化することは困難である。
我々は,難解な特徴から鮮明な画像を復元する畳み込みニューラルネットワーク(CNN)を開発した。
論文 参考訳(メタデータ) (2023-01-18T06:37:21Z) - Paint and Distill: Boosting 3D Object Detection with Semantic Passing
Network [70.53093934205057]
ライダーやカメラセンサーからの3Dオブジェクト検出タスクは、自動運転に不可欠である。
本研究では,既存のライダーベース3D検出モデルの性能向上を図るために,SPNetという新しいセマンティックパスフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-12T12:35:34Z) - New SAR target recognition based on YOLO and very deep multi-canonical
correlation analysis [0.1503974529275767]
本稿では,異なるCNN層から有効な特徴を適応的に融合させることにより,SAR画像ターゲット分類のためのロバストな特徴抽出手法を提案する。
MSTARデータセットの実験により,提案手法が最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-10-28T18:10:26Z) - Issues in Object Detection in Videos using Common Single-Image CNNs [0.0]
物体検出は、産業プロセス、医療画像分析、自動運転車などの多くの用途で使われている。
自動運転車のようなアプリケーションにとって、オブジェクト検出システムはビデオ内の複数のフレームを通してオブジェクトを識別できることが重要である。
オブジェクト検出には多くのニューラルネットワークが使われており、もしフレーム間でオブジェクトを接続する方法があったら、これらの問題は排除される可能性がある。
データセットは、連続するビデオフレームを表現し、接地構造層と一致するイメージで作成されなければならない。
論文 参考訳(メタデータ) (2021-05-26T20:33:51Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Learning Hybrid Representations for Automatic 3D Vessel Centerline
Extraction [57.74609918453932]
3次元医用画像からの血管の自動抽出は血管疾患の診断に不可欠である。
既存の方法では、3次元画像からそのような細い管状構造を分割する際に、抽出された容器の不連続に悩まされることがある。
抽出された船舶の連続性を維持するためには、地球的幾何学を考慮に入れる必要があると論じる。
この課題を解決するためのハイブリッド表現学習手法を提案します。
論文 参考訳(メタデータ) (2020-12-14T05:22:49Z) - Multi-pooled Inception features for no-reference image quality
assessment [0.0]
畳み込みニューラルネットワーク(CNN)を用いた画像品質評価の新しい手法を提案する。
従来の手法とは対照的に、入力画像からパッチを取らない。代わりに、入力画像は全体として処理され、事前訓練されたCNN本体を通して実行され、解像度に依存しない多段階の深い特徴を抽出する。
我々は、MultiGAP-NRIQAと呼ばれるベストな提案が、3つのベンチマークIQAデータベースに対して最先端の結果を提供することができることを実証した。
論文 参考訳(メタデータ) (2020-11-10T15:09:49Z) - Multiscale Detection of Cancerous Tissue in High Resolution Slide Scans [0.0]
高分解能スライドスキャンにおけるマルチスケール腫瘍(キメラ細胞)検出アルゴリズムを提案する。
提案手法では,CNNの異なる層における有効受容場を改良し,幅広いスケールの物体を1つの前方通過で検出する。
論文 参考訳(メタデータ) (2020-10-01T18:56:46Z) - Learning CNN filters from user-drawn image markers for coconut-tree
image classification [78.42152902652215]
本稿では,CNNの特徴抽出器を訓練するために,最小限のユーザ選択画像を必要とする手法を提案する。
本手法は,クラスを識別する画像領域のユーザ描画マーカーから,各畳み込み層のフィルタを学習する。
バックプロパゲーションに基づく最適化には依存せず、ココナッツツリー空中画像のバイナリ分類にその利点を実証する。
論文 参考訳(メタデータ) (2020-08-08T15:50:23Z) - Verification of Deep Convolutional Neural Networks Using ImageStars [10.44732293654293]
畳み込みニューラルネットワーク(CNN)は、多くの現実世界で最先端のアプリケーションを再定義している。
CNNは敵の攻撃に対して脆弱であり、入力のわずかな変更は出力の急激な変更につながる可能性がある。
本稿では,VGG16やVGG19などの実世界のCNNを,ImageNet上で高い精度で処理可能なセットベースフレームワークについて述べる。
論文 参考訳(メタデータ) (2020-04-12T00:37:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。