論文の概要: Hybrid Channel Based Pedestrian Detection
- arxiv url: http://arxiv.org/abs/1912.12431v2
- Date: Thu, 30 Jan 2020 04:20:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-17 12:53:00.538090
- Title: Hybrid Channel Based Pedestrian Detection
- Title(参考訳): ハイブリッドチャネルを用いた歩行者検出
- Authors: Fiseha B. Tesema, Hong Wu, Mingjian Chen, Junpeng Lin, William Zhu,
Kaizhu Huang
- Abstract要約: そこで我々は,手作り機能とCNN機能を組み合わせたRPN+BFフレームワークを拡張した新しい歩行者検出フレームワークを提案する。
本実験により,VGG-16ネットから抽出したCNN特徴よりも,手工芸品が検出精度が高いことがわかった。
- 参考スコア(独自算出の注目度): 15.696919306737321
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pedestrian detection has achieved great improvements with the help of
Convolutional Neural Networks (CNNs). CNN can learn high-level features from
input images, but the insufficient spatial resolution of CNN feature channels
(feature maps) may cause a loss of information, which is harmful especially to
small instances. In this paper, we propose a new pedestrian detection
framework, which extends the successful RPN+BF framework to combine handcrafted
features and CNN features. RoI-pooling is used to extract features from both
handcrafted channels (e.g. HOG+LUV, CheckerBoards or RotatedFilters) and CNN
channels. Since handcrafted channels always have higher spatial resolution than
CNN channels, we apply RoI-pooling with larger output resolution to handcrafted
channels to keep more detailed information. Our ablation experiments show that
the developed handcrafted features can reach better detection accuracy than the
CNN features extracted from the VGG-16 net, and a performance gain can be
achieved by combining them. Experimental results on Caltech pedestrian dataset
with the original annotations and the improved annotations demonstrate the
effectiveness of the proposed approach. When using a more advanced RPN in our
framework, our approach can be further improved and get competitive results on
both benchmarks.
- Abstract(参考訳): 歩行者検出は畳み込みニューラルネットワーク(CNN)の助けを借りて大幅に改善されている。
CNNは入力画像から高レベルな特徴を学習できるが、CNNの特徴チャネル(フィーチャーマップ)の空間解像度が不十分なため、特に小さなケースでは有害な情報を失う可能性がある。
本稿では,手作り機能とCNN機能を組み合わせたRPN+BFフレームワークを拡張した新しい歩行者検出フレームワークを提案する。
RoIプールは、手作りのチャンネル(HOG+LUV、CheckerBoards、RotatedFiltersなど)とCNNのチャンネルの両方から機能を抽出するために使用される。
ハンドクラフトドチャネルは常にcnnチャネルよりも高い空間解像度を持つため、より詳細な情報を保持するために、ハンドクラフトドチャネルにより大きな出力解像度を持つroiプールを適用する。
アブレーション実験により,VGG-16ネットから抽出したCNN特徴よりも手作り特徴が検出精度が向上し,その組み合わせによる性能向上が達成された。
オリジナルのアノテーションと改良されたアノテーションを用いたcaltech pedestrian datasetの実験結果は,提案手法の有効性を示している。
我々のフレームワークでより高度なRPNを使用する場合、我々のアプローチはさらに改善され、両方のベンチマークで競合する結果が得られる。
関連論文リスト
- Distilling Channels for Efficient Deep Tracking [68.13422829310835]
本稿では,ディープトラッカーを容易にするための新しいチャネル蒸留法を提案する。
統合的な定式化は,特徴圧縮,応答マップ生成,モデル更新を統一エネルギー最小化問題に変換することができることを示す。
その結果、ディープトラッカーは正確で高速で、メモリ要求が低い。
論文 参考訳(メタデータ) (2024-09-18T08:09:20Z) - Research on fusing topological data analysis with convolutional neural network [1.0222202698528364]
本稿では,TDA(Topological Data Analysis)とCNN(TDA-CNN)に基づく特徴融合手法を提案する。
本手法は,CNNが取得した数値分布特徴とTDAが取得した位相構造特徴を組み合わせることで,CNNの特徴学習と表現能力を向上させる。
書道家によるIntel Image、Gender Images、中国書道スタイルなどのデータセットに対する実験的検証では、TDA-CNNはVGG16、DenseNet121、GoogleNetネットワークのパフォーマンスをそれぞれ17.5%、7.11%、そして4.45%改善している。
論文 参考訳(メタデータ) (2024-06-19T07:43:53Z) - Kronecker Product Feature Fusion for Convolutional Neural Network in
Remote Sensing Scene Classification [0.0]
CNNはリモートセンシング画像から階層的畳み込み特徴を抽出できる。
AddとConcatという2つのFeature Fusionメソッドは、ある種の最先端CNNアルゴリズムで採用されている。
Kronecker Product (KPFF) を用いた上記の手法を統一した新しいFeature Fusionアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-01-08T19:01:01Z) - Testing the Channels of Convolutional Neural Networks [8.927538538637783]
畳み込みニューラルネットワーク(CNN)のチャネルをテストする手法を提案する。
GANの拡張であるFtGANを設計し、ターゲットCNNのチャネルの強度を変化させてテストデータを生成する。
また,テストのための代表的なチャネルを見つけるためのチャネル選択アルゴリズムも提案した。
論文 参考訳(メタデータ) (2023-03-06T09:58:39Z) - An Efficient Evolutionary Deep Learning Framework Based on Multi-source
Transfer Learning to Evolve Deep Convolutional Neural Networks [8.40112153818812]
畳み込みニューラルネットワーク(CNN)は、より複雑なトポロジを導入し、より深くより広いCNNへのキャパシティを拡大することで、長年にわたって、より優れたパフォーマンスを実現してきた。
計算コストは依然としてCNNを自動設計するボトルネックである。
本稿では, CNNを効率的に進化させるために, トランスファーラーニングにヒントを得て, 新たな進化的計算ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-07T20:22:58Z) - Attention-based Feature Compression for CNN Inference Offloading in Edge
Computing [93.67044879636093]
本稿では,デバイスエッジ共振器におけるCNN推論の計算負荷について検討する。
エンドデバイスにおける効率的な特徴抽出のための新しいオートエンコーダベースのCNNアーキテクチャ(AECNN)を提案する。
実験の結果、AECNNは中間データを約4%の精度で256倍圧縮できることがわかった。
論文 参考訳(メタデータ) (2022-11-24T18:10:01Z) - SAR Despeckling Using Overcomplete Convolutional Networks [53.99620005035804]
スペックルはSAR画像を劣化させるため、リモートセンシングにおいて重要な問題である。
近年の研究では、畳み込みニューラルネットワーク(CNN)が古典的解法よりも優れていることが示されている。
本研究は、受容場を制限することで低レベルの特徴を学習することに集中するために、過剰なCNNアーキテクチャを用いる。
本稿では,合成および実SAR画像の非特定化手法と比較して,提案手法により非特定化性能が向上することを示す。
論文 参考訳(メタデータ) (2022-05-31T15:55:37Z) - Image Super-resolution with An Enhanced Group Convolutional Neural
Network [102.2483249598621]
学習能力の強いCNNは、超解像問題を解くために広く選択されている。
浅層構造を持つ超解像群CNN(ESRGCNN)を提案する。
ESRGCNNは、SISRの性能、複雑さ、実行速度、画質評価およびSISRの視覚効果の観点から、最先端技術を上回っていると報告されている。
論文 参考訳(メタデータ) (2022-05-29T00:34:25Z) - DeepTx: Deep Learning Beamforming with Channel Prediction [8.739166282613118]
本研究では,送信機の機械学習アルゴリズムに着目した。
ビームフォーミングを考慮し、所定のアップリンクチャネル推定を入力として、ビームフォーミングに使用するダウンリンクチャネル情報を出力するCNNを提案する。
ニューラルネットワークの主なタスクは、アップリンクとダウンリンクスロットの間のチャネル進化を予測することだが、チェーン全体の非効率性とエラーを処理することも学べる。
論文 参考訳(メタデータ) (2022-02-16T11:19:54Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Approximation and Non-parametric Estimation of ResNet-type Convolutional
Neural Networks [52.972605601174955]
本稿では,ResNet型CNNが重要な関数クラスにおいて最小誤差率を達成可能であることを示す。
Barron と H'older のクラスに対する前述のタイプの CNN の近似と推定誤差率を導出する。
論文 参考訳(メタデータ) (2019-03-24T19:42:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。