論文の概要: DANet: Enhancing Small Object Detection through an Efficient Deformable
Attention Network
- arxiv url: http://arxiv.org/abs/2310.05768v2
- Date: Fri, 13 Oct 2023 15:00:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-16 16:34:26.688057
- Title: DANet: Enhancing Small Object Detection through an Efficient Deformable
Attention Network
- Title(参考訳): DANet: 効率的な変形性注意ネットワークによる小型物体検出の実現
- Authors: Md Sohag Mia, Abdullah Al Bary Voban, Abu Bakor Hayat Arnob, Abdu
Naim, Md Kawsar Ahmed, Md Shariful Islam
- Abstract要約: 我々は,より高速なR-CNNと最先端の手法を併用した包括的戦略を提案する。
より高速なR-CNNとFeature Pyramid Networkを組み合わせることで、製造環境に固有のマルチスケール機能を扱うことができる。
変形可能なネット(Deformable Net)は、欠陥の幾何学的バリエーションを歪曲し、従って、極小および複雑な特徴を検出できる精度をもたらす。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Efficient and accurate detection of small objects in manufacturing settings,
such as defects and cracks, is crucial for ensuring product quality and safety.
To address this issue, we proposed a comprehensive strategy by synergizing
Faster R-CNN with cutting-edge methods. By combining Faster R-CNN with Feature
Pyramid Network, we enable the model to efficiently handle multi-scale features
intrinsic to manufacturing environments. Additionally, Deformable Net is used
that contorts and conforms to the geometric variations of defects, bringing
precision in detecting even the minuscule and complex features. Then, we
incorporated an attention mechanism called Convolutional Block Attention Module
in each block of our base ResNet50 network to selectively emphasize informative
features and suppress less useful ones. After that we incorporated RoI Align,
replacing RoI Pooling for finer region-of-interest alignment and finally the
integration of Focal Loss effectively handles class imbalance, crucial for rare
defect occurrences. The rigorous evaluation of our model on both the NEU-DET
and Pascal VOC datasets underscores its robust performance and generalization
capabilities. On the NEU-DET dataset, our model exhibited a profound
understanding of steel defects, achieving state-of-the-art accuracy in
identifying various defects. Simultaneously, when evaluated on the Pascal VOC
dataset, our model showcases its ability to detect objects across a wide
spectrum of categories within complex and small scenes.
- Abstract(参考訳): 欠陥やひび割れなどの製造環境における小型物体の効率的かつ正確な検出は、製品の品質と安全性の確保に不可欠である。
この問題に対処するため,我々はより高速なr-cnnと最先端の手法を組み合わせた包括的戦略を提案した。
高速R-CNNとFeature Pyramid Networkを組み合わせることで、製造環境に固有のマルチスケール機能を効率的に扱うことができる。
さらにデフォルマブルネットは、欠陥の幾何学的バリエーションを歪曲し、適合させるために使われ、極小および複雑な特徴を検出できる精度をもたらす。
そこで我々は,ResNet50ネットワークの各ブロックにConvolutional Block Attention Moduleと呼ばれるアテンション機構を組み込んで,情報的特徴を選択的に強調し,あまり役に立たないものを抑制する。
その後roiアライメントを導入し、より細かい領域間アライメントのためにroiプールを置き換え、最終的に焦点損失の統合はクラス不均衡を効果的に処理します。
NEU-DET と Pascal のVOC データセット上でのモデルの厳密な評価は、その頑健な性能と一般化能力を示している。
neu-detデータセットでは,鋼材の欠陥を深く理解し,各種欠陥の同定に最先端の精度が得られた。
同時に、Pascal VOCデータセットで評価すると、複雑なシーンや小さなシーンにおいて、幅広いカテゴリにまたがる物体を検出する能力を示す。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Scale-Invariant Object Detection by Adaptive Convolution with Unified Global-Local Context [3.061662434597098]
本稿では,効率的なDetモデルに基づくSAC-Net(Switchable Atrous Convolutional Network)を用いたオブジェクト検出モデルを提案する。
提案したSAC-Netは,マルチスケールオブジェクト検出タスクの性能向上を実現するために,低レベル機能と高レベル機能の両方の利点をカプセル化している。
ベンチマークデータセットを用いた実験により,提案したSAC-Netは,精度の点で最先端モデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-09-17T10:08:37Z) - DDNet: Deformable Convolution and Dense FPN for Surface Defect Detection in Recycled Books [13.223022246455077]
DDNetは、欠陥のローカライゼーションと分類を強化するために設計された革新的な検出モデルである。
リサイクルおよび再循環書籍における表面欠陥検出に特化して算出されたデータセットについて述べる。
DDNetは表面欠陥の正確な位置化と分類を行い、mAP値は46.7%である。
論文 参考訳(メタデータ) (2024-09-08T03:18:19Z) - Machine learning-based network intrusion detection for big and
imbalanced data using oversampling, stacking feature embedding and feature
extraction [6.374540518226326]
侵入検知システム(IDS)は、悪意あるアクターや活動を検出することによって相互接続ネットワークを保護する上で重要な役割を果たす。
本稿では,データ不均衡にRandom Oversampling (RO) を用いる新しいMLベースのネットワーク侵入検出モデルと,次元削減のためのStacking Feature Embedding (PCA)を提案する。
CIC-IDS 2017データセットを使用すると、DT、RF、ETモデルは99.99%の精度に達し、DTとRFモデルはCIC-IDS 2018データセットで99.94%の精度が得られる。
論文 参考訳(メタデータ) (2024-01-22T05:49:41Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - CINFormer: Transformer network with multi-stage CNN feature injection
for surface defect segmentation [73.02218479926469]
表面欠陥分割のための多段CNN特徴注入を用いた変圧器ネットワークを提案する。
CINFormerは、入力画像のマルチレベルCNN機能をエンコーダ内のトランスフォーマーネットワークの異なるステージに注入する、シンプルだが効果的な機能統合機構を提供する。
さらに、CINFormerはTop-Kセルフアテンションモジュールを提供し、欠陥に関するより重要な情報を持つトークンにフォーカスする。
論文 参考訳(メタデータ) (2023-09-22T06:12:02Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Lightweight wood panel defect detection method incorporating attention
mechanism and feature fusion network [9.775181958901326]
本稿では,注目機構と特徴融合ネットワークを組み込んだYOLOv5-LWという軽量な木材パネル欠陥検出手法を提案する。
提案手法は92.8%の精度でパラメータ数を27.78%削減し,計算量を41.25%圧縮し,検出速度を10.16%向上させる。
論文 参考訳(メタデータ) (2023-06-21T08:55:45Z) - TinyDefectNet: Highly Compact Deep Neural Network Architecture for
High-Throughput Manufacturing Visual Quality Inspection [72.88856890443851]
TinyDefectNetは、高スループット製造の視覚品質検査に適した、非常にコンパクトな深層畳み込みネットワークアーキテクチャである。
TinyDefectNetはAMD EPYC 7R32上にデプロイされ、ネイティブフロー環境を使って7.6倍のスループット、AMD ZenDNNアクセラレーターライブラリを使って9倍のスループットを達成した。
論文 参考訳(メタデータ) (2021-11-29T04:19:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。