論文の概要: Pattern-Enhanced RT-DETR for Multi-Class Battery Detection
- arxiv url: http://arxiv.org/abs/2605.13670v1
- Date: Wed, 13 May 2026 15:29:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:28.133997
- Title: Pattern-Enhanced RT-DETR for Multi-Class Battery Detection
- Title(参考訳): マルチクラス電池検出のためのパターン強化RT-DETR
- Authors: Xu Zhong, Enyuan Hu,
- Abstract要約: 本稿では,多クラス電池検出のための総合ベンチマークと新しい手法を提案する。
PaQ-RT-DETR-Xは0.782のmAP@50で、RT-DETR-Xを+2.8%上回る。
本研究は, 電池関連産業アプリケーションにおける物体検出モデル選択のための実用的なガイダンスを提供する。
- 参考スコア(独自算出の注目度): 0.6302369456012736
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate and efficient battery detection is increasingly important for applications in electronic waste recycling, industrial quality control, and automated sorting systems. In this paper, we present both a comprehensive benchmark and a novel method for multi-class battery detection. We systematically compare three CNN-based detectors (YOLOv8n, YOLOv8s, YOLO11n) and two transformer-based detectors (RT-DETR-L, RT-DETR-X) on a publicly available dataset of approximately 8,591 annotated images under identical experimental conditions, and further propose PaQ-RT-DETR, which introduces pattern-based dynamic query generation into RT-DETR to alleviate query activation imbalance with negligible computational overhead. Among baselines, YOLO11n achieves the best CNN-based accuracy (mAP@50: 0.779) at only 2.6M parameters, while YOLOv8n delivers the fastest inference at ~1,667 FPS. PaQ-RT-DETR-X achieves the highest overall mAP@50 of 0.782, surpassing RT-DETR-X by +2.8% with consistent per-class gains across all six battery categories including the data-scarce Bike Battery class. Our findings provide practical guidance for selecting object detection models in battery-related industrial applications.
- Abstract(参考訳): 電子廃棄物リサイクル、産業品質管理、自動ソートシステムへの応用において、精度が高く効率的な電池検出がますます重要になっている。
本稿では,総合的なベンチマークとマルチクラス電池検出のための新しい手法を提案する。
CNNベースの3つの検出器(YOLOv8n, YOLOv8s, YOLO11n)と2つのトランスフォーマーベースの検出器(RT-DETR-L, RT-DETR-X)を、ほぼ8,591個の注釈付き画像からなる公開データセット上で、同じ実験条件下で体系的に比較し、また、パターンベースの動的クエリ生成をRT-DETRに導入し、クエリアクティベーションと無視可能な計算オーバーヘッドとのバランスを緩和するPaQ-RT-DETRを提案する。
ベースラインの中で、YOLO11nは2.6Mパラメータで最高のCNNベースの精度(mAP@50: 0.779)を達成し、YOLOv8nは1,667FPSで最速の推論を行う。
PaQ-RT-DETR-Xは0.782のmAP@50で、RT-DETR-Xを+2.8%上回る。
本研究は, 電池関連産業アプリケーションにおける物体検出モデル選択のための実用的なガイダンスを提供する。
関連論文リスト
- MI-DETR: A Strong Baseline for Moving Infrared Small Target Detection with Bio-Inspired Motion Integration [63.87179575890912]
我々は、赤外線小ターゲット検出のためのバイオインスパイアされたデュアルパス検出装置であるモーション統合DETR(MI-DETR)を提案する。
まず、網膜にインスパイアされたセルオートマトン(RCA)は、生フレーム配列を外観画像と同じピクセルグリッド上に定義されたモーションマップに変換する。
第二に、PMI(Parvocellular-Magnocellular Interconnection)ブロックは2つの経路間の双方向の特徴的相互作用を促進する。
論文 参考訳(メタデータ) (2026-03-05T11:39:31Z) - Every Attention Matters: An Efficient Hybrid Architecture for Long-Context Reasoning [73.10669391954801]
本稿では、Ring-mini-linear-2.0およびRing-flash-linear-2.0を含むRing-linearモデルシリーズについて述べる。
どちらのモデルも線形アテンションとソフトマックスアテンションを効果的に統合するハイブリッドアーキテクチャを採用している。
32億のパラメータ密度モデルと比較して、このシリーズは推論コストを1/10に削減し、元のRingシリーズと比較すると、コストも50%以上削減される。
論文 参考訳(メタデータ) (2025-10-22T07:59:38Z) - Real-Time Beach Litter Detection and Counting: A Comparative Analysis of RT-DETR Model Variants [0.0]
沿岸汚染は世界的な環境問題であり、監視と管理のためにスケーラブルで自動化されたソリューションを必要とする。
本研究では, リアルタイム検出変換器(RT-DETR)の海浜ゴミの自動検出・計数への応用について検討した。
論文 参考訳(メタデータ) (2025-08-18T17:10:04Z) - QiMeng-CodeV-R1: Reasoning-Enhanced Verilog Generation [51.393569044134445]
大きな言語モデル(LLM)は、強化学習と検証可能な報酬(RLVR)によって訓練され、明示的で自動化可能な検証を伴うタスクにおいてブレークスルーを達成した。
しかし、自然言語(NL)仕様からVerilogのようなハードウェア記述言語(HDL)を自動的に生成するRLVRの拡張には、3つの大きな課題がある。
本稿では,Verilog 生成 LLM をトレーニングするための RLVR フレームワークである CodeV-R1 を紹介する。
論文 参考訳(メタデータ) (2025-05-30T03:51:06Z) - DETRs Beat YOLOs on Real-time Object Detection [5.426236055184119]
YOLOシリーズは、速度と精度のトレードオフにより、リアルタイムオブジェクト検出の最も一般的なフレームワークとなっている。
近年、エンドツーエンドのTransformer-based detector (DETR) は、NMSを除去する代替手段を提供している。
本稿では,初のリアルタイム終端物体検出装置であるリアルタイム検出TRansformer(RT-DETR)を提案する。
論文 参考訳(メタデータ) (2023-04-17T08:30:02Z) - EEG-Inception: An Accurate and Robust End-to-End Neural Network for
EEG-based Motor Imagery Classification [123.93460670568554]
本稿では,脳波に基づく運動画像(MI)分類のための新しい畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
提案したCNNモデル、すなわちEEG-Inceptionは、Inception-Timeネットワークのバックボーン上に構築されている。
提案するネットワークは、生のEEG信号を入力とし、複雑なEEG信号前処理を必要としないため、エンドツーエンドの分類である。
論文 参考訳(メタデータ) (2021-01-24T19:03:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。