論文の概要: A Deformable Attention-Based Detection Transformer with Cross-Scale Feature Fusion for Industrial Coil Spring Inspection
- arxiv url: http://arxiv.org/abs/2603.13429v1
- Date: Fri, 13 Mar 2026 03:35:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.196448
- Title: A Deformable Attention-Based Detection Transformer with Cross-Scale Feature Fusion for Industrial Coil Spring Inspection
- Title(参考訳): 産業用コイルスプリング探傷用クロススケール機能融合形変形性注意検出変圧器
- Authors: Matteo Rossi, Pony Matt,
- Abstract要約: 本稿では,MSD-DETR(Multi-Scale Deformable Detection Transformer)を提案する。
MSD-DETRは98 FPSで92.4% mAP@0.5を達成した。
- 参考スコア(独自算出の注目度): 0.6159133786557902
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated visual inspection of locomotive coil springs presents significant challenges due to the morphological diversity of surface defects, substantial scale variations, and complex industrial backgrounds. This paper proposes MSD-DETR (Multi-Scale Deformable Detection Transformer), a novel detection framework that addresses these challenges through three key innovations: (1) a structural re-parameterization strategy that decouples training-time multi-branch topology from inference-time efficiency, enhancing feature extraction while maintaining real-time performance; (2) a deformable attention mechanism that enables content-adaptive spatial sampling, allowing dynamic focus on defect-relevant regions regardless of morphological irregularity; and (3) a cross-scale feature fusion architecture incorporating GSConv modules and VoVGSCSP blocks for effective multi-resolution information aggregation. Comprehensive experiments on a real-world locomotive coil spring dataset demonstrate that MSD-DETR achieves 92.4\% mAP@0.5 at 98 FPS, outperforming state-of-the-art detectors including YOLOv8 (+3.1\% mAP) and the baseline RT-DETR (+2.8\% mAP) while maintaining comparable inference speed, establishing a new benchmark for industrial coil spring quality inspection.
- Abstract(参考訳): 機関車のコイルスプリングの視覚的自動検査は、表面欠陥の形態的多様性、相当なスケールのバリエーション、複雑な工業的背景など、重大な課題を呈している。
提案するMSD-DETR(Multi-Scale Deformable Detection Transformer)は,(1)トレーニング時のマルチブランチトポロジを推論時効率から切り離し,リアルタイム性能を維持しながら特徴抽出を向上する構造的再パラメータ化戦略,(2)コンテンツ適応型空間サンプリングを可能にする変形性アテンション機構,(3)GSConvモジュールとVoVGSCSPブロックを組み込んだクロススケール機能融合アーキテクチャを提案する。
MSD-DETRは98 FPSで92.4\% mAP@0.5を達成し、YOLOv8 (+3.1\% mAP) やRT-DETR (+2.8\% mAP) といった最先端の検出器よりも優れており、同じ推論速度を維持しつつ、産業用コイルスプリング品質検査のための新しいベンチマークを確立している。
関連論文リスト
- Transolver-3: Scaling Up Transformer Solvers to Industrial-Scale Geometries [51.028432812178266]
Transolver-3は、高忠実度物理シミュレーションのために設計されたTransolverファミリーの新しいメンバーである。
Transolver-3は1億6000万以上のセルでメッシュを処理でき、3つの挑戦的なシミュレーションベンチマークで優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-02-04T16:52:44Z) - CEEMDAN-Based Multiscale CNN for Wind Turbine Gearbox Fault Detection [0.43776156667195165]
本研究では,風車用ギアボックスの故障検出のためのハイブリッド手法を提案する。
CEEMDANとマルチスケール畳み込みニューラルネットワーク(MSCNN)を組み合わせている。
提案手法は実世界のデータセットに基づいて評価された98.95%のF1スコアを実現する。
論文 参考訳(メタデータ) (2026-01-08T21:55:15Z) - Flexible Gravitational-Wave Parameter Estimation with Transformers [73.44614054040267]
本稿では,予測時間における多様な解析設定への適応を可能にする,フレキシブルトランスフォーマーベースのアーキテクチャをトレーニング戦略と組み合わせて導入する。
我々は、Dingo-T1と呼ばれる単一のフレキシブルモデルが、第3のLIGO-Virgo-KAGRA観測ランから48の重力波イベントを解析できることを実証した。
論文 参考訳(メタデータ) (2025-12-02T17:49:08Z) - ShortcutBreaker: Low-Rank Noisy Bottleneck with Global Perturbation Attention for Multi-Class Unsupervised Anomaly Detection [59.89803740308262]
ShortcutBreakerはMUADタスクのための新しい統合された機能再構成フレームワークである。
ショートカットの問題に対処する2つの重要なイノベーションが特徴だ。
提案手法は,4つのデータセットに対して,99.8%,98.9%,90.6%,87.8%の顕著な画像レベルのAUROCを実現する。
論文 参考訳(メタデータ) (2025-10-21T06:51:30Z) - Source-Free Object Detection with Detection Transformer [59.33653163035064]
Source-Free Object Detection (SFOD) は、ソースデータにアクセスすることなく、ソースドメインから教師なしのターゲットドメインへの知識転送を可能にする。
ほとんどの既存のSFODアプローチは、より高速なR-CNNのような従来のオブジェクト検出(OD)モデルに限られるか、新しいODアーキテクチャ、特に検出変換器(DETR)に適合しない一般的なソリューションとして設計されている。
本稿では,DTRのクエリ中心の機能強化を特化して設計された新しいSFODフレームワークであるFeature Reweighting ANd Contrastive Learning NetworK(FRANCK)を紹介する。
論文 参考訳(メタデータ) (2025-10-13T07:35:04Z) - A Real-time Concrete Crack Detection and Segmentation Model Based on YOLOv11 [15.031712782615797]
本稿では, YOLOv11nアーキテクチャに基づくマルチタスクコンクリートのひび割れ検出とセグメンテーションモデルであるYOLOv11-KW-TA-FPを提案する。
実験による検証では、拡張されたモデルがベースライン上での大幅なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-08-15T14:57:00Z) - DFYP: A Dynamic Fusion Framework with Spectral Channel Attention and Adaptive Operator learning for Crop Yield Prediction [18.24061967822792]
DFYPは、作物収量予測のための新しい動的融合フレームワークである。
スペクトルチャネルアテンション、エッジ適応空間モデリング、学習可能な融合機構を組み合わせる。
DFYPはRMSE、MAE、R2の最先端ベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2025-07-08T10:24:04Z) - An Efficient Aerial Image Detection with Variable Receptive Fields [0.0]
3つの鍵成分を組み込んだ変圧器型検出器を提案する。
VRF-DETRは51.4%のmAPtextsubscript50と31.8%のmAPtextsubscript50:95を13.5Mパラメータで達成している。
論文 参考訳(メタデータ) (2025-04-21T15:16:13Z) - Towards Stabilized and Efficient Diffusion Transformers through Long-Skip-Connections with Spectral Constraints [51.83081671798784]
Diffusion Transformers (DiT) は、画像およびビデオ生成のための強力なアーキテクチャとして登場し、優れた品質とスケーラビリティを提供している。
DiTの実用アプリケーションは本質的に動的特徴不安定性に悩まされており、キャッシュされた推論中にエラーを増幅する。
我々は,Long-Skip-Connections (LSCs) で拡張された画像およびビデオ生成型DiTであるSkip-DiTを提案する。
論文 参考訳(メタデータ) (2024-11-26T17:28:10Z) - Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文 参考訳(メタデータ) (2024-03-10T10:36:32Z) - RCDT: Relational Remote Sensing Change Detection with Transformer [9.339061781212475]
Change Detection Transformer (RCDT) は、リモートセンシングによる変更検出タスクのための、新しくてシンプルなフレームワークである。
提案するRCDTは,他の競合手法と比較して優れた変化検出性能を示す。
論文 参考訳(メタデータ) (2022-12-09T14:21:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。