論文の概要: SMR-Net:Robot Snap Detection Based on Multi-Scale Features and Self-Attention Network
- arxiv url: http://arxiv.org/abs/2603.01036v1
- Date: Sun, 01 Mar 2026 10:28:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.473394
- Title: SMR-Net:Robot Snap Detection Based on Multi-Scale Features and Self-Attention Network
- Title(参考訳): マルチスケール特徴と自己認識ネットワークに基づくSMR-Net:Robot Snap Detection
- Authors: Kuanxu Hou,
- Abstract要約: 従来のビジュアルメソッドは、複雑なシナリオを扱う際に、ロバスト性や大きなローカライゼーションエラーに悩まされる。
本稿では,自己注意型マルチスケールオブジェクト検出アルゴリズムであるSMR-Netを提案する。
A型スナップデータセットとB型スナップデータセットの実験結果は、SMR-Netが従来のFaster R-CNNを大きく上回っていることを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In robot automated assembly, snap assembly precision and efficiency directly determine overall production quality. As a core prerequisite, snap detection and localization critically affect subsequent assembly success. Traditional visual methods suffer from poor robustness and large localization errors when handling complex scenarios (e.g., transparent or low-contrast snaps), failing to meet high-precision assembly demands. To address this, this paper designs a dedicated sensor and proposes SMR-Net, an self-attention-based multi-scale object detection algorithm, to synergistically enhance detection and localization performance. SMR-Net adopts an attention-enhanced multi-scale feature fusion architecture: raw sensor data is encoded via an attention-embedded feature extractor to strengthen key snap features and suppress noise; three multi-scale feature maps are processed in parallel with standard and dilated convolution for dimension unification while preserving resolution; an adaptive reweighting network dynamically assigns weights to fused features, generating fine representations integrating details and global semantics. Experimental results on Type A and Type B snap datasets show SMR-Net outperforms traditional Faster R-CNN significantly: Intersection over Union (IoU) improves by 6.52% and 5.8%, and mean Average Precision (mAP) increases by 2.8% and 1.5% respectively. This fully demonstrates the method's superiority in complex snap detection and localization tasks.
- Abstract(参考訳): ロボット自動組立では、スナップアセンブリの精度と効率が全体の生産品質を直接決定する。
中心的な前提条件として、スナップ検出と局所化は、その後の組み立ての成功に重大な影響を及ぼす。
従来のビジュアルメソッドは、複雑なシナリオ(透過性や低コントラストスナップなど)を扱う場合、ロバスト性や大きなローカライゼーションエラーに悩まされ、高精度なアセンブリ要求を満たすことができない。
そこで本稿では, 自己注意型マルチスケール物体検出アルゴリズムであるSMR-Netを設計し, 検出と局所化性能を相乗的に向上する手法を提案する。
SMR-Netは、注目度を高めたマルチスケール機能融合アーキテクチャを採用している: 生のセンサーデータは、キースナップの特徴を強化しノイズを抑制するために、アテンションエンベッドされた特徴抽出器を介してエンコードされる; 3つのマルチスケール特徴写像は、解像度を維持しながら次元統一のための標準および拡張された畳み込みと並行して処理される;適応的再重み付けネットワークは、融合した特徴に重みを動的に割り当て、詳細とグローバルセマンティクスを統合する微妙な表現を生成する。
A型とB型スナップデータセットの実験的結果は、SMR-Netが従来のより高速なR-CNNよりも大幅に向上していることを示している: IoU(Intersection over Union)は6.52%と5.8%改善し、平均精度(mAP)はそれぞれ2.8%と1.5%向上した。
このことは、複雑なスナップ検出とローカライゼーションタスクにおけるメソッドの優位性を完全に証明している。
関連論文リスト
- SDCoNet: Saliency-Driven Multi-Task Collaborative Network for Remote Sensing Object Detection [7.016133328153285]
リモートセンシング画像では、複雑な背景、弱い物体信号、小さな物体スケールが特に正確な検出を困難にしている。
一般的な戦略は、検出前に単一画像の超解像(SR)を統合することである。
SRと検出を暗黙的特徴共有によって結合するSDCoNet(Saliency-Driven Multi-task Collaborative Network)を提案する。
論文 参考訳(メタデータ) (2026-01-18T17:36:48Z) - Generative MIMO Beam Map Construction for Location Recovery and Beam Tracking [67.65578956523403]
本稿では,スパースチャネル状態情報(CSI)から位置ラベルを直接復元する生成フレームワークを提案する。
生のCSIを直接格納する代わりに、小型の低次元無線地図の埋め込みを学び、生成モデルを利用して高次元CSIを再構築する。
数値実験により,NLOSシナリオにおける局所化精度が30%以上向上し,20%のキャパシティゲインが得られることが示された。
論文 参考訳(メタデータ) (2025-11-21T07:25:49Z) - Source-Free Object Detection with Detection Transformer [59.33653163035064]
Source-Free Object Detection (SFOD) は、ソースデータにアクセスすることなく、ソースドメインから教師なしのターゲットドメインへの知識転送を可能にする。
ほとんどの既存のSFODアプローチは、より高速なR-CNNのような従来のオブジェクト検出(OD)モデルに限られるか、新しいODアーキテクチャ、特に検出変換器(DETR)に適合しない一般的なソリューションとして設計されている。
本稿では,DTRのクエリ中心の機能強化を特化して設計された新しいSFODフレームワークであるFeature Reweighting ANd Contrastive Learning NetworK(FRANCK)を紹介する。
論文 参考訳(メタデータ) (2025-10-13T07:35:04Z) - A Lightweight Group Multiscale Bidirectional Interactive Network for Real-Time Steel Surface Defect Detection [15.140649886958945]
Group Multiscale Bidirectional Interactive (GMBI)モジュールは、マルチスケールの特徴抽出と相互作用を強化する。
SD-Saliency-900とNRSD-MNデータセットの実験は、GMBINetがGPUで1048 FPS、CPUで512解像度で16.53 FPSのリアルタイム速度で競合精度を提供することを示した。
論文 参考訳(メタデータ) (2025-08-22T13:58:35Z) - SDS-Net: Shallow-Deep Synergism-detection Network for infrared small target detection [0.18641315013048293]
現在のCNNに基づく赤外小目標検出法は,浅部特徴と深部特徴の均一性を見落としている。
依存関係の関係と融合機構は、マルチレベル機能の相補性を十分に活用できない。
本稿では,マルチレベル特徴表現を効率的にモデル化する浅層深度相乗効果検出ネットワーク(SDS-Net)を提案する。
論文 参考訳(メタデータ) (2025-06-06T12:44:41Z) - MSCA-Net:Multi-Scale Context Aggregation Network for Infrared Small Target Detection [0.1759252234439348]
本稿では,3つのキーコンポーネントを統合したMSCA-Netというネットワークアーキテクチャを提案する。
MSEDAは、異なるスケールにわたる情報を適応的に集約するために、マルチスケールのフュージョンアテンション機構を使用している。
PCBAMは相関行列に基づく戦略によりグローバル特徴と局所特徴の相関を捉える。
CABは、それらに重みを割り当て、低レベル情報と高レベル情報を統合することで、重要な特徴の表現を強化する。
論文 参考訳(メタデータ) (2025-03-21T14:42:31Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - Hybrid Convolutional and Attention Network for Hyperspectral Image Denoising [54.110544509099526]
ハイパースペクトル画像(HSI)は、ハイパースペクトルデータの効果的な解析と解釈に重要である。
ハイブリット・コンボリューション・アテンション・ネットワーク(HCANet)を提案する。
主流HSIデータセットに対する実験結果は,提案したHCANetの合理性と有効性を示している。
論文 参考訳(メタデータ) (2024-03-15T07:18:43Z) - Systematic Architectural Design of Scale Transformed Attention Condenser
DNNs via Multi-Scale Class Representational Response Similarity Analysis [93.0013343535411]
マルチスケールクラス表現応答類似性分析(ClassRepSim)と呼ばれる新しいタイプの分析法を提案する。
ResNetスタイルのアーキテクチャにSTACモジュールを追加すると、最大1.6%の精度が向上することを示す。
ClassRepSim分析の結果は、STACモジュールの効果的なパラメータ化を選択するために利用することができ、競争性能が向上する。
論文 参考訳(メタデータ) (2023-06-16T18:29:26Z) - Real-Time Scene Text Detection with Differentiable Binarization and
Adaptive Scale Fusion [62.269219152425556]
セグメンテーションに基づくシーンテキスト検出手法はシーンテキスト検出分野において大きな注目を集めている。
本稿では,二項化処理をセグメンテーションネットワークに統合する分散二項化(DB)モジュールを提案する。
アダプティブ・スケール・フュージョン (ASF) モジュールは, 異なるスケールの特徴を適応的に融合させることにより, スケールのロバスト性を向上させる。
論文 参考訳(メタデータ) (2022-02-21T15:30:14Z) - CFC-Net: A Critical Feature Capturing Network for Arbitrary-Oriented
Object Detection in Remote Sensing Images [0.9462808515258465]
本稿では,物体検出における識別的特徴の役割について論じる。
次に,検出精度を向上させるために,cfc-net (critical feature capture network) を提案する。
本手法は多くの最先端手法と比較して優れた検出性能が得られることを示す。
論文 参考訳(メタデータ) (2021-01-18T02:31:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。