論文の概要: BioDet: Boosting Industrial Object Detection with Image Preprocessing Strategies
- arxiv url: http://arxiv.org/abs/2510.21000v1
- Date: Thu, 23 Oct 2025 21:15:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.32244
- Title: BioDet: Boosting Industrial Object Detection with Image Preprocessing Strategies
- Title(参考訳): BioDet: 画像前処理戦略による産業用物体検出の促進
- Authors: Jiaqi Hu, Hongli Xu, Junwen Huang, Peter KT Yu, Slobodan Ilic, Benjamin Busam,
- Abstract要約: 産業環境における未確認物体の2次元検出のための標準化およびプラグインパイプラインを提案する。
現在のSOTAベースラインに基づいて、低照度画像の強調と背景削除により、ドメインシフトと背景アーティファクトを低減する。
この設計は、生のSAM出力でよく見られる偽陽性を抑え、下流のポーズ推定のためのより信頼性の高い検出をもたらす。
- 参考スコア(独自算出の注目度): 37.23363479562131
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate 6D pose estimation is essential for robotic manipulation in industrial environments. Existing pipelines typically rely on off-the-shelf object detectors followed by cropping and pose refinement, but their performance degrades under challenging conditions such as clutter, poor lighting, and complex backgrounds, making detection the critical bottleneck. In this work, we introduce a standardized and plug-in pipeline for 2D detection of unseen objects in industrial settings. Based on current SOTA baselines, our approach reduces domain shift and background artifacts through low-light image enhancement and background removal guided by open-vocabulary detection with foundation models. This design suppresses the false positives prevalent in raw SAM outputs, yielding more reliable detections for downstream pose estimation. Extensive experiments on real-world industrial bin-picking benchmarks from BOP demonstrate that our method significantly boosts detection accuracy while incurring negligible inference overhead, showing the effectiveness and practicality of the proposed method.
- Abstract(参考訳): 産業環境におけるロボット操作には正確な6次元ポーズ推定が不可欠である。
既存のパイプラインは、通常、既成の物体検出器に頼り、続いて収穫と改良を施すが、その性能は、乱雑、照明の弱さ、複雑な背景といった困難な条件下で劣化し、重要なボトルネックを検知する。
本研究では,産業環境における未確認物体の2次元検出のための標準化およびプラグインパイプラインを提案する。
現在のSOTAベースラインに基づいて,基礎モデルを用いたオープン語彙検出による低照度画像強調と背景除去により,ドメインシフトや背景アーティファクトを低減する。
この設計は、生のSAM出力でよく見られる偽陽性を抑え、下流のポーズ推定のためのより信頼性の高い検出をもたらす。
BOPによる実世界の産業用ビンピッキングベンチマークの大規模な実験により,提案手法の有効性と実用性を示しながら,予測精度を著しく向上することが示された。
関連論文リスト
- Region-Aware CAM: High-Resolution Weakly-Supervised Defect Segmentation via Salient Region Perception [2.9962030276180758]
本稿では,弱教師付きセマンティックセマンティックセグメンテーションフレームワークを提案する。
リージョン対応のクラスアクティベーションマップ(CAM)と擬似ラベルトレーニングで構成されている。
提案手法は,弱教師付き学習と高精度欠陥分割のギャップを効果的に埋めるものである。
論文 参考訳(メタデータ) (2025-06-28T12:24:45Z) - Robust Distribution Alignment for Industrial Anomaly Detection under Distribution Shift [51.24522135151649]
異常検出は産業アプリケーションの品質管理において重要な役割を担っている。
既存の方法は、一般化可能なモデルをトレーニングすることで、ドメインシフトに対処しようとする。
提案手法は,最先端の異常検出法や領域適応法と比較して,優れた結果を示す。
論文 参考訳(メタデータ) (2025-03-19T05:25:52Z) - Exploring Large Vision-Language Models for Robust and Efficient Industrial Anomaly Detection [4.691083532629246]
CLAD(Contrastive Cross-Modal Training)を用いた視覚言語異常検出法を提案する。
CLADは、視覚的特徴とテキスト的特徴をコントラスト学習を用いて共有埋め込み空間に整列する。
CLADは画像レベルの異常検出と画素レベルの異常局所化の両方において最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-12-01T17:00:43Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Bring the Power of Diffusion Model to Defect Detection [0.0]
拡散確率モデル(DDPM)は,特徴リポジトリとして構築する認知過程の特徴を抽出するために事前訓練される。
待ち行列特徴を再構成してフィルタして高次元DDPM特徴を得る。
実験結果から,本手法はいくつかの産業データセット上での競合的な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-08-25T14:28:49Z) - AssemAI: Interpretable Image-Based Anomaly Detection for Manufacturing Pipelines [0.0]
製造パイプラインにおける異常検出は、産業環境の複雑さと変動性によって強化され、依然として重要な課題である。
本稿では,スマート製造パイプラインに適した解釈可能な画像ベース異常検出システムAssemAIを紹介する。
論文 参考訳(メタデータ) (2024-08-05T01:50:09Z) - Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。
近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。
本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2023-12-18T09:52:14Z) - Learning Heavily-Degraded Prior for Underwater Object Detection [59.5084433933765]
本稿では、検出器フレンドリーな画像から、転送可能な事前知識を求める。
これは、検出器フレンドリー(DFUI)と水中画像の高度に劣化した領域が、特徴分布のギャップがあることを統計的に観察したものである。
高速かつパラメータの少ない本手法は変圧器型検出器よりも優れた性能を保っている。
論文 参考訳(メタデータ) (2023-08-24T12:32:46Z) - Deep Learning based pipeline for anomaly detection and quality
enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。
本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文 参考訳(メタデータ) (2022-09-21T08:14:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。