論文の概要: Zero-Shot Multi-Criteria Visual Quality Inspection for Semi-Controlled Industrial Environments via Real-Time 3D Digital Twin Simulation
- arxiv url: http://arxiv.org/abs/2511.23214v1
- Date: Fri, 28 Nov 2025 14:19:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.925677
- Title: Zero-Shot Multi-Criteria Visual Quality Inspection for Semi-Controlled Industrial Environments via Real-Time 3D Digital Twin Simulation
- Title(参考訳): 実時間3次元ディジタル双極子シミュレーションによる半制御産業環境のゼロショット多眼視品質検査
- Authors: Jose Moises Araya-Martinez, Gautham Mohan, Kenichi Hayakawa Bolaños, Roberto Mendieta, Sarvenaz Sardari, Jens Lambrecht, Jörg Krüger,
- Abstract要約: RGB-D空間における実シーンとリアルタイムデジタル双対(DT)を比較したポーズに依存しないゼロショット品質検査フレームワークを提案する。
提案手法は,オブジェクト検出とポーズ推定により,産業シーンを意味的に記述することで,効率的なリアルタイムDTレンダリングを実現する。
軸流モータの品質検査を特徴とする自動車用ユースケースに基づいて,本フレームワークの有効性を実証する。
- 参考スコア(独自算出の注目度): 5.0268543063681195
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Early-stage visual quality inspection is vital for achieving Zero-Defect Manufacturing and minimizing production waste in modern industrial environments. However, the complexity of robust visual inspection systems and their extensive data requirements hinder widespread adoption in semi-controlled industrial settings. In this context, we propose a pose-agnostic, zero-shot quality inspection framework that compares real scenes against real-time Digital Twins (DT) in the RGB-D space. Our approach enables efficient real-time DT rendering by semantically describing industrial scenes through object detection and pose estimation of known Computer-Aided Design models. We benchmark tools for real-time, multimodal RGB-D DT creation while tracking consumption of computational resources. Additionally, we provide an extensible and hierarchical annotation strategy for multi-criteria defect detection, unifying pose labelling with logical and structural defect annotations. Based on an automotive use case featuring the quality inspection of an axial flux motor, we demonstrate the effectiveness of our framework. Our results demonstrate detection performace, achieving intersection-over-union (IoU) scores of up to 63.3% compared to ground-truth masks, even if using simple distance measurements under semi-controlled industrial conditions. Our findings lay the groundwork for future research on generalizable, low-data defect detection methods in dynamic manufacturing settings.
- Abstract(参考訳): 早期の視覚的品質検査は、ゼロ欠陥製造の達成と近代工業環境における生産廃棄物の最小化に不可欠である。
しかし、堅牢な視覚検査システムの複雑さと、その広範なデータ要求が、半制御産業環境において広く採用されるのを妨げている。
本稿では,RGB-D空間における実シーンとリアルタイムデジタルツイン(DT)を比較した,ポーズに依存しないゼロショット品質検査フレームワークを提案する。
提案手法は,オブジェクト検出と既知のコンピュータ支援設計モデルのポーズ推定により,産業シーンを意味的に記述することで,効率的なリアルタイムDTレンダリングを実現する。
我々は,リアルタイム・マルチモーダルなRGB-D DT生成ツールのベンチマークを行い,計算資源の消費を追跡した。
さらに,複数基準欠陥検出のための拡張可能かつ階層的なアノテーション戦略を提供し,論理的および構造的欠陥アノテーションを用いたポーズラベルを統一する。
軸流モータの品質検査を特徴とする自動車用ユースケースに基づいて,本フレームワークの有効性を実証する。
本研究は, 半制御産業環境下での簡易距離測定を用いた場合であっても, 地中トラスマスクと比較して最大63.3%の交叉結合(IoU)値が得られることを示す。
本研究は, 動的製造環境における一般化可能な低データ欠陥検出手法に関する今後の研究の基盤となるものである。
関連論文リスト
- 3D-ADAM: A Dataset for 3D Anomaly Detection in Additive Manufacturing [8.279480828330183]
3D-ADAMは、添加物製造においてRGB+3D表面欠陥検出のための最初の大規模産業関連データセットである。
3D-ADAMは、14,120個の高分解能スキャン、217個のユニークなパーツで構成され、4つの産業用深度センサーで撮影されている。
12のカテゴリにまたがる27,346のアノテート欠陥と16のクラスにおけるマシンエレメント機能の27,346のアノテーションが含まれている。
論文 参考訳(メタデータ) (2025-07-10T15:09:20Z) - Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map [50.21082069320818]
最小限の監督で高忠実度産業データセットを生成するための拡散型パイプラインを提案する。
提案手法では, 拡張有界箱表現の拡散モデルを用いて, 正確なセグメンテーションマスクを生成する。
その結果、拡散に基づく合成は、人工的な産業データと実世界の産業データとのギャップを埋めることを示した。
論文 参考訳(メタデータ) (2025-05-06T15:21:36Z) - ISP-AD: A Large-Scale Real-World Dataset for Advancing Industrial Anomaly Detection with Synthetic and Real Defects [0.0]
ISP-ADは、ファクトリフロアから直接収集された合成欠陥と実際の欠陥を含む、これまでで最大のパブリックな産業データセットである。
実験により、少量の注入でも弱いラベル付き実欠陥が一般化を改善することが示されている。
論文 参考訳(メタデータ) (2025-03-06T21:56:31Z) - IPAD: Industrial Process Anomaly Detection Dataset [71.39058003212614]
ビデオ異常検出(VAD)は,ビデオフレーム内の異常を認識することを目的とした課題である。
本稿では,産業シナリオにおけるVADに特化して設計された新しいデータセットIPADを提案する。
このデータセットは16の異なる産業用デバイスをカバーし、合成ビデオと実世界のビデオの両方を6時間以上保存している。
論文 参考訳(メタデータ) (2024-04-23T13:38:01Z) - Investigation of the Impact of Synthetic Training Data in the Industrial
Application of Terminal Strip Object Detection [4.327763441385371]
本稿では,端末ストリップ物体検出の複雑な産業応用における標準対象検出器のシム・トゥ・リアル一般化性能について検討する。
評価のために300個の実画像に手動でアノテートを行った結果,どちらの領域でも同じ規模の興味の対象が重要であることがわかった。
論文 参考訳(メタデータ) (2024-03-06T18:33:27Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.041049052843604]
STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。
まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing
Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。
生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文 参考訳(メタデータ) (2021-04-22T12:47:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。