論文の概要: EdgeZSAD: Practical Zero-Shot Anomaly Detection on Edge Devices
- arxiv url: http://arxiv.org/abs/2606.16119v1
- Date: Mon, 15 Jun 2026 02:17:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.036994
- Title: EdgeZSAD: Practical Zero-Shot Anomaly Detection on Edge Devices
- Title(参考訳): EdgeZSAD:エッジデバイス上での事実上のゼロショット異常検出
- Authors: Taewan Cho, Andrew Jaeyong Choi,
- Abstract要約: 産業検査には、エッジデプロイメント制約の下でも有用であるゼロショット異常検出(ZSAD)が必要である。
We study this regime through EdgeZSAD, a compact reference system built around a TinyViT-21M-512 backbone。
ソーストレーニングされたターゲット不明のプロトコルで1つのチェックポイントをトレーニングし、6つの産業ベンチマークで評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial inspection needs zero-shot anomaly detection (ZSAD) that remains useful under edge deployment constraints. Recent methods often rely on ViT-L foundation backbones (~300M parameters), which exceed the memory and operator budget of typical embedded hardware. We study this regime through EdgeZSAD, a compact reference system built around a TinyViT-21M-512 backbone, an asymmetric global-local readout (EdgeGLR), and a reproducible source-side training recipe (Real-IAD-DR). We train a single checkpoint in a source-trained, target-unseen protocol and evaluate it across six industrial benchmarks. Across three independent runs, the resulting model reaches an average image AUROC of 91.6 on MVTec-AD and 88.2 on VisA, while remaining directly deployable on Jetson Orin Nano Super (TensorRT FP16) and RB5 Gen2 (QNN GPU FP16). Across the six device-rescored benchmarks, image-AUROC drift stays below 0.2 points, indicating that the exported graph preserves host-side ranking behavior in the evaluated deployment setting.
- Abstract(参考訳): 産業検査には、エッジ配置制約下でも有用であるゼロショット異常検出(ZSAD)が必要である。
近年の手法はViT-Lファンデーションバックボーン(約300Mパラメータ)に依存しており、典型的な組み込みハードウェアのメモリと演算子予算を超えている。
We study this regime through EdgeZSAD, a compact reference system built around a TinyViT-21M-512 backbone, a nonsymmetric global-local readout (EdgeGLR), a reproducible source-side training recipe (Real-IAD-DR)。
ソーストレーニングされたターゲット不明のプロトコルで1つのチェックポイントをトレーニングし、6つの産業ベンチマークで評価する。
3つの独立した実行において、結果は平均画像AUROCがMVTec-ADで91.6、VisAで88.2、Jetson Orin Nano Super(TensorRT FP16)とRB5 Gen2(QNN GPU FP16)で直接デプロイ可能である。
6つのデバイス対応ベンチマークの中で、Image-AUROCドリフトは0.2ポイント未満にとどまっており、エクスポートされたグラフが評価されたデプロイメント環境でホスト側ランキングの挙動を保存することを示している。
関連論文リスト
- EdgeSpike: Spiking Neural Networks for Low-Power Autonomous Sensing in Edge IoT Architectures [0.0]
EdgeSpikeは、エッジモノのインターネット(IoT)アーキテクチャにおける自律的低電力センシングのための、共同設計のスパイクニューラルネットワーク(SNN)フレームワークである。
ハイブリッドなサロゲートグレートとダイレクトエンコーディングのトレーニングパイプライン、ハードウェア対応のニューラルアーキテクチャサーチ、イベント駆動ランタイムを統一する。
強力なINT8畳み込みニューラルネットワーク(CNN)ベースラインの1.2ポイント(pp)以内の平均分類精度は91.4%である。
論文 参考訳(メタデータ) (2026-04-29T05:15:28Z) - Instance-level Visual Active Tracking with Occlusion-Aware Planning [61.982298426203165]
Visual Active Tracking (VAT)は、カメラを3D空間でターゲットに追従することを目的としている。
VATは、視覚的に類似したイントラクタからの混乱と、閉塞下での深刻な障害という、現実世界のデプロイメントにおいて2つの重要なボトルネックに直面している。
3つの相補的なモジュールを持つ統一パイプラインであるOA-VATを提案する。
論文 参考訳(メタデータ) (2026-04-23T09:11:50Z) - TinyGLASS: Real-Time Self-Supervised In-Sensor Anomaly Detection [7.978059159334374]
異常検出は、ラベル付き欠陥サンプルの不足にもかかわらず欠陥を特定する必要がある産業品質管理において重要な役割を担っている。
GLASSのような近年の自己教師型アプローチは、欠陥のないデータのみを用いて通常の視覚パターンを学習し、産業ベンチマークで高い性能を示した。
この研究は、リアルタイムエッジとセンサ内異常検出のために設計されたGLASSフレームワークの軽量な適応であるTinyGLASSを紹介する。
論文 参考訳(メタデータ) (2026-03-17T12:31:34Z) - Synthesizing the Kill Chain: A Zero-Shot Framework for Target Verification and Tactical Reasoning on the Edge [12.201060368447251]
本稿では,コンパクトな視覚言語モデル(VLM)を用いた軽量物体検出を実現する階層型ゼロショットフレームワークを提案する。
我々は,このパイプラインを,偽陽性フィルタリング(100%精度),損傷評価(97.5%),きめ細かい車両分類(55-90%)の3つのタスクで,バトルフィールド6の55個の高忠実合成ビデオ上で評価した。
論文 参考訳(メタデータ) (2026-02-10T23:00:19Z) - D3R-Net: Dual-Domain Denoising Reconstruction Network for Robust Industrial Anomaly Detection [0.0]
非教師付き異常検出(UAD)は、現代の製造において、自動視覚検査の鍵となる要素である。
本稿では、D3R-Netについて紹介する。D3R-Netは、自己教師型「癒し」タスクと周波数認識正規化を結合したデュアルドメイン・デノベーション・コンストラクションフレームワークである。
空間平均二乗誤差に加えて、周波数領域の整合性を促進するFast Fourier Transform (FFT) 等級損失を用いる。
論文 参考訳(メタデータ) (2026-01-27T23:21:59Z) - LiQSS: Post-Transformer Linear Quantum-Inspired State-Space Tensor Networks for Real-Time 6G [85.58816960936069]
Sixth-Generation (6G) Open Radio Access Networks (O-RAN) における能動的およびエージェント的制御は、厳密なニアタイム(Near-RT)レイテンシと計算制約の下で制御グレードの予測を必要とする。
本稿では,効率的な無線テレメトリ予測のための変圧器後パラダイムについて検討する。
本稿では、自己アテンションを安定な状態空間動的カーネルに置き換える量子インスピレーション付き状態空間テンソルネットワークを提案する。
論文 参考訳(メタデータ) (2026-01-18T12:08:38Z) - GraphPerf-RT: A Graph-Driven Performance Model for Hardware-Aware Scheduling of OpenMP Codes [7.204137900029132]
GraphPerf-RTは、タスクDAGトポロジ、CFG由来のコードセマンティクス、ランタイムコンテキストを統一する最初のサロゲートである。
組み込みARMプラットフォーム(Jetson TX2, Jetson Orin NX, RUBIK Pi)上でGraphPerf-RTを検証する。
実験の結果、GraphPerf-RTはモデルフリーのベースラインに比べて66%のステパン還元(0.97 +/- 0.35s)と82%のエネルギー還元(0.006 +/- 0.005J)を達成した。
論文 参考訳(メタデータ) (2025-12-12T23:46:05Z) - Ultra-low Power Deep Learning-based Monocular Relative Localization
Onboard Nano-quadrotors [64.68349896377629]
この研究は、2つのピアナノドロンのディープニューラルネットワーク(DNN)を介して、単分子の相対的な局所化に対処する、新しい自律的なエンドツーエンドシステムを示す。
超制約ナノドローンプラットフォームに対処するため,データセットの増大,量子化,システム最適化などを含む垂直統合フレームワークを提案する。
実験の結果,DNNは低分解能モノクローム画像のみを用いて最大2mの距離で10cmのターゲットナノドローンを正確に局在させることができることがわかった。
論文 参考訳(メタデータ) (2023-03-03T14:14:08Z) - FastPillars: A Deployment-friendly Pillar-based 3D Detector [63.0697065653061]
既存のBEVベースの(つまりバードアイビュー)検出器は、トレーニングと推論を高速化するためにスパース・コンボリューション(SPConv)を好む。
FastPillarsは、CenterPoint(SPConvベース)よりも1.8倍のスピードアップと3.8mAPH/L2の改善で、Openデータセットの最先端の精度を提供する
論文 参考訳(メタデータ) (2023-02-05T12:13:27Z) - Global Context Vision Transformers [78.5346173956383]
我々は,コンピュータビジョンのパラメータと計算利用を向上する新しいアーキテクチャであるGC ViT(Global context vision transformer)を提案する。
本稿では,ViTにおける帰納バイアスの欠如に対処し,アーキテクチャにおける可溶性逆残差ブロックを改良して活用することを提案する。
提案したGC ViTは,画像分類,オブジェクト検出,セマンティックセマンティックセグメンテーションタスクにまたがる最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-06-20T18:42:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。