論文の概要: Towards Active Real-to-Twin Inspection: A New Paradigm for Zero-Shot Anomaly Detection
- arxiv url: http://arxiv.org/abs/2605.25407v1
- Date: Mon, 25 May 2026 04:05:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.281417
- Title: Towards Active Real-to-Twin Inspection: A New Paradigm for Zero-Shot Anomaly Detection
- Title(参考訳): アクティブ・リアル・ツー・ツイン検査に向けて:ゼロショット異常検出のための新しいパラダイム
- Authors: Jiaxuan Liu, Yunkang Cao, Yufeng Chen, Chunyang Li, Yuhuan Du, Hui Zhang,
- Abstract要約: 本稿では,幾何学的に整合したCADデジタル双対に対する物理観測を直接評価する新しいタスクであるReal-to-Twin Anomaly Detectionを紹介する。
本稿では,リアルツインとデジタルツイン間のロバストなセマンティックアライメントを学習するためのフレームワークであるAVATARを提案する。
欠陥のないペアのみを使用して、良質なSim2Realドメインギャップをブリッジすることで、AVATARはCADプリエントを動的で異常のない参照に変換する。
- 参考スコア(独自算出の注目度): 15.402355513558541
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The deployment of zero-shot anomaly detection (AD) in embodied industrial inspection is severely bottlenecked by its reliance on passive, fixed-viewpoint 2D imagery. Such formulations inherently fail to accommodate the active, dynamic observations required in real-world environments. To break this limitation, we introduce Real-to-Twin Anomaly Detection, a novel task that evaluates physical observations directly against geometrically matched CAD Digital Twins. To tackle this new task, we propose AVATAR, a framework designed to learn robust semantic alignment between Real and Digital Twins. By bridging benign Sim2Real domain gaps using only defect-free pairs, AVATAR effectively transforms CAD priors into dynamic, anomaly-free references. This elegant formulation enables the model to localize diverse anomalies in a zero-shot manner as unalignable deviations, eliminating the need for defect annotations. Extensive experiments demonstrate that AVATAR substantially outperforms adapted state-of-the-art baselines, exhibiting exceptional robustness to severe viewpoint variations. The code and dataset will be made publicly available.
- Abstract(参考訳): 実物検査におけるゼロショット異常検出(AD)の展開は、受動的、固定視点2D画像に依存しているため、著しくボトルネックとなる。
このような定式化は、現実世界の環境に必要な活発でダイナミックな観察に適さない。
この制限を断ち切るために,CADデジタル双対に対して物理観測を直接評価する新しいタスクであるReal-to-Twin Anomaly Detectionを導入する。
この課題に対処するため,本研究では,リアルツインとデジタルツイン間のロバストなセマンティックアライメントを学習するためのフレームワークであるAVATARを提案する。
欠陥のないペアのみを使用して、良質なSim2Realドメインギャップをブリッジすることで、AVATARはCADプリエントを動的で異常のない参照に変換する。
このエレガントな定式化により、モデルは様々な異常をゼロショットでローカライズすることができる。
大規模な実験により、AVATARは適応された最先端のベースラインを著しく上回り、高度の視点変化に対して例外的な堅牢性を示すことが示された。
コードとデータセットは一般公開される予定だ。
関連論文リスト
- GroundingAnomaly: Spatially-Grounded Diffusion for Few-Shot Anomaly Synthesis [16.74245445257004]
我々は,新しい数発の異常画像生成フレームワークであるGroundingAnomalyを提案する。
本フレームワークでは,画素ごとのセマンティックマップを活用する空間条件モジュールを導入している。
Gated Self-Attention Moduleは、凍結したU-Netに条件付きトークンを注入するように設計されている。
論文 参考訳(メタデータ) (2026-04-09T14:34:50Z) - Uncertainty-Aware 4D Gaussian Splatting for Monocular Occluded Human Rendering [20.390068289144484]
本稿では,確率的変形ネットワークとダブルラスタライズパイプラインを統合したフレームワークであるU-4DGSを提案する。
このアーキテクチャは、適応変調器として機能する画素整列不確実性マップを描画し、信頼できない観測からアーチファクトを自動的に減衰させる。
ZJU-MoCapとOcMotionの実験は、U-4DGSがSOTAレンダリングの忠実性と堅牢性を達成することを示した。
論文 参考訳(メタデータ) (2026-02-06T03:14:37Z) - VAAS: Vision-Attention Anomaly Scoring for Image Manipulation Detection in Digital Forensics [0.0]
AI駆動画像生成の最近の進歩は、法医学的調査におけるデジタル証拠の正当性を検証するための新たな課題をもたらしている。
現代の生成モデルは、画素や圧縮アーチファクトに基づいた従来の検出器を避ける視覚的に一貫した偽造物を生成することができる。
本稿では,グローバルアテンションに基づく異常推定を統合した新しいデュアルモジュール・フレームワークであるVision-Attention Anomaly Scoring(VAAS)を紹介する。
論文 参考訳(メタデータ) (2025-12-17T15:05:40Z) - Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.32933059529135]
TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文 参考訳(メタデータ) (2025-08-28T07:09:21Z) - Bi-Grid Reconstruction for Image Anomaly Detection [0.0]
本稿では,textbfGRAD: Bi-textbfGrid textbfReconstruction for Image textbfAnomaly textbfDetectionを紹介する。
2つの連続格子を用いて、正常な視点と異常な視点の両方から異常検出を強化する。
全体的な精度と微妙な違いを識別し、既存の方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-04-01T10:06:38Z) - Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.87142367781417]
航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。
潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。
主要なコンポーネントを凍結し、残ったコンポーネントのみを適用することで、フェイクパターンを学習しながら、トレーニング済みの知識を保存します。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.14842693208465]
GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。
本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。
提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文 参考訳(メタデータ) (2024-07-17T09:27:41Z) - Beyond the Benchmark: Detecting Diverse Anomalies in Videos [0.6993026261767287]
ビデオ異常検出(VAD)は、現代の監視システムにおいて重要な役割を担い、現実の状況における様々な異常を識別することを目的としている。
現在のベンチマークデータセットは、新しいオブジェクト検出のような単純な単一フレームの異常を主に強調している。
我々は,従来のベンチマーク境界を超える複雑な異常を包含するVAD調査の拡大を提唱する。
論文 参考訳(メタデータ) (2023-10-03T09:22:06Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。