論文の概要: AgentIAD: Tool-Augmented Single-Agent for Industrial Anomaly Detection
- arxiv url: http://arxiv.org/abs/2512.13671v1
- Date: Mon, 15 Dec 2025 18:57:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.822945
- Title: AgentIAD: Tool-Augmented Single-Agent for Industrial Anomaly Detection
- Title(参考訳): AgentIAD: 産業用異常検出用ツール強化シングルエージェント
- Authors: Junwen Miao, Penghui Du, Yi Liu, Yu Wang, Yan Wang,
- Abstract要約: AgentIADは、多段階の視覚検査を可能にするツール駆動のフレームワークである。
AgentIADは、MMADの新しい最先端の97.62%の分類精度を達成する。
- 参考スコア(独自算出の注目度): 9.208080780536504
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial anomaly detection (IAD) is difficult due to the scarcity of normal reference samples and the subtle, localized nature of many defects. Single-pass vision-language models (VLMs) often overlook small abnormalities and lack explicit mechanisms to compare against canonical normal patterns. We propose AgentIAD, a tool-driven agentic framework that enables multi-stage visual inspection. The agent is equipped with a Perceptive Zoomer (PZ) for localized fine-grained analysis and a Comparative Retriever (CR) for querying normal exemplars when evidence is ambiguous. To teach these inspection behaviors, we construct structured perceptive and comparative trajectories from the MMAD dataset and train the model in two stages: supervised fine-tuning followed by reinforcement learning. A two-part reward design drives this process: a perception reward that supervises classification accuracy, spatial alignment, and type correctness, and a behavior reward that encourages efficient tool use. Together, these components enable the model to refine its judgment through step-wise observation, zooming, and verification. AgentIAD achieves a new state-of-the-art 97.62% classification accuracy on MMAD, surpassing prior MLLM-based approaches while producing transparent and interpretable inspection traces.
- Abstract(参考訳): 産業異常検出(IAD)は,正常な基準試料の不足と,多くの欠陥の微妙で局所的な性質のため困難である。
シングルパスビジョン言語モデル(VLM)は、しばしば小さな異常を見落とし、標準正規パターンと比較するための明確なメカニズムを欠いている。
我々は多段階視覚検査が可能なツール駆動型エージェントフレームワークであるAgentIADを提案する。
局所的きめ細かい分析のための知覚型ゾマー(PZ)と、証拠が曖昧である場合に正常な例を問合せするための比較レトリバー(CR)とを備える。
これらの検査行動を教えるために,MMADデータセットから構造化された知覚的および比較的軌跡を構築し,教師付き微調整と強化学習の2段階でモデルを訓練した。
認識報酬は分類精度、空間的アライメント、型補正を監督し、行動報酬は効率的なツールの使用を促進する。
これらのコンポーネントを組み合わせることで、ステップワイドな観察、ズーム、検証を通じてモデルを洗練することができる。
AgentIAD は MMAD の最新の97.62% の分類精度を達成し、MLLM に基づく以前の手法を上回り、透過的かつ解釈可能な検査トレースを生成する。
関連論文リスト
- Noise & pattern: identity-anchored Tikhonov regularization for robust structural anomaly detection [58.535473924035365]
異常検出は自動産業検査において重要な役割を担い、他の均一な視覚パターンの微妙な欠陥や稀な欠陥を識別することを目的としている。
自己教師型オートエンコーダを用いて, 破損した入力の修復を学習する構造的異常検出に取り組む。
構造欠陥を模倣した画像に人工的破壊を注入する汚職モデルを導入する。
論文 参考訳(メタデータ) (2025-11-10T15:48:50Z) - Correcting False Alarms from Unseen: Adapting Graph Anomaly Detectors at Test Time [60.341117019125214]
グラフ異常検出(GAD)における未確認正規pattErnsの修正のための,軽量かつプラグアンドプレイなテスト時間適応フレームワークを提案する。
意味的混乱に対処するために、シフトしたデータと元のデータとをグラフ属性レベルで整合させるグラフ整合器を用いる。
10個の実世界のデータセットに対する大規模な実験により、TUNEは事前学習されたGADモデルの合成パターンと実際の見えない正常パターンの両方への一般化性を著しく向上することが示された。
論文 参考訳(メタデータ) (2025-11-10T12:10:05Z) - Metacognitive Self-Correction for Multi-Agent System via Prototype-Guided Next-Execution Reconstruction [58.51530390018909]
大規模言語モデルに基づくマルチエージェントシステムは、協調的な問題解決において優れているが、エラーのカスケードには脆弱である。
我々は,MASにリアルタイム,教師なし,ステップレベルの誤り検出と自己補正を付与するメタ認知フレームワークMASCを提案する。
論文 参考訳(メタデータ) (2025-10-16T05:35:37Z) - Learning local and global prototypes with optimal transport for unsupervised anomaly detection and localization [0.28647133890966986]
教師なし異常検出は、トレーニング中に正常なデータ、すなわち欠陥のない一連のデータにアクセスすることで、サンプルの欠陥部分を検出することを目的としている。
本稿では,プロトタイプ学習に基づく新しいUAD手法を提案する。
論文 参考訳(メタデータ) (2025-08-18T13:51:36Z) - Injecting Explainability and Lightweight Design into Weakly Supervised Video Anomaly Detection Systems [4.32380943607886]
本稿では,知識蒸留とクロスモーダルコントラスト学習を活用したTCVADS(Two-stage Cross-modal Video Anomaly Detection System)を提案する。
実験結果から,TCVADSはモデル性能,検出効率,解釈可能性において既存手法よりも優れていた。
論文 参考訳(メタデータ) (2024-12-28T16:24:35Z) - GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.14842693208465]
GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。
本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。
提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文 参考訳(メタデータ) (2024-07-17T09:27:41Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。