論文の概要: AnomalyAgent: Agentic Industrial Anomaly Synthesis via Tool-Augmented Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2604.07900v1
- Date: Thu, 09 Apr 2026 07:17:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.760202
- Title: AnomalyAgent: Agentic Industrial Anomaly Synthesis via Tool-Augmented Reinforcement Learning
- Title(参考訳): AnomalyAgent: ツール強化強化学習によるエージェント産業異常合成
- Authors: Jiaming Su, Tengchao Yang, Ruikang Zhang, Zhengan Yan, Haoyu Sun, Linfeng Zhang,
- Abstract要約: 本稿では,自己回帰,知識検索,反復的精錬機能を備えた異常合成エージェントであるAnomalyAgentを提案する。
具体的には、AnomalyAgentは、プロンプト生成(PG)、画像生成(IG)、品質評価(QE)、知識検索(KR)、マスク生成(MG)の5つのツールを備えている。
MVTec-ADデータセットでは、AnomalyAgent合成は、異常生成のための2.0.33のIS/IC-L、ResNet34を用いた57.0%の分類精度、単純なUNetを使用して画像/ピクセルレベルで99.3%/74.2%のAPを達成する。
- 参考スコア(独自算出の注目度): 7.129476412364631
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial anomaly generation is a crucial method for alleviating the data scarcity problem in anomaly detection tasks. Most existing anomaly synthesis methods rely on single-step generation mechanisms, lacking complex reasoning and iterative optimization capabilities, making it difficult to generate anomaly samples with high semantic realism. We propose AnomalyAgent, an anomaly synthesis agent with self-reflection, knowledge retrieval, and iterative refinement capabilities, aiming to generate realistic and diverse anomalies. Specifically, AnomalyAgent is equipped with five tools: Prompt Generation (PG), Image Generation (IG), Quality Evaluation (QE), Knowledge Retrieval (KR), and Mask Generation (MG), enabling closed-loop optimization. To improve decision-making and self-reflection, we construct structured trajectories from real anomaly images and design a two-stage training framework: supervised fine-tuning followed by reinforcement learning. This process is driven by a three-part reward mechanism: (1) task rewards to supervise the quality and location rationality of generated anomalies; (2) reflection rewards to train the model's ability to improve anomaly synthesis prompt; (3) behavioral rewards to ensure adherence to the trajectory. On the MVTec-AD dataset, AnomalyAgent achieves IS/IC-L of 2.10/0.33 for anomaly generation, 57.0% classification accuracy using ResNet34, and 99.3%/74.2% AP at the image/pixel level using a simple UNet, surpassing all zero-shot SOTA methods. The code and data will be made publicly available.
- Abstract(参考訳): 産業異常発生は異常検出タスクにおけるデータ不足問題を緩和するための重要な方法である。
既存のほとんどの異常合成法は、複雑な推論と反復最適化機能に欠ける単一ステップ生成機構に依存しており、意味的リアリズムの高い異常サンプルを生成することは困難である。
本稿では, 自己回帰, 知識検索, 反復改良機能を備えた異常合成エージェントであるAnomalyAgentを提案する。
具体的には,Pmpt Generation (PG), Image Generation (IG), Quality Evaluation (QE), Knowledge Retrieval (KR), Mask Generation (MG)の5つのツールを備える。
意思決定と自己回帰を改善するために,実際の異常画像から構造化軌跡を構築し,教師付き微調整と強化学習という2段階の訓練フレームワークを設計した。
このプロセスは、(1)生成した異常の質と位置の合理性を監督するタスク報酬、(2)異常合成のプロンプトを改善するモデルの能力を訓練するリフレクション報酬、(3)軌道への付着を確保するための行動報酬の三部構成によって駆動される。
MVTec-ADデータセットでは、AnomalyAgentは、異常発生のための2.10/0.33のIS/IC-L、ResNet34を用いた57.0%の分類精度、単純なUNetを使用して画像/ピクセルレベルで99.3%/74.2%のAPを達成し、すべてのゼロショットSOTAメソッドを上回ります。
コードとデータは公開されます。
関連論文リスト
- ERGO: Excess-Risk-Guided Optimization for High-Fidelity Monocular 3D Gaussian Splatting [63.138778159026934]
本稿では,ERGOと呼ばれる過度のリスク分解によって導かれる適応最適化フレームワークを提案する。
ERGOはビュー固有の過剰リスクを動的に推定し、最適化中の損失重みを適応的に調整する。
Google Scanned ObjectsデータセットとOmniObject3Dデータセットの実験は、既存の最先端メソッドよりもERGOの方が優れていることを示している。
論文 参考訳(メタデータ) (2026-02-10T20:44:43Z) - Beyond Quantity: Trajectory Diversity Scaling for Code Agents [51.71414642763219]
Trajectory Diversity Scalingは、コードエージェントのためのデータ合成フレームワークである。
TDScalingは、(1)実際のサービスの論理的依存関係をキャプチャするBusiness Clusterメカニズム、(2)軌道コヒーレンスを強制するブループリント駆動のマルチエージェントパラダイム、(3)ロングテールシナリオを指向する適応的な進化メカニズムの4つの革新を統合しています。
論文 参考訳(メタデータ) (2026-02-03T07:43:03Z) - GenAgent: Scaling Text-to-Image Generation via Agentic Multimodal Reasoning [54.42973725693]
我々は,エージェント型マルチモーダルモデルを用いて,視覚的理解と生成を統一したGenAgentを導入する。
GenAgentはGenEval++とWISEのベースジェネレータ(FLUX.1-dev)のパフォーマンスを大幅に向上させる。
本フレームワークは,1) 様々な機能を持つジェネレータへのクロスツール一般化,2) インタラクションラウンド間で一貫した改善を伴うテスト時間スケーリング,3) タスクに自動的に適応するタスク適応推論の3つの重要な特性を示す。
論文 参考訳(メタデータ) (2026-01-26T14:49:04Z) - Quality-Aware Language-Conditioned Local Auto-Regressive Anomaly Synthesis and Detection [30.77558600436759]
ARAS(ARAS)は、言語条件付き自動回帰異常合成手法である。
トークンアンコールによる遅延編集によって、ローカルでテキスト指定の欠陥を通常の画像に注入する。
欠陥リアリズムを著しく強化し、きめ細かい材料テクスチャを保存し、合成された異常に対して連続的な意味制御を提供する。
論文 参考訳(メタデータ) (2025-08-05T15:07:32Z) - MathPhys-Guided Coarse-to-Fine Anomaly Synthesis with SQE-Driven Bi-Level Optimization for Anomaly Detection [30.77558600436759]
本研究では,Math-Physモデル誘導による合成異常を生成する,新しい軽量パイプラインを提案する。
本手法は現実的な欠陥マスクを生成し,その後2段階に拡張した。
本手法を検証するために,MVTec AD, VisA, BTADの3つの異常検出ベンチマーク実験を行った。
論文 参考訳(メタデータ) (2025-04-17T14:22:27Z) - Component-aware Unsupervised Logical Anomaly Generation for Industrial Anomaly Detection [31.27483219228598]
異常検出は、製品の品質を確保し、自動化プロセスの効率を向上させるために、工業生産において重要である。
最近の生成モデルは、しばしば偽陽性を増大させる非現実的な異常を発生させるか、訓練のために現実世界の異常サンプルを必要とする。
本稿では,論理的異常生成のギャップに対処するコンポーネント・アウェアで教師なしのフレームワークであるComGENを提案する。
論文 参考訳(メタデータ) (2025-02-17T11:54:43Z) - RealNet: A Feature Selection Network with Realistic Synthetic Anomaly
for Anomaly Detection [7.626097310990373]
本稿では,リアルな合成異常と適応的な特徴選択を備えた特徴再構成ネットワークであるRealNetを紹介する。
我々は、異常認識特徴選択(AFS)と再構成残像選択(RRS)を開発する。
その結果,現在の最先端手法と比較して,イメージAUROCとPixelAUROCの両面で有意な改善が見られた。
論文 参考訳(メタデータ) (2024-03-09T12:25:01Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。