論文の概要: LVLMs as inspectors: an agentic framework for category-level structural defect annotation
- arxiv url: http://arxiv.org/abs/2510.00603v1
- Date: Wed, 01 Oct 2025 07:31:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.442583
- Title: LVLMs as inspectors: an agentic framework for category-level structural defect annotation
- Title(参考訳): インスペクタとしてのLVLM:カテゴリーレベルの構造欠陥アノテーションのためのエージェントフレームワーク
- Authors: Sheng Jiang, Yuanmin Ning, Bingxi Huang, Peiyin Chen, Zhaohui Chen,
- Abstract要約: エージェントベースの新しいエージェントアノテーションフレームワークであるDefect Pattern Taggerが導入された。
これはLVLM(Large Vision-Language Models)とセマンティックパターンマッチングモジュールと反復的な自己探索機構を統合している。
生の視覚データを高品質でセマンティックにラベル付けされた欠陥データセットに変換する。
- 参考スコア(独自算出の注目度): 3.2445985501669434
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Automated structural defect annotation is essential for ensuring infrastructure safety while minimizing the high costs and inefficiencies of manual labeling. A novel agentic annotation framework, Agent-based Defect Pattern Tagger (ADPT), is introduced that integrates Large Vision-Language Models (LVLMs) with a semantic pattern matching module and an iterative self-questioning refinement mechanism. By leveraging optimized domain-specific prompting and a recursive verification process, ADPT transforms raw visual data into high-quality, semantically labeled defect datasets without any manual supervision. Experimental results demonstrate that ADPT achieves up to 98% accuracy in distinguishing defective from non-defective images, and 85%-98% annotation accuracy across four defect categories under class-balanced settings, with 80%-92% accuracy on class-imbalanced datasets. The framework offers a scalable and cost-effective solution for high-fidelity dataset construction, providing strong support for downstream tasks such as transfer learning and domain adaptation in structural damage assessment.
- Abstract(参考訳): 手動ラベリングのコストと非効率を最小化しつつ、インフラストラクチャの安全性を確保するためには、自動構造欠陥アノテーションが不可欠である。
新しいエージェントアノテーションフレームワークであるAgen-based Defect Pattern Tagger (ADPT)が導入され、LVLM(Large Vision-Language Models)とセマンティックなパターンマッチングモジュールと反復的な自己問合せ機構を統合している。
最適化されたドメイン固有のプロンプトと再帰的な検証プロセスを活用することで、ADPTは、生の視覚データを、手動の監督なしに高品質でセマンティックにラベル付けされた欠陥データセットに変換する。
実験の結果,ADPTは欠陥画像と非欠陥画像の区別において最大98%の精度を達成し,クラスバランスデータセットでは80%-92%の精度で4つの欠陥カテゴリに対して85%-98%の精度を達成できた。
このフレームワークは、高忠実度データセット構築のためのスケーラブルで費用対効果の高いソリューションを提供し、構造的損傷評価におけるトランスファーラーニングやドメイン適応などの下流タスクを強力にサポートする。
関連論文リスト
- A Contrastive Learning-Guided Confident Meta-learning for Zero Shot Anomaly Detection [17.73056562717683]
CoZADは、新しいゼロショット異常検出フレームワークである。
ソフト・インテリジェンス・ラーニングとメタラーニングとコントラスト的特徴表現を統合している。
7つの産業ベンチマークのうち6つで既存の手法を上回ります。
論文 参考訳(メタデータ) (2025-08-25T09:27:31Z) - Automated Defect Identification and Categorization in NDE 4.0 with the Application of Artificial Intelligence [2.1458230584719247]
放射線検査における欠陥検出と組織化のための自動フレームワークの構築を試みる。
基本情報源として、航空機溶接部の223枚のCR写真を編集・分類する技術である。
欠陥の強い相違を示す小型のa90/95特性は, 提案手法が欠陥検出において例外的な認識を達成していることを示す。
論文 参考訳(メタデータ) (2025-06-26T06:25:36Z) - Stress-Testing ML Pipelines with Adversarial Data Corruption [11.91482648083998]
規制当局は現在、ハイテイクシステムは現実的で相互依存的なエラーに耐えられるという証拠を要求している。
SAVAGEは依存性グラフとフレキシブルな汚いテンプレートを通じて、データ品質の問題を正式にモデル化するフレームワークです。
Savanageは、脆弱性のあるデータサブポピュレーションと微調整による汚職の深刻度を効率的に識別するために、双方向の最適化アプローチを採用している。
論文 参考訳(メタデータ) (2025-06-02T00:41:24Z) - The Achilles Heel of AI: Fundamentals of Risk-Aware Training Data for High-Consequence Models [0.0]
高頻度ドメインのAIシステムは、厳密なリソース制約の下で運用しながら、稀で高インパクトなイベントを検出する必要がある。
ラベルのボリュームを情報的価値よりも優先する従来のアノテーション戦略は冗長性とノイズをもたらす。
本稿では、ラベルの多様性、モデル誘導選択、限界ユーティリティベースの停止を強調するトレーニングデータ戦略であるスマートサイズについて紹介する。
論文 参考訳(メタデータ) (2025-05-20T22:57:35Z) - AlignRAG: Leveraging Critique Learning for Evidence-Sensitive Retrieval-Augmented Reasoning [61.28113271728859]
RAGは知識ベースで大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
標準的なRAGパイプラインは、モデル推論が取得した証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
本研究では,RAGをRetrieval-Augmented Reasoningと解釈し,中心的だが未探索な問題であるtextitReasoning Misalignmentを同定する。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z) - Few-Shot Optimized Framework for Hallucination Detection in Resource-Limited NLP Systems [1.0124625066746595]
本稿では,DeepSeek Few-shotの最適化を導入し,反復的なプロンプトエンジニアリングによりラベル生成の弱さを高める。
下流モデルの性能を大幅に向上させる高品質なアノテーションを実現する。
さらに、これらの最適化アノテーションに基づいてMistral-7B-Instruct-v0.3モデルを微調整し、リソース制限設定における幻覚を正確に検出する。
論文 参考訳(メタデータ) (2025-01-28T01:26:22Z) - Parameter-tuning-free data entry error unlearning with adaptive
selective synaptic dampening [51.34904967046097]
本稿では,パラメータチューニングの必要性を排除した選択的シナプス減衰アンラーニング法の拡張を提案する。
本稿では,ResNet18とVision Transformerの未学習タスクにおける適応選択的シナプス減衰(ASSD)の性能を示す。
このアプローチの適用は、サプライチェーン管理などの産業環境において特に魅力的である。
論文 参考訳(メタデータ) (2024-02-06T14:04:31Z) - Discover, Explanation, Improvement: An Automatic Slice Detection
Framework for Natural Language Processing [72.14557106085284]
スライス検出モデル(SDM)は、データポイントの低パフォーマンスなグループを自動的に識別する。
本稿では,NLPタスクの分類のための "Discover, Explain, improve (DEIM)" というベンチマークを提案する。
評価の結果,Edisaは情報的セマンティックな特徴を持つ誤り発生データポイントを正確に選択できることがわかった。
論文 参考訳(メタデータ) (2022-11-08T19:00:00Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。