論文の概要: InsightX Agent: An LMM-based Agentic Framework with Integrated Tools for Reliable X-ray NDT Analysis
- arxiv url: http://arxiv.org/abs/2507.14899v1
- Date: Sun, 20 Jul 2025 10:23:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:32.112782
- Title: InsightX Agent: An LMM-based Agentic Framework with Integrated Tools for Reliable X-ray NDT Analysis
- Title(参考訳): InsightX Agent: 信頼性の高いX線NDT解析ツールを備えたLMMベースのエージェントフレームワーク
- Authors: Jiale Liu, Huan Wang, Yue Zhang, Xiaoyu Luo, Jiaxiang Hu, Zhiliang Liu, Min Xie,
- Abstract要約: 非破壊試験(NDT)は産業品質保証に不可欠である。
既存のディープラーニングベースのアプローチは、対話性、解釈可能性、そして批判的な自己評価能力に欠けることが多い。
本稿では,信頼性,解釈性,インタラクティブなNDT分析を実現するための新しいLMMベースのエージェントフレームワークであるInsightX Agentを提案する。
- 参考スコア(独自算出の注目度): 16.686848727476644
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Non-destructive testing (NDT), particularly X-ray inspection, is vital for industrial quality assurance, yet existing deep-learning-based approaches often lack interactivity, interpretability, and the capacity for critical self-assessment, limiting their reliability and operator trust. To address these shortcomings, this paper proposes InsightX Agent, a novel LMM-based agentic framework designed to deliver reliable, interpretable, and interactive X-ray NDT analysis. Unlike typical sequential pipelines, InsightX Agent positions a Large Multimodal Model (LMM) as a central orchestrator, coordinating between the Sparse Deformable Multi-Scale Detector (SDMSD) and the Evidence-Grounded Reflection (EGR) tool. The SDMSD generates dense defect region proposals for multi-scale feature maps and sparsifies them through Non-Maximum Suppression (NMS), optimizing detection of small, dense targets in X-ray images while maintaining computational efficiency. The EGR tool guides the LMM agent through a chain-of-thought-inspired review process, incorporating context assessment, individual defect analysis, false positive elimination, confidence recalibration and quality assurance to validate and refine the SDMSD's initial proposals. By strategically employing and intelligently using tools, InsightX Agent moves beyond passive data processing to active reasoning, enhancing diagnostic reliability and providing interpretations that integrate diverse information sources. Experimental evaluations on the GDXray+ dataset demonstrate that InsightX Agent not only achieves a high object detection F1-score of 96.35% but also offers significantly improved interpretability and trustworthiness in its analyses, highlighting the transformative potential of agentic LLM frameworks for industrial inspection tasks.
- Abstract(参考訳): 非破壊検査(NDT)、特にX線検査は、産業品質保証に不可欠であるが、既存のディープラーニングベースのアプローチでは、対話性、解釈可能性、重要な自己評価能力が欠如しており、信頼性とオペレーターの信頼が制限されている。
これらの欠点に対処するため,本稿では,信頼性,解釈性,インタラクティブなX線NDT解析を実現するための新しいLMMベースのエージェントフレームワークであるInsightX Agentを提案する。
典型的なシーケンシャルパイプラインとは異なり、InsightX Agentは、Sparse Deformable Multi-Scale Detector(SDMSD)とEvidence-Grounded Reflection(EGR)ツールの間で協調して、LMM(Large Multimodal Model)を中央オーケストレータとして配置する。
SDMSDは、マルチスケール特徴写像のための高密度欠陥領域の提案を生成し、それらを非最大抑圧(NMS)により分散させ、計算効率を維持しながら、X線画像中の小さな高密度ターゲットの検出を最適化する。
EGRツールは、コンテキストアセスメント、個々の欠陥分析、偽陽性の排除、信頼回復、品質保証を取り入れて、SDMSDの最初の提案を検証・改善する、チェーン・オブ・インスパイアされたレビュープロセスを通じてLMMエージェントをガイドする。
ツールを戦略的に活用し、インテリジェントに利用することにより、InsightX Agentは受動的データ処理を超えて、アクティブな推論に移行し、診断の信頼性を高め、多様な情報ソースを統合する解釈を提供する。
GDXray+データセットの実験的評価では、InsightX Agentは96.35%の高オブジェクト検出F1スコアを達成するだけでなく、分析における解釈可能性と信頼性を大幅に改善し、産業検査タスクにおけるエージェントLLMフレームワークの変革の可能性を強調している。
関連論文リスト
- A Large Language Model-Empowered Agent for Reliable and Robust Structural Analysis [14.754785659805869]
大規模言語モデル(LLM)は、様々なオープンドメインタスクにまたがる顕著な能力を示してきたが、土木工学のような専門分野への応用は、いまだに未解明のままである。
本稿では, ビーム構造解析におけるLCMの信頼性とロバスト性を評価することによって, このギャップを埋める。
実験の結果, エージェントはベンチマークデータセット上で99.0%を超える精度を達成し, 多様な条件で信頼性と堅牢性を示すことがわかった。
論文 参考訳(メタデータ) (2025-06-27T04:16:53Z) - RadFabric: Agentic AI System with Reasoning Capability for Radiology [61.25593938175618]
RadFabricは、総合的なCXR解釈のための視覚的およびテキスト分析を統合するマルチエージェント、マルチモーダル推論フレームワークである。
システムは、病理診断に特殊なCXRエージェント、正確な解剖学的構造に視覚所見をマッピングする解剖学的解釈エージェント、および視覚的、解剖学的、臨床データを透明かつ証拠に基づく診断に合成する大規模なマルチモーダル推論モデルを利用した推論エージェントを使用する。
論文 参考訳(メタデータ) (2025-06-17T03:10:33Z) - Agent-based Condition Monitoring Assistance with Multimodal Industrial Database Retrieval Augmented Generation [3.8451399765175016]
状態監視(CM)は、プロセス産業において信頼性と効率を確保する上で重要な役割を担います。
この研究は、大規模言語モデル(LLM)ベースの推論エージェントとCMを統合し、アナリストと業界のニーズに対処する。
我々は、マルチモーダル検索拡張生成(RAG)とCMデータ専用に設計された新しいベクトルストア構造を組み合わせたモジュラーフレームワークであるMindRAGを提案する。
論文 参考訳(メタデータ) (2025-06-10T21:04:18Z) - Ensuring Reliability of Curated EHR-Derived Data: The Validation of Accuracy for LLM/ML-Extracted Information and Data (VALID) Framework [0.0]
大規模言語モデル(LLM)により抽出された臨床データの質を評価するための包括的枠組みを提案する。
このフレームワークは、専門家による抽象化に対する変数レベルのパフォーマンスベンチマーク、内部の一貫性と妥当性の自動検証、レプリケーション分析を統合している。
この多次元アプローチは、改善が必要な変数の同定、潜時エラーの体系的検出、および実世界の研究におけるデータセットの適合性確認を可能にする。
論文 参考訳(メタデータ) (2025-06-09T20:59:16Z) - IDA-Bench: Evaluating LLMs on Interactive Guided Data Analysis [60.32962597618861]
IDA-Benchは、多ラウンドの対話シナリオで大規模言語モデルを評価する新しいベンチマークである。
エージェント性能は、最終的な数値出力と人間由来のベースラインを比較して判断する。
最先端のコーディングエージェント(Claude-3.7-thinkingなど)でさえ50%のタスクを成功させ、シングルターンテストでは明らかでない制限を強調している。
論文 参考訳(メタデータ) (2025-05-23T09:37:52Z) - CBM-RAG: Demonstrating Enhanced Interpretability in Radiology Report Generation with Multi-Agent RAG and Concept Bottleneck Models [1.7042756021131187]
本稿では,CBM(Concept Bottleneck Models)とRAG(Multi-Agent Retrieval-Augmented Generation)システムを組み合わせた自動放射線学レポート生成フレームワークを提案する。
CBMは胸部X線の特徴を人間の理解できない臨床概念にマッピングし、透明な疾患分類を可能にする。
RAGシステムはマルチエージェントのコラボレーションと外部知識を統合し、文脈的にリッチなエビデンスベースのレポートを生成する。
論文 参考訳(メタデータ) (2025-04-29T16:14:55Z) - AlignRAG: Leveraging Critique Learning for Evidence-Sensitive Retrieval-Augmented Reasoning [61.28113271728859]
RAGは知識ベースで大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
標準的なRAGパイプラインは、モデル推論が取得した証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
本研究では,RAGをRetrieval-Augmented Reasoningと解釈し,中心的だが未探索な問題であるtextitReasoning Misalignmentを同定する。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z) - Enhancing LLM Reliability via Explicit Knowledge Boundary Modeling [48.15636223774418]
大規模言語モデル(LLM)は、不一致の自己認識に起因する幻覚の傾向にある。
本稿では,高速かつ低速な推論システムを統合し,信頼性とユーザビリティを調和させる明示的知識境界モデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-04T03:16:02Z) - Unsupervised Model Diagnosis [49.36194740479798]
本稿では,ユーザガイドを使わずに,意味論的対実的説明を生成するために,Unsupervised Model Diagnosis (UMO)を提案する。
提案手法は意味論における変化を特定し可視化し,その変化を広範囲なテキストソースの属性と照合する。
論文 参考訳(メタデータ) (2024-10-08T17:59:03Z) - AgentBoard: An Analytical Evaluation Board of Multi-turn LLM Agents [74.16170899755281]
本稿では,LLMエージェントの分析的評価に適したオープンソース評価フレームワークであるAgentBoardを紹介する。
AgentBoardは、インクリメンタルな進歩と包括的な評価ツールキットをキャプチャする、きめ細かい進捗率のメトリクスを提供する。
これはLLMエージェントの能力と限界に光を当てるだけでなく、その性能の解釈可能性も最前線に広める。
論文 参考訳(メタデータ) (2024-01-24T01:51:00Z) - Word-Level ASR Quality Estimation for Efficient Corpus Sampling and
Post-Editing through Analyzing Attentions of a Reference-Free Metric [5.592917884093537]
品質推定(QE)メトリクスのポテンシャルは、ASRシステムにおける説明可能な人工知能(XAI)を強化する新しいツールとして導入され、評価される。
NoRefERメトリックの能力は、単語レベルの誤りを識別し、ASR仮説を補うのに役立つ。
論文 参考訳(メタデータ) (2024-01-20T16:48:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。