論文の概要: Multimodal RAG-driven Anomaly Detection and Classification in Laser Powder Bed Fusion using Large Language Models
- arxiv url: http://arxiv.org/abs/2505.13828v1
- Date: Tue, 20 May 2025 02:18:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:52.596966
- Title: Multimodal RAG-driven Anomaly Detection and Classification in Laser Powder Bed Fusion using Large Language Models
- Title(参考訳): 大規模言語モデルを用いたレーザー粉体層融合におけるマルチモーダルRAG駆動型異常検出と分類
- Authors: Kiarash Naghavi Khanghah, Zhiling Chen, Lela Romeo, Qian Yang, Rajiv Malhotra, Farhad Imani, Hongyi Xu,
- Abstract要約: 本研究では, 各種添加物製造工程における異常検出を自動化するマルチモーダル検索型生成フレームワークを提案する。
このフレームワークは、科学文献とマルチモーダル生成モデルからテキストと画像の検索を統合し、ゼロショットの異常識別、分類、説明生成を行う。
- 参考スコア(独自算出の注目度): 19.01128639316654
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Additive manufacturing enables the fabrication of complex designs while minimizing waste, but faces challenges related to defects and process anomalies. This study presents a novel multimodal Retrieval-Augmented Generation-based framework that automates anomaly detection across various Additive Manufacturing processes leveraging retrieved information from literature, including images and descriptive text, rather than training datasets. This framework integrates text and image retrieval from scientific literature and multimodal generation models to perform zero-shot anomaly identification, classification, and explanation generation in a Laser Powder Bed Fusion setting. The proposed framework is evaluated on four L-PBF manufacturing datasets from Oak Ridge National Laboratory, featuring various printer makes, models, and materials. This evaluation demonstrates the framework's adaptability and generalizability across diverse images without requiring additional training. Comparative analysis using Qwen2-VL-2B and GPT-4o-mini as MLLM within the proposed framework highlights that GPT-4o-mini outperforms Qwen2-VL-2B and proportional random baseline in manufacturing anomalies classification. Additionally, the evaluation of the RAG system confirms that incorporating retrieval mechanisms improves average accuracy by 12% by reducing the risk of hallucination and providing additional information. The proposed framework can be continuously updated by integrating emerging research, allowing seamless adaptation to the evolving landscape of AM technologies. This scalable, automated, and zero-shot-capable framework streamlines AM anomaly analysis, enhancing efficiency and accuracy.
- Abstract(参考訳): 付加的な製造により、廃棄物を最小化しながら複雑な設計を作成できるが、欠陥やプロセス異常に関連する課題に直面している。
本研究では, 画像や記述文などの文献から抽出した情報を利用して, 各種添加物製造工程の異常検出を自動化する, 新たなマルチモーダル検索型生成フレームワークを提案する。
このフレームワークは、科学文献とマルチモーダル生成モデルからのテキストと画像の検索を統合し、レーザー粉体融合におけるゼロショット異常識別、分類、説明生成を行う。
提案したフレームワークはオークリッジ国立研究所の4つのL-PBF製造データセットで評価され、様々なプリンタの製造、モデル、材料が特徴である。
この評価は、追加のトレーニングを必要とせず、様々な画像にまたがるフレームワークの適応性と一般化性を示す。
MLLM として Qwen2-VL-2B と GPT-4o-mini を用いて解析した結果, GPT-4o-mini が製造異常分類において Qwen2-VL-2B および比例ランダムベースラインより優れていることがわかった。
さらに、RAGシステムの評価により、幻覚のリスクを低減し、追加情報を提供することで、検索機構を組み込むことで平均精度が12%向上することを確認する。
提案するフレームワークは、新たな研究を統合することで継続的に更新可能であり、AM技術の進化する展望にシームレスに適応することができる。
このスケーラブルで自動化され、ゼロショット対応のフレームワークは、AM異常解析を合理化し、効率と精度を向上させる。
関連論文リスト
- Component-aware Unsupervised Logical Anomaly Generation for Industrial Anomaly Detection [31.27483219228598]
異常検出は、製品の品質を確保し、自動化プロセスの効率を向上させるために、工業生産において重要である。
最近の生成モデルは、しばしば偽陽性を増大させる非現実的な異常を発生させるか、訓練のために現実世界の異常サンプルを必要とする。
本稿では,論理的異常生成のギャップに対処するコンポーネント・アウェアで教師なしのフレームワークであるComGENを提案する。
論文 参考訳(メタデータ) (2025-02-17T11:54:43Z) - A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - Automatic Evaluation for Text-to-image Generation: Task-decomposed Framework, Distilled Training, and Meta-evaluation Benchmark [62.58869921806019]
GPT-4oに基づくタスク分解評価フレームワークを提案し、新しいトレーニングデータセットを自動構築する。
我々は、GPT-4oの評価能力を7BオープンソースMLLM、MiniCPM-V-2.6に効果的に蒸留するための革新的なトレーニング戦略を設計する。
実験結果から,我々の蒸留したオープンソースMLLMは,現在のGPT-4oベースラインよりも有意に優れていた。
論文 参考訳(メタデータ) (2024-11-23T08:06:06Z) - THaMES: An End-to-End Tool for Hallucination Mitigation and Evaluation in Large Language Models [0.0]
事実的に誤ったコンテンツの生成である幻覚は、大規模言語モデルにおいてますます困難になっている。
本稿では,このギャップに対処する統合フレームワークとライブラリであるTHaMESを紹介する。
THaMES は LLM における幻覚の評価と緩和のためのエンドツーエンドのソリューションを提供する。
論文 参考訳(メタデータ) (2024-09-17T16:55:25Z) - RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework [66.93260816493553]
本稿では,様々なシナリオにまたがってRAGシステムを評価するためのフレームワークであるRAGvalを紹介する。
事実の正確性に焦点をあてて,完全性,幻覚,不適切性の3つの新しい指標を提案する。
実験結果から, RAGEvalは, 生成した試料の明瞭度, 安全性, 適合性, 豊かさにおいて, ゼロショット法とワンショット法より優れていた。
論文 参考訳(メタデータ) (2024-08-02T13:35:11Z) - Exploring Precision and Recall to assess the quality and diversity of LLMs [82.21278402856079]
我々はtextscLlama-2 や textscMistral のような大規模言語モデル (LLM) のための新しい評価フレームワークを提案する。
このアプローチにより、コーパスの整合を必要とせず、生成したテキストの品質と多様性を微妙に評価できる。
論文 参考訳(メタデータ) (2024-02-16T13:53:26Z) - Discover, Explanation, Improvement: An Automatic Slice Detection
Framework for Natural Language Processing [72.14557106085284]
スライス検出モデル(SDM)は、データポイントの低パフォーマンスなグループを自動的に識別する。
本稿では,NLPタスクの分類のための "Discover, Explain, improve (DEIM)" というベンチマークを提案する。
評価の結果,Edisaは情報的セマンティックな特徴を持つ誤り発生データポイントを正確に選択できることがわかった。
論文 参考訳(メタデータ) (2022-11-08T19:00:00Z) - Automatic Visual Inspection of Rare Defects: A Framework based on
GP-WGAN and Enhanced Faster R-CNN [0.0]
本稿では,自動視覚検査(AVI)システムの2段階故障診断フレームワークを提案する。
第1段階では、実サンプルに基づいて新しいサンプルを合成する生成モデルが設計されている。
提案アルゴリズムは,実際のサンプルからオブジェクトを抽出し,ランダムにブレンドし,新しいサンプルを生成し,画像処理の性能を向上させる。
論文 参考訳(メタデータ) (2021-05-02T11:34:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。