論文の概要: Retrieval-Augmented Multi-LLM Ensemble for Industrial Part Specification Extraction
- arxiv url: http://arxiv.org/abs/2601.05266v1
- Date: Sat, 08 Nov 2025 14:43:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-25 16:54:51.535996
- Title: Retrieval-Augmented Multi-LLM Ensemble for Industrial Part Specification Extraction
- Title(参考訳): 産業部品仕様抽出のための検索強化マルチLLMアンサンブル
- Authors: Muzakkiruddin Ahmed Mohammed, John R. Talburt, Leon Claasssens, Adriaan Marais,
- Abstract要約: 本稿では,9つの最先端大言語モデル(LLM)を編成する検索強化マルチLLMアンサンブルフレームワークを提案する。
RAGsembleは、Gemini (2.0, 2.5, 1.5)、OpenAI (GPT-4o, o4-mini)、Mistral Large、Gemma (1B, 4B, 3n-e4b)などのモデルファミリーの補完的な強みを組み合わせることで、単一モデルシステムの重要な制限に対処する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Industrial part specification extraction from unstructured text remains a persistent challenge in manufacturing, procurement, and maintenance, where manual processing is both time-consuming and error-prone. This paper introduces a retrieval-augmented multi-LLM ensemble framework that orchestrates nine state-of-the-art Large Language Models (LLMs) within a structured three-phase pipeline. RAGsemble addresses key limitations of single-model systems by combining the complementary strengths of model families including Gemini (2.0, 2.5, 1.5), OpenAI (GPT-4o, o4-mini), Mistral Large, and Gemma (1B, 4B, 3n-e4b), while grounding outputs in factual data using FAISS-based semantic retrieval. The system architecture consists of three stages: (1) parallel extraction by diverse LLMs, (2) targeted research augmentation leveraging high-performing models, and (3) intelligent synthesis with conflict resolution and confidence-aware scoring. RAG integration provides real-time access to structured part databases, enabling the system to validate, refine, and enrich outputs through similarity-based reference retrieval. Experimental results using real industrial datasets demonstrate significant gains in extraction accuracy, technical completeness, and structured output quality compared to leading single-LLM baselines. Key contributions include a scalable ensemble architecture for industrial domains, seamless RAG integration throughout the pipeline, comprehensive quality assessment mechanisms, and a production-ready solution suitable for deployment in knowledge-intensive manufacturing environments.
- Abstract(参考訳): 産業的部分の仕様を非構造化テキストから抽出することは、手作業による処理が時間を要することとエラーを起こしやすいことの両方において、製造、調達、保守において永続的な課題である。
本稿では,構造化3相パイプライン内で9つの最先端の大規模言語モデル(LLM)を編成する,検索強化マルチLLMアンサンブルフレームワークを提案する。
RAGsembleは、Gemini (2.0, 2.5, 1.5)、OpenAI (GPT-4o, o4-mini)、Mistral Large、Gemma (1B, 4B, 3n-e4b)などのモデルファミリーの補完的な強みを組み合わせることで、単一モデルシステムの重要な制限に対処する。
システムアーキテクチャは,(1)多種多様なLCMによる並列抽出,(2)高パフォーマンスモデルを活用した研究強化,(3)紛争解決と信頼度を考慮したインテリジェントな合成,の3段階からなる。
RAG統合は構造化された部分データベースへのリアルタイムアクセスを提供し、システムは類似性に基づく参照検索を通じて出力を検証、洗練、強化することができる。
実産業データセットを用いた実験結果から, 抽出精度, 技術的完全性, 構造的出力品質が, 先行する単一LLMベースラインと比較して有意に向上した。
主なコントリビューションとしては、産業領域のためのスケーラブルなアンサンブルアーキテクチャ、パイプライン全体にわたるシームレスなRAG統合、包括的な品質評価メカニズム、知識集約型製造環境への展開に適したプロダクション対応ソリューションなどがある。
関連論文リスト
- Layout-Aware Parsing Meets Efficient LLMs: A Unified, Scalable Framework for Resume Information Extraction and Evaluation [31.356673356827432]
自動抽出・評価のためのレイアウト認識・効率最適化フレームワークを提案する。
私たちのシステムはAlibabaのインテリジェントなHRプラットフォームに完全にデプロイされています。
論文 参考訳(メタデータ) (2025-10-10T07:01:35Z) - Automatic Building Code Review: A Case Study [6.530899637501737]
建設担当者は、プロジェクトのサイズと複雑さが増大するにつれて、労働集約的で、エラーを起こし、コストがかかる設計文書のレビューに直面します。
本研究では,BIMに基づくデータ抽出と自動検証を統合したエージェント駆動型フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-03T00:30:14Z) - A Tale of Two Experts: Cooperative Learning for Source-Free Unsupervised Domain Adaptation [59.88864205383671]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、ソースデータにアクセスすることなく、ターゲットドメインにソース学習モデルを適用するという現実的な課題に対処する。
既存のSFUDA手法は、ソースモデルの予測のみを利用するか、大きなマルチモーダルモデルを微調整する。
本稿では、補完的な洞察と対象データの潜在構造を利用するためのエキスパート協調学習(EXCL)を提案する。
論文 参考訳(メタデータ) (2025-09-26T11:39:50Z) - OnePiece: Bringing Context Engineering and Reasoning to Industrial Cascade Ranking System [61.12400636463362]
OnePieceは、LLMスタイルのコンテキストエンジニアリングと推論を、検索モデルとランキングモデルの両方にシームレスに統合する統合フレームワークである。
OnePieceは、Shopeeの主要なパーソナライズされた検索シナリオにデプロイされ、さまざまな主要なビジネス指標で一貫したオンラインゲインを実現している。
論文 参考訳(メタデータ) (2025-09-22T17:59:07Z) - Loong: Synthesize Long Chain-of-Thoughts at Scale through Verifiers [103.4410890572479]
スケーラブルな合成データ生成と検証のためのオープンソースのフレームワークであるLoong Projectを紹介します。
LoongBenchは、12のドメインにまたがる8,729の人為的なサンプルを含む、キュレートされたシードデータセットである。
LoongEnvはモジュラー合成データ生成環境であり、新しい質問応答コードのトリプルを生成する複数のプロンプト戦略をサポートする。
論文 参考訳(メタデータ) (2025-09-03T06:42:40Z) - VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use [78.29315418819074]
VerlToolは、体系的な設計原則を通じて制限に対処する統一的でモジュール化されたフレームワークです。
我々のフレームワークはARLTをマルチターントラジェクトリとして定式化し、マルチモード観測トークン(テキスト/画像/ビデオ)を単一ターンRLVRパラダイムを超えて拡張する。
モジュール化されたプラグインアーキテクチャは、軽量Python定義のみを必要とする迅速なツール統合を可能にする。
論文 参考訳(メタデータ) (2025-09-01T01:45:18Z) - Leveraging Generative Models for Real-Time Query-Driven Text Summarization in Large-Scale Web Search [54.987957691350665]
クエリ駆動テキスト要約(QDTS)は、与えられたクエリに基づいてテキスト文書から簡潔で情報的な要約を生成することを目的としている。
従来の抽出的要約モデルは、主にランク付け候補の要約セグメントに基づいており、産業応用において支配的なアプローチとなっている。
産業Web検索におけるリアルタイムQDTSに対処するための生成モデルの適用を開拓するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-28T08:51:51Z) - Patchwork: A Unified Framework for RAG Serving [6.430565435912026]
Retrieval Augmented Generation (RAG) は、外部知識ソースとの統合による大規模言語モデルの信頼性向上のための新しいパラダイムとして登場した。
Patchworkは、これらの効率のボトルネックに対処するために設計された、包括的なエンドツーエンドのRAGサービスフレームワークです。
論文 参考訳(メタデータ) (2025-05-01T18:58:26Z) - HM-RAG: Hierarchical Multi-Agent Multimodal Retrieval Augmented Generation [11.53083922927901]
HM-RAGは階層型マルチエージェントマルチモーダルRAGフレームワークである。
構造化、非構造化、グラフベースのデータ間での動的知識合成のための協調知能の先駆者である。
論文 参考訳(メタデータ) (2025-04-13T06:55:33Z) - CONSTRUCTA: Automating Commercial Construction Schedules in Fabrication Facilities with Large Language Models [9.419063976761175]
本稿では,半導体製造などの複雑なプロジェクトにおいて,LCMを活用して構築スケジュールを最適化する新しいフレームワークを提案する。
ConSTRUCTAは,(1)静的なRAGを通して構築固有の知識を統合すること,(2)アーキテクチャの専門知識にインスパイアされたコンテキストサンプリング技術を用いて関連するインプットを提供すること,(3)スケジュールを専門家の好みに合わせるために構築DPOを配置すること,といった課題に対処する。
論文 参考訳(メタデータ) (2025-02-17T17:35:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。