論文の概要: Automating Information Extraction and Retrieval for Industrial Spare Parts Pooling
- arxiv url: http://arxiv.org/abs/2606.03367v1
- Date: Tue, 02 Jun 2026 09:14:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.897183
- Title: Automating Information Extraction and Retrieval for Industrial Spare Parts Pooling
- Title(参考訳): 産業用スペア部品のポーリングにおける情報抽出と検索の自動化
- Authors: Dyuman Bulloni, Rocco Felici, Oliver Avram, Anna Valente,
- Abstract要約: 製造業の保守組織は、既存の資産を再利用することで、ダウンタイムや不必要な購入を回避しようとする。
この断片化された景観を仮想ストックプール(VSPool)に変換するためのハイブリッド検索拡張世代であるPhRAGを提案する。
このフレームワークは、従来のNERアプローチと比較して、生成的アプローチの可能性を示している。
- 参考スコア(独自算出の注目度): 0.8399688944263844
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Maintenance organizations in manufacturing try to avoid downtime and unnecessary purchasing by reusing existing assets, but the main obstacle is not a lack of parts but a lack of actionable visibility across sites and partners. Inventories are distributed, described with inconsistent naming conventions, and contain duplicates and partially specified references, so the right part often exists somewhere but remains effectively undiscoverable. The paper proposes PhRAG, a hybrid Retrieval-Augmented Generation for Pooling this fragmented landscape into a Virtual Stock Pool (VSPool) that can be structured and searched as a single resource. Unstructured, heterogeneous spare part descriptions are structured via Named Entity Recognition (NER) into a shared virtual pool dataset and indexed to support robust retrieval even when users express needs in natural language rather than exact technical specifications. The proposed modular pipeline leverages the multitasking nature of generative language models to cover two dimensions that make industrial parts pooling challenging: (i) unstructured technical specifications from diverse data sources (e.g. new partners, catalogs, marketplace listings) are handled through an offline extraction and (ii) request variability at runtime (references, partial references, specifications, price/condition constraints) is handled through a hybrid RAG-based search engine capable of retrieving relevant components and justifying results. The framework demonstrates the potential of generative approaches compared with traditional NER approaches in the presence of data scarcity for technical specifications extraction and overcomes the opacity of standard information retrieval systems by generating justifications for retrieved components. The project's open-source code can be found at https://github.com/roccofelici/vspool.
- Abstract(参考訳): 製造業の保守組織は、既存の資産を再利用することで、ダウンタイムや不必要な購入を回避しようとしているが、主な障害は部品の不足ではなく、サイトやパートナー間で実行可能な可視性の欠如である。
インベントリは配布され、一貫性のない命名規則で記述され、重複と部分的に指定された参照を含んでいるため、正しい部分はしばしばどこかに存在するが、効果的に発見できないままである。
本稿では,この断片化された景観を仮想ストックプール(VSPool)に分割し,単一の資源として構築・検索できるハイブリッド型検索型検索システムPhRAGを提案する。
非構造化で異質なスペア部分の記述は、名前付きエンティティ認識(NER)を介して共有仮想プールデータセットに構造化され、ユーザが正確な技術的仕様ではなく自然言語でニーズを表現している場合でも、堅牢な検索をサポートするためにインデックス付けされる。
提案されたモジュールパイプラインは、生成言語モデルのマルチタスク特性を活用して、工業部品のプールを困難にする2つの次元をカバーする。
一 多様なデータソース(例えば、新規パートナー、カタログ、市場上場等)の非構造化技術仕様をオフライン抽出により処理し、
(II)実行時の要求変動(参照、部分参照、仕様、価格/条件制約)は、RAGベースのハイブリッド検索エンジンによって処理され、関連するコンポーネントを検索し、結果を正当化することができる。
このフレームワークは、技術仕様抽出のためのデータ不足の存在下で、従来のNERアプローチと比較して、生成的アプローチの可能性を示し、取得したコンポーネントの正当性を生成することで、標準情報検索システムの不透明さを克服する。
プロジェクトのソースコードはhttps://github.com/roccofelici/vspool.comにある。
関連論文リスト
- A Unified Structured Query Understanding Framework for Industrial Semantic Search [9.913119853395205]
大規模産業検索システムにおけるクエリ理解は、通常、異なるタスク固有のコンポーネントのカスケードとして実装される。
本研究では,これらの不均一な関数を単一小言語モデルに統合する統合型クエリ理解システムを提案し,展開する。
LinkedInのジョブ検索システム内で、大規模なオフラインおよびオンラインテストを通じてこのアプローチを検証する。
論文 参考訳(メタデータ) (2026-05-22T19:35:15Z) - LLM-Enhanced Semantic Data Integration of Electronic Component Qualifications in the Aerospace Domain [4.161364556213409]
本稿では,衛星ボード設計における電子部品の資格データの統合と検索の経験について述べる。
我々は、Virtual Knowledge Graphsを使用して、検索を強化し、データのクリーニングにおける手作業を削減するパイプラインを提案する。
論文 参考訳(メタデータ) (2026-03-20T16:22:06Z) - MSRS: Evaluating Multi-Source Retrieval-Augmented Generation [51.717139132190574]
多くの現実世界のアプリケーションは、複数のソースにまたがる情報を統合して要約する能力を必要としている。
本稿では、RAGシステムに対して異なるソース間で情報を統合するための評価ベンチマークを構築するためのスケーラブルなフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-28T14:59:55Z) - Leveraging Generative Models for Real-Time Query-Driven Text Summarization in Large-Scale Web Search [54.987957691350665]
クエリ駆動テキスト要約(QDTS)は、与えられたクエリに基づいてテキスト文書から簡潔で情報的な要約を生成することを目的としている。
従来の抽出的要約モデルは、主にランク付け候補の要約セグメントに基づいており、産業応用において支配的なアプローチとなっている。
産業Web検索におけるリアルタイムQDTSに対処するための生成モデルの適用を開拓するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-28T08:51:51Z) - SaraCoder: Orchestrating Semantic and Structural Cues for Resource-Optimized Repository-Level Code Completion [34.41683042851225]
そこで本研究では,リソース最適化検索拡張手法であるSaraCoderを提案する。
限られたコンテキストウィンドウにおいて、情報の多様性と代表性を最大化する。
我々の研究は、複数の次元にわたる検索結果を体系的に洗練することは、より正確でリソース最適化されたリポジトリレベルのコード補完システムを構築するための新しいパラダイムを提供することを証明している。
論文 参考訳(メタデータ) (2025-08-13T11:56:05Z) - UniversalRAG: Retrieval-Augmented Generation over Corpora of Diverse Modalities and Granularities [53.76854299076118]
UniversalRAGは異種情報源からの知識を多様さと粒度で検索・統合するための新しいRAGフレームワークである。
本稿では,最も適切なモダリティ固有コーパスを動的に識別し,その内部でターゲット検索を行うモダリティ対応ルーティング機構を提案する。
マルチモーダル性にまたがる8つのベンチマークでUniversalRAGを検証する。
論文 参考訳(メタデータ) (2025-04-29T13:18:58Z) - Constrained Auto-Regressive Decoding Constrains Generative Retrieval [71.71161220261655]
ジェネレーティブ検索は、従来の検索インデックスデータ構造を1つの大規模ニューラルネットワークに置き換えようとしている。
本稿では,制約とビームサーチという2つの本質的な視点から,制約付き自己回帰生成の固有の制約について検討する。
論文 参考訳(メタデータ) (2025-04-14T06:54:49Z) - Oreo: A Plug-in Context Reconstructor to Enhance Retrieval-Augmented Generation [28.568010424711563]
Retrieval-Augmented Generation (RAG) は、Large Language Models (LLM) の機能強化を目的としている。
生成に使用する前に検索したチャンクを洗練するために設計された,コンパクトで効率的な,プラグ可能なモジュールを導入する。
論文 参考訳(メタデータ) (2025-02-18T16:38:39Z) - PReP: Efficient context-based shape retrieval for missing parts [1.541759183944646]
本稿では,学習手法を創造的に活用するパイプラインであるPart Retrieval Pipeline(PReP)と,トレーニングされた分類モデルを用いて,データベースからの潜在的置換部品の適合性を測定する。
低パラメータサイズと計算要求のため、数秒で数千の予備部品の倉庫をソートすることができる。
論文 参考訳(メタデータ) (2024-10-18T07:51:31Z) - STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases [93.96463520716759]
テキストと知識ベースを用いた大規模半構造検索ベンチマークSTARKを開発した。
本ベンチマークでは, 製品検索, 学術論文検索, 精密医療におけるクエリの3分野について検討した。
多様なリレーショナル情報と複雑なテキスト特性を統合した,現実的なユーザクエリを合成する,新しいパイプラインを設計する。
論文 参考訳(メタデータ) (2024-04-19T22:54:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。