論文の概要: An automatic patent literature retrieval system based on LLM-RAG
- arxiv url: http://arxiv.org/abs/2508.14064v1
- Date: Mon, 11 Aug 2025 02:39:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.143394
- Title: An automatic patent literature retrieval system based on LLM-RAG
- Title(参考訳): LLM-RAGに基づく特許文献自動検索システム
- Authors: Yao Ding, Yuqing Wu, Ziyang Ding,
- Abstract要約: 本研究では,LLMとRetrievalAugmented Generation RAG技術を組み合わせた自動特許検索フレームワークを提案する。
システムは,1) 特許データの標準化のための事前処理モジュール,2) LLM生成埋め込みを利用した高効率ベクトル検索エンジン,3) 外部文書検索とコンテキスト対応応答生成を組み合わせたRAGenhancedクエリモジュールの3つのコンポーネントから構成される。
- 参考スコア(独自算出の注目度): 2.035980938365065
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the acceleration of technological innovation efficient retrieval and classification of patent literature have become essential for intellectual property management and enterprise RD Traditional keyword and rulebased retrieval methods often fail to address complex query intents or capture semantic associations across technical domains resulting in incomplete and lowrelevance results This study presents an automated patent retrieval framework integrating Large Language Models LLMs with RetrievalAugmented Generation RAG technology The system comprises three components: 1) a preprocessing module for patent data standardization, 2) a highefficiency vector retrieval engine leveraging LLMgenerated embeddings, and 3) a RAGenhanced query module that combines external document retrieval with contextaware response generation Evaluations were conducted on the Google Patents dataset 20062024 containing millions of global patent records with metadata such as filing date domain and status The proposed gpt35turbo0125RAG configuration achieved 805 semantic matching accuracy and 92.1% recall surpassing baseline LLM methods by 28 percentage points The framework also demonstrated strong generalization in crossdomain classification and semantic clustering tasks These results validate the effectiveness of LLMRAG integration for intelligent patent retrieval providing a foundation for nextgeneration AIdriven intellectual property analysis platforms
- Abstract(参考訳): 技術革新の加速に伴い、特許文献の効率的な検索と分類が知的財産管理や企業において不可欠になっている RD 従来のキーワードと規則に基づく検索手法は、複雑なクエリインテントに対処できない場合が多く、技術的ドメイン間のセマンティックアソシエーションが不完全で低関係な結果をもたらす場合が多い。
1)特許データの標準化のための前処理モジュール
2 LLM 生成埋め込みを利用した高効率ベクトル検索エンジン、及び
3) 外部文書検索とコンテクスト対応生成を組み合わせたRAGenhancedクエリモジュールをGoogle Patentsデータセット20062024上で実施し,出願日ドメインやステータスなどのメタデータを含む数百万のグローバル特許レコードを含む評価を行った。提案されたgpt35turbo0125RAG構成は,805のセマンティックマッチング精度と92.1%のリコールによるベースラインLCMメソッドの28パーセントのリコールを実現した。また,クロスドメイン分類とセマンティッククラスタリングタスクの強力な一般化を実証した。これらの結果は,次世代AI駆動知的財産分析プラットフォームの基礎となる,知的特許検索のためのLLMRAG統合の有効性を実証するものである。
関連論文リスト
- HySemRAG: A Hybrid Semantic Retrieval-Augmented Generation Framework for Automated Literature Synthesis and Methodological Gap Analysis [55.2480439325792]
HySemRAGは、Extract, Transform, Load (ETL)パイプラインとRetrieval-Augmented Generation (RAG)を組み合わせたフレームワークである。
システムは、マルチ層アプローチを通じて既存のRAGアーキテクチャの制限に対処する。
論文 参考訳(メタデータ) (2025-08-01T20:30:42Z) - Retrieval-Augmented Generation Systems for Intellectual Property via Synthetic Multi-Angle Fine-tuning [2.4368308736427697]
知的財産権(IP)分野の検索システムは、しばしば多様なユーザクエリに苦しむ。
マルチアングル質問生成と検索ファインチューニング法(MQG-RFM)を提案する。
MQG-RFMは、高速なクエリ生成と強い負のマイニングを組み合わせることで、コストのかかるインフラ変更を伴わずに、検索の堅牢性を高める。
論文 参考訳(メタデータ) (2025-05-31T12:19:35Z) - PatentScore: Multi-dimensional Evaluation of LLM-Generated Patent Claims [32.272839191711114]
LLM生成特許クレームを評価するための多次元評価フレームワークであるPatentScoreを紹介する。
汎用的なNLGメトリクスとは異なり、PatentScoreは特許固有の制約や文書構造を反映し、表面的類似性を超えた評価を可能にする。
我々はPearsonの相関関係を,エキスパートアノテーションを用いた$r = 0.819$で報告し,既存のNLG指標よりも優れていた。
論文 参考訳(メタデータ) (2025-05-25T22:20:11Z) - Enhancing the Patent Matching Capability of Large Language Models via the Memory Graph [22.002949442505926]
本稿では,大規模言語モデルの特許マッチング機能を強化する手法であるMemGraphを提案する。
MemGraph は LLM に特許内の関連エンティティを識別するよう促し、続いてそれらのエンティティを対応するエンティティに帰属させる。
PatentMatchデータセットの実験結果は、MemGraphの有効性を示し、ベースラインLLMよりも17.68%改善された。
論文 参考訳(メタデータ) (2025-04-21T03:56:56Z) - Enhancing Large Language Models (LLMs) for Telecommunications using Knowledge Graphs and Retrieval-Augmented Generation [52.8352968531863]
大規模言語モデル(LLM)は、汎用自然言語処理タスクにおいて大きな進歩を遂げている。
本稿では,知識グラフ(KG)と検索拡張生成(RAG)技術を組み合わせた新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-31T15:58:08Z) - A Hybrid Architecture with Efficient Fine Tuning for Abstractive Patent Document Summarization [0.0]
本研究では,特許記録の抽象要約を効率的に作成するシステムを提案する。
この手順では、LexRankグラフベースのアルゴリズムを使用して、入力された親テキストから重要な文を検索する。
論文 参考訳(メタデータ) (2025-03-13T13:30:54Z) - AutoPatent: A Multi-Agent Framework for Automatic Patent Generation [16.862811929856313]
我々はDraft2Patentと呼ばれる新しい実用的なタスクとそれに対応するD2Pベンチマークを導入し、初期ドラフトに基づいて17Kトークンを平均化する完全長の特許を生成するためにLarge Language Modelsに挑戦する。
提案するマルチエージェントフレームワークであるAutoPatentは,LPMベースのプランナーエージェント,ライターエージェント,検査エージェントをPGTreeとRRAGで組み合わせて,長文かつ複雑かつ高品質な特許文書を生成する。
論文 参考訳(メタデータ) (2024-12-13T02:27:34Z) - REAR: A Relevance-Aware Retrieval-Augmented Framework for Open-Domain Question Answering [115.72130322143275]
REAR(Relevance-Aware Retrieval-augmented approach for open-domain Question answering, QA)
我々は,特殊な設計のアセスメントモジュールを組み込むことで,LLMベースのRAGシステムのための新しいアーキテクチャを開発する。
オープンドメインの4つのQAタスクの実験では、REARは以前の競争力のあるRAGアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-02-27T13:22:51Z) - Synergistic Interplay between Search and Large Language Models for
Information Retrieval [141.18083677333848]
InteRにより、RMはLLM生成した知識コレクションを使用してクエリの知識を拡張することができる。
InteRは、最先端手法と比較して総合的に優れたゼロショット検索性能を実現する。
論文 参考訳(メタデータ) (2023-05-12T11:58:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。