論文の概要: LLM-powered Real-time Patent Citation Recommendation for Financial Technologies
- arxiv url: http://arxiv.org/abs/2601.16775v1
- Date: Fri, 23 Jan 2026 14:21:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.716128
- Title: LLM-powered Real-time Patent Citation Recommendation for Financial Technologies
- Title(参考訳): LLMを利用した金融技術のためのリアルタイム特許引用
- Authors: Tianang Deng, Yu Deng, Tianchen Gao, Yonghong Hu, Rui Pan,
- Abstract要約: 本稿では,大規模かつ高速に変化する金融特許コーパスを対象としたリアルタイム特許引用推薦フレームワークを提案する。
2000年から2024年にかけて、中国国家知的財産管理局(CNIPA)が付与した428,843件の金融特許のデータセットを使用する。
インクリメンタルな更新はリコールを改善するとともに,リビルドベースのインデックス化と比較して計算コストを大幅に削減することを示した。
- 参考スコア(独自算出の注目度): 6.544698036896045
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Rapid financial innovation has been accompanied by a sharp increase in patenting activity, making timely and comprehensive prior-art discovery more difficult. This problem is especially evident in financial technologies, where innovations develop quickly, patent collections grow continuously, and citation recommendation systems must be updated as new applications arrive. Existing patent retrieval and citation recommendation methods typically rely on static indexes or periodic retraining, which limits their ability to operate effectively in such dynamic settings. In this study, we propose a real-time patent citation recommendation framework designed for large and fast-changing financial patent corpora. Using a dataset of 428,843 financial patents granted by the China National Intellectual Property Administration (CNIPA) between 2000 and 2024, we build a three-stage recommendation pipeline. The pipeline uses large language model (LLM) embeddings to represent the semantic content of patent abstracts, applies efficient approximate nearest-neighbor search to construct a manageable candidate set, and ranks candidates by semantic similarity to produce top-k citation recommendations. In addition to improving recommendation accuracy, the proposed framework directly addresses the dynamic nature of patent systems. By using an incremental indexing strategy based on hierarchical navigable small-world (HNSW) graphs, newly issued patents can be added without rebuilding the entire index. A rolling day-by-day update experiment shows that incremental updating improves recall while substantially reducing computational cost compared with rebuild-based indexing. The proposed method also consistently outperforms traditional text-based baselines and alternative nearest-neighbor retrieval approaches.
- Abstract(参考訳): 急速な金融革新は特許活動の急激な増加に伴い、タイムリーで包括的な先行技術発見を困難にしている。
この問題は、イノベーションが急速に発展し、特許コレクションが継続的に成長する金融技術において特に顕著であり、新しいアプリケーションが登場すると、引用レコメンデーションシステムが更新されなければならない。
既存の特許検索と引用レコメンデーション手法は、通常静的インデックスや定期的なリトレーニングに依存しており、このようなダイナミックな環境で効果的に動作する能力を制限する。
本研究では,大規模かつ高速に変化する金融特許コーパスを対象としたリアルタイム特許引用推薦フレームワークを提案する。
2000年から2024年にかけて、中国国家知的財産庁(CNIPA)が認可した428,843件の金融特許のデータセットを用いて、3段階の勧告パイプラインを構築した。
このパイプラインは、特許抽象化のセマンティックな内容を表すために、大きな言語モデル(LLM)埋め込みを使用し、管理可能な候補セットを構築するために、効率的な近似近傍探索を適用し、セマンティックな類似性によって候補をランク付けし、トップk引用レコメンデーションを生成する。
提案手法は,推奨精度の向上に加えて,特許システムの動的性質に直接対処する。
階層的ナビゲート可能な小世界 (HNSW) グラフに基づくインクリメンタルインデックス戦略を使用することで、インデックス全体を再構築することなく、新たに発行された特許を追加することができる。
ローリングデイ・バイ・デイの更新実験では、インクリメンタルな更新によってリコールが改善され、リビルドベースのインデックスよりも計算コストが大幅に削減された。
提案手法は、従来のテキストベースのベースラインや、近隣の検索手法よりも一貫して優れている。
関連論文リスト
- Rethinking On-policy Optimization for Query Augmentation [49.87723664806526]
本稿では,様々なベンチマークにおいて,プロンプトベースとRLベースのクエリ拡張の最初の体系的比較を示す。
そこで我々は,検索性能を最大化する擬似文書の生成を学習する,新しいハイブリッド手法 On-policy Pseudo-document Query Expansion (OPQE) を提案する。
論文 参考訳(メタデータ) (2025-10-20T04:16:28Z) - EvoPat: A Multi-LLM-based Patents Summarization and Analysis Agent [0.0]
EvoPatはマルチLLMベースの特許エージェントで、ユーザーが検索生成(RAG)と高度な検索戦略を通じて特許を分析するのを支援する。
特許要約,比較分析,技術評価などのタスクにおいて,EvoPatがGPT-4より優れていることを示す。
論文 参考訳(メタデータ) (2024-12-24T02:21:09Z) - PatentEdits: Framing Patent Novelty as Textual Entailment [62.8514393375952]
このデータセットには105万例の修正が成功している。
我々は、文章を文単位でラベル付けするアルゴリズムを設計し、これらの編集がいかに大きな言語モデルで予測できるかを確立する。
引用引用文と起草文の文的含意を評価することは,どの発明的主張が変化しないか,あるいは先行技術に関して新規かを予測するのに特に有効であることを示す。
論文 参考訳(メタデータ) (2024-11-20T17:23:40Z) - ClaimBrush: A Novel Framework for Automated Patent Claim Refinement Based on Large Language Models [3.3427063846107825]
ClaimBrushは、データセットと書き換えモデルを含む、自動パテントクレーム改善のための新しいフレームワークである。
本研究は,特許請求書書き換え事例を多数集めて,特許請求書書き換えモデルの訓練と評価のためのデータセットを構築した。
提案する書き換えモデルは,最先端の大規模言語モデルにおいて,ベースラインとゼロショット学習に優れていた。
論文 参考訳(メタデータ) (2024-10-08T00:20:54Z) - DNS-Rec: Data-aware Neural Architecture Search for Recommender Systems [79.76519917171261]
本稿では,SRS(Sequential Recommender Systems)における計算オーバーヘッドと資源非効率性について述べる。
本稿では, プルーニング法と高度なモデル設計を組み合わせた革新的な手法を提案する。
我々の主な貢献は、リコメンダシステム(DNS-Rec)のためのデータ対応ニューラルアーキテクチャ検索の開発である。
論文 参考訳(メタデータ) (2024-02-01T07:22:52Z) - Adaptive Taxonomy Learning and Historical Patterns Modelling for Patent Classification [26.85734804493925]
本稿では,特許分類に関する特許に関する情報を包括的に検討する統合フレームワークを提案する。
まず,その意味表現を導出するためのICC符号相関学習モジュールを提案する。
最後に、IPC符号のセマンティクスを含む特許文書の文脈情報と、予測を行うために利用者のシーケンシャルな選好を割り当てる。
論文 参考訳(メタデータ) (2023-08-10T07:02:24Z) - Event-based Dynamic Graph Representation Learning for Patent Application
Trend Prediction [45.0907126466271]
本稿では,特許出願傾向予測のためのイベントベースのグラフ学習フレームワークを提案する。
特に,当社の手法は,企業および特許分類コードの両方の記憶可能な表現に基づいて構築されている。
論文 参考訳(メタデータ) (2023-08-04T05:43:32Z) - Predictive Patentomics: Forecasting Innovation Success and Valuation
with ChatGPT [0.0]
OpenAIの最先端のテキスト埋め込みは、各発明の品質と影響に関する複雑な情報にアクセスする。
このニュアンスド埋め込みは、特許価値を予測するR二乗法を24%の漸進的に改善する。
論文 参考訳(メタデータ) (2023-06-22T13:21:20Z) - The Harvard USPTO Patent Dataset: A Large-Scale, Well-Structured, and
Multi-Purpose Corpus of Patent Applications [8.110699646062384]
ハーバードUSPTO特許データセット(HUPD)について紹介する。
450万件以上の特許文書があり、HUPDは同等のコーパスの2倍から3倍の大きさだ。
各アプリケーションのメタデータとすべてのテキストフィールドを提供することで、このデータセットは研究者が新しいNLPタスクセットを実行することを可能にする。
論文 参考訳(メタデータ) (2022-07-08T17:57:15Z) - Deep learning-based citation recommendation system for patents [5.376388266200792]
我々は,Google Big Queryサービスから約11万件の特許に関するテキスト情報とメタデータを含む,PatentNetという新しいデータセットを提案する。
従来の提案手法と比較して,提案手法はテストセット上での平均相反ランク0.2377を達成している。
論文 参考訳(メタデータ) (2020-10-21T12:18:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。