論文の概要: FullRecall: A Semantic Search-Based Ranking Approach for Maximizing Recall in Patent Retrieval
- arxiv url: http://arxiv.org/abs/2507.14946v1
- Date: Sun, 20 Jul 2025 12:52:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:32.13569
- Title: FullRecall: A Semantic Search-Based Ranking Approach for Maximizing Recall in Patent Retrieval
- Title(参考訳): FullRecall: 特許検索におけるリコールの最大化のためのセマンティック検索ベースのランク付け手法
- Authors: Amna Ali, Liyanage C. De Silva, Pg Emeroylariffion Abas,
- Abstract要約: FullRecallは、関連マッチングの信頼性を維持し、リコールを最大化しながら、特許データの複雑さを効果的に管理する。
検索したサブセットにランキングスキームを適用し、100%リコールを維持しながらサイズを縮小する。
100%のリコールにより、関連する先行技術が見落とされないことが保証され、特許の事前調査と審査プロセスが強化される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Patent examiners and inventors face significant pressure to verify the originality and non-obviousness of inventions, and the intricate nature of patent data intensifies the challenges of patent retrieval. Therefore, there is a pressing need to devise cutting-edge retrieval strategies that can reliably achieve the desired recall. This study introduces FullRecall, a novel patent retrieval approach that effectively manages the complexity of patent data while maintaining the reliability of relevance matching and maximising recall. It leverages IPC-guided knowledge to generate informative phrases, which are processed to extract key information in the form of noun phrases characterising the query patent under observation. From these, the top k keyphrases are selected to construct a query for retrieving a focused subset of the dataset. This initial retrieval step achieves complete recall, successfully capturing all relevant documents. To further refine the results, a ranking scheme is applied to the retrieved subset, reducing its size while maintaining 100% recall. This multi-phase process demonstrates an effective strategy for balancing precision and recall in patent retrieval tasks. Comprehensive experiments were conducted, and the results were compared with baseline studies, namely HRR2 [1] and ReQ-ReC [2]. The proposed approach yielded superior results, achieving 100% recall in all five test cases. However, HRR2[1] recall values across the five test cases were 10%, 25%, 33.3%, 0%, and 14.29%, while ReQ-ReC [2] showed 50% for the first test case, 25% for the second test case, and 0% for the third, fourth, and fifth test cases. The 100% recall ensures that no relevant prior art is overlooked, thereby strengthening the patent pre-filing and examination processes, hence reducing potential legal risks.
- Abstract(参考訳): 特許審査官や発明家は、発明の独創性と非回避性を検証するための大きな圧力に直面し、特許データの複雑な性質は、特許検索の課題を強化する。
そのため,所望のリコールを確実に達成できる最先端の検索戦略を考案する必要がある。
本研究は,特許データの複雑さを効果的に管理し,関連性マッチングの信頼性を維持し,リコールを最大化する新たな特許検索手法であるFullRecallを紹介する。
IPC誘導の知識を活用して情報的フレーズを生成し、それを処理して、観察中のクエリ特許を特徴付ける名詞句の形式でキー情報を抽出する。
これらからトップkキーフレーズを選択して、データセットの集中したサブセットを取得するクエリを構築する。
この初期検索ステップは完全なリコールを達成し、関連するすべてのドキュメントを正常にキャプチャする。
結果をさらに洗練するために、検索したサブセットにランキングスキームを適用し、100%リコールを維持しながらそのサイズを小さくする。
この多相プロセスは、特許検索タスクにおける精度とリコールのバランスをとるための効果的な戦略を示す。
総合実験を行い, HRR2 [1] および ReQ-ReC [2] のベースライン実験と比較した。
提案手法は,5つのテストケースすべてで100%のリコールを達成し,優れた結果を得た。
しかし、HRR2[1]のリコール値は10%、25%、33.3%、0%、14.29%であり、ReQ-ReC [2]は第1のテストケースで50%、第2テストケースで25%、第3テスト、第4テスト、第5テストケースで0%であった。
100%のリコールにより、関連する先行技術が見落とされないことが保証され、特許の事前調査と審査のプロセスが強化され、潜在的な法的リスクが軽減される。
関連論文リスト
- Enhancing patent retrieval using automated patent summarization [1.067215284497015]
本稿では,特許文書の簡潔で目的特異的な要約を生成するための,最近の抽出および抽象的な要約手法の適用について述べる。
実験の結果,要約に基づくクエリにより,先行検索の有効性が著しく向上した。
論文 参考訳(メタデータ) (2025-07-22T09:14:44Z) - Towards Storage-Efficient Visual Document Retrieval: An Empirical Study on Reducing Patch-Level Embeddings [70.26204343623215]
ColPali/ColQwen2は各ページを複数のパッチレベルの埋め込みにエンコードし、過剰なメモリ使用率をもたらす。
本研究では,ページごとのパッチ埋め込みを最小性能劣化時に低減する方法について検討する。
論文 参考訳(メタデータ) (2025-06-05T13:06:01Z) - Towards Better Evaluation for Generated Patent Claims [0.0]
我々は特許請求を評価するための最初の総合的なベンチマークであるPatent-CEを紹介する。
また,特許請求に特化して設計された多次元評価手法であるPatClaimEvalを提案する。
本研究は,自動特許クレーム生成システムのより正確な評価の基礎となる。
論文 参考訳(メタデータ) (2025-05-16T10:27:16Z) - Benchmarking Reasoning Robustness in Large Language Models [76.79744000300363]
新規データや不完全データでは,性能が著しく低下することがわかった。
これらの結果は、厳密な論理的推論に対するリコールへの依存を浮き彫りにした。
本稿では,情報不足によって引き起こされる幻覚を利用して推論ギャップを明らかにする,Math-RoBと呼ばれる新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2025-03-06T15:36:06Z) - Can AI Examine Novelty of Patents?: Novelty Evaluation Based on the Correspondence between Patent Claim and Prior Art [5.655276956391884]
本稿では,特許の新規性を評価するための大規模言語モデル(LLM)の能力を評価することで,新たな課題を提起する。
本研究は,特許試験事例から得られた新規性評価に特化して設計された最初のデータセットについて述べる。
本研究は, 分類モデルが新規性を効果的に評価するのに苦慮する一方で, 生成モデルは合理的な精度で予測を行うことを示した。
論文 参考訳(メタデータ) (2025-02-10T10:09:29Z) - DeepRAG: Thinking to Retrieve Step by Step for Large Language Models [92.87532210660456]
我々はマルコフ決定過程(MDP)として検索強化推論をモデル化するDeepRAGを提案する。
クエリを反復的に分解することで、DeepRAGは外部知識を取得するか、あるいは各ステップでパラメトリック推論に依存するかを動的に決定する。
実験の結果,DeepRAGは検索効率を向上し,回答精度を26.4%向上させ,検索強化推論の有効性を示した。
論文 参考訳(メタデータ) (2025-02-03T08:22:45Z) - Patent-CR: A Dataset for Patent Claim Revision [0.0]
本稿では,特許請求書修正作業のために作成された最初のデータセットであるPatent-CRについて述べる。
これには、特許審査官によって拒絶された初期特許出願と、最終認可版の両方が含まれる。
論文 参考訳(メタデータ) (2024-12-03T16:43:42Z) - JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking [81.88787401178378]
本稿では,文書関連性を評価する際に,人間の認知過程をエミュレートする新しいエージェント・リランカであるJiceRankを紹介する。
我々は,推論集約型BRIGHTベンチマークを用いて判定Rankを評価し,第1段階の検索手法よりも性能が大幅に向上したことを示す。
さらに、JiceRankは、人気の高いBEIRベンチマークの細調整された最先端リランカと同等に動作し、ゼロショットの一般化能力を検証している。
論文 参考訳(メタデータ) (2024-10-31T18:43:12Z) - Measuring the Groundedness of Legal Question-Answering Systems [2.3179590896468327]
法的問合せのような高度な領域では、生成的AIシステムの正確性と信頼性が最重要となる。
本研究は、AI生成応答の基盤性を評価するための様々な手法のベンチマークを示し、信頼性を大幅に向上することを目的とした。
論文 参考訳(メタデータ) (2024-10-11T12:23:45Z) - ClaimCompare: A Data Pipeline for Evaluation of Novelty Destroying Patent Pairs [2.60235825984014]
我々は、IRおよびMLモデルのトレーニングに適したラベル付き特許請求データセットを生成するように設計された、新しいデータパイプラインであるCrimCompareを紹介する。
私たちの知る限りでは、ClaymCompareは、特許データセットを破壊する新規性を複数生成できる最初のパイプラインです。
論文 参考訳(メタデータ) (2024-07-16T21:38:45Z) - Query Performance Prediction using Relevance Judgments Generated by Large Language Models [53.97064615557883]
自動生成関連判定(QPP-GenRE)を用いた新しいクエリ性能予測(QPP)フレームワークを提案する。
QPP-GenREは、QPPを独立したサブタスクに分解し、ランクリスト内の各項目の関連性を所定のクエリに予測する。
我々は,オープンソースの大規模言語モデル (LLM) を用いて,科学的妥当性を確保することにより,項目の関連性を予測する。
論文 参考訳(メタデータ) (2024-04-01T09:33:05Z) - Improving Passage Retrieval with Zero-Shot Question Generation [109.11542468380331]
オープンな質問応答における経路検索を改善するための,シンプルで効果的な再ランク付け手法を提案する。
再ランカは、学習済み言語モデルを用いて、検索されたパスに条件付けられた入力質問の確率を算出するゼロショット質問生成モデルを用いて、検索されたパスを再スコアする。
論文 参考訳(メタデータ) (2022-04-15T14:51:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。