論文の概要: Enhancing patent retrieval using automated patent summarization
- arxiv url: http://arxiv.org/abs/2507.16371v1
- Date: Tue, 22 Jul 2025 09:14:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-23 21:34:14.040565
- Title: Enhancing patent retrieval using automated patent summarization
- Title(参考訳): 自動要約による特許検索の強化
- Authors: Eleni Kamateri, Renukswamy Chikkamath, Michail Salampasis, Linda Andersson, Markus Endres,
- Abstract要約: 本稿では,特許文書の簡潔で目的特異的な要約を生成するための,最近の抽出および抽象的な要約手法の適用について述べる。
実験の結果,要約に基づくクエリにより,先行検索の有効性が著しく向上した。
- 参考スコア(独自算出の注目度): 1.067215284497015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effective query formulation is a key challenge in long-document Information Retrieval (IR). This challenge is particularly acute in domain-specific contexts like patent retrieval, where documents are lengthy, linguistically complex, and encompass multiple interrelated technical topics. In this work, we present the application of recent extractive and abstractive summarization methods for generating concise, purpose-specific summaries of patent documents. We further assess the utility of these automatically generated summaries as surrogate queries across three benchmark patent datasets and compare their retrieval performance against conventional approaches that use entire patent sections. Experimental results show that summarization-based queries significantly improve prior-art retrieval effectiveness, highlighting their potential as an efficient alternative to traditional query formulation techniques.
- Abstract(参考訳): クエリの効率的な定式化は、長期文書情報検索(IR)において重要な課題である。
この課題は、文書が長く、言語的に複雑で、複数の関連技術トピックを包含する、特許検索のようなドメイン固有のコンテキストにおいて特に深刻である。
本稿では,特許文書の簡潔で目的特異的な要約を生成するための,最近の抽出および抽象的な要約手法の適用について述べる。
さらに、これらの自動生成された要約を、3つのベンチマーク特許データセットにまたがる問合せクエリとして評価し、それらの検索性能を、特許セクション全体を使用する従来の手法と比較する。
実験結果から,要約に基づくクエリは,従来のクエリの定式化手法に取って代わる効果的な代替手段として,先行技術検索の有効性を著しく向上することが示された。
関連論文リスト
- Hierarchical Multi-Positive Contrastive Learning for Patent Image Retrieval [0.2970959580204573]
特許画像は、特許のイノベーションに関する情報を伝える技術図である。
現在の方法は、ロカルノ国際分類システムで定義されたような特許の階層的関係を無視している。
検索プロセスにおいて,その関係を導き出すために,LISPの分類を利用した階層的多陽性のコントラスト損失を導入する。
論文 参考訳(メタデータ) (2025-06-16T13:53:02Z) - Towards Better Evaluation for Generated Patent Claims [0.0]
我々は特許請求を評価するための最初の総合的なベンチマークであるPatent-CEを紹介する。
また,特許請求に特化して設計された多次元評価手法であるPatClaimEvalを提案する。
本研究は,自動特許クレーム生成システムのより正確な評価の基礎となる。
論文 参考訳(メタデータ) (2025-05-16T10:27:16Z) - A Hybrid Architecture with Efficient Fine Tuning for Abstractive Patent Document Summarization [0.0]
本研究では,特許記録の抽象要約を効率的に作成するシステムを提案する。
この手順では、LexRankグラフベースのアルゴリズムを使用して、入力された親テキストから重要な文を検索する。
論文 参考訳(メタデータ) (2025-03-13T13:30:54Z) - RAPID: Efficient Retrieval-Augmented Long Text Generation with Writing Planning and Information Discovery [69.41989381702858]
直接生成やマルチエージェントの議論といった既存の手法は、幻覚、トピックの不整合、重大な遅延といった問題に悩まされることが多い。
本稿では,効率的な検索拡張長文生成フレームワークRAPIDを提案する。
私たちの仕事は、自動化された長文生成の課題に対して、堅牢で効率的なソリューションを提供します。
論文 参考訳(メタデータ) (2025-03-02T06:11:29Z) - LLM-based Extraction of Contradictions from Patents [0.0]
本稿では,Prompt Engineeringに基づく特許文書からTRIZの矛盾を抽出する手法を提案する。
以上の結果から,GPT-4 は既存のアプローチの真に代替するものであることが示唆された。
論文 参考訳(メタデータ) (2024-03-21T09:36:36Z) - Improving Retrieval in Theme-specific Applications using a Corpus
Topical Taxonomy [52.426623750562335]
ToTER (Topical Taxonomy Enhanced Retrieval) フレームワークを紹介する。
ToTERは、クエリとドキュメントの中心的なトピックを分類学のガイダンスで識別し、そのトピックの関連性を利用して、欠落したコンテキストを補う。
プラグイン・アンド・プレイのフレームワークとして、ToTERは様々なPLMベースのレトリバーを強化するために柔軟に使用できる。
論文 参考訳(メタデータ) (2024-03-07T02:34:54Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Patent Sentiment Analysis to Highlight Patent Paragraphs [0.0]
特許文書が与えられた場合、異なるセマンティックアノテーションを識別することは興味深い研究の側面である。
手動の特許分析の過程で、より読みやすくするために、段落をマークして意味情報を認識することが実際である。
この作業は、セマンティック情報を自動的に強調する特許実践者を支援し、機械学習の適性を利用して持続的で効率的な特許分析を作成するのに役立つ。
論文 参考訳(メタデータ) (2021-11-06T13:28:29Z) - iFacetSum: Coreference-based Interactive Faceted Summarization for
Multi-Document Exploration [63.272359227081836]
iFacetSumは、インタラクティブな要約と顔検索を統合している。
微粒なファセットは、クロスドキュメントのコア参照パイプラインに基づいて自動的に生成される。
論文 参考訳(メタデータ) (2021-09-23T20:01:11Z) - Text Summarization with Latent Queries [60.468323530248945]
本稿では,LaQSumについて紹介する。LaQSumは,既存の問合せ形式と抽象的な要約のための文書から遅延クエリを学習する,最初の統一テキスト要約システムである。
本システムでは, 潜伏クエリモデルと条件付き言語モデルとを協調的に最適化し, ユーザがテスト時に任意のタイプのクエリをプラグイン・アンド・プレイできるようにする。
本システムでは,クエリタイプ,文書設定,ターゲットドメインの異なる要約ベンチマークにおいて,強力な比較システムの性能を強く向上させる。
論文 参考訳(メタデータ) (2021-05-31T21:14:58Z) - Answering Complex Open-Domain Questions with Multi-Hop Dense Retrieval [117.07047313964773]
複雑なオープンドメインの質問に答えるために, 単純で効率的なマルチホップ高密度検索手法を提案する。
本手法では,文書間ハイパーリンクやアノテートされたエンティティマーカーなど,コーパス固有の情報へのアクセスは不要である。
提案システムでは,HotpotQA上でのベストパブリッシュ精度と,推論時の10倍の速度で,より優れた効率・精度のトレードオフも実現している。
論文 参考訳(メタデータ) (2020-09-27T06:12:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。