論文の概要: Efficient Patent Searching Using Graph Transformers
- arxiv url: http://arxiv.org/abs/2508.10496v1
- Date: Thu, 14 Aug 2025 09:53:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.265836
- Title: Efficient Patent Searching Using Graph Transformers
- Title(参考訳): グラフ変換器を用いた効率的な特許検索
- Authors: Krzysztof Daniell, Igor Buzhinsky, Sebastian Björkqvist,
- Abstract要約: 新しい特許出願を提出するか、または既存の特許を無効にするかを決める際には、関連する先行技術を見つけることが不可欠である。
本稿では,各発明がグラフで表現される特許検索のためのグラフトランスフォーマーに基づく高密度検索手法を提案する。
我々のモデルはこれらの発明グラフを処理し、特許庁検査官からの先行技術引用を関連信号としてトレーニングする。
- 参考スコア(独自算出の注目度): 1.024113475677323
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Finding relevant prior art is crucial when deciding whether to file a new patent application or invalidate an existing patent. However, searching for prior art is challenging due to the large number of patent documents and the need for nuanced comparisons to determine novelty. An accurate search engine is therefore invaluable for speeding up the process. We present a Graph Transformer-based dense retrieval method for patent searching where each invention is represented by a graph describing its features and their relationships. Our model processes these invention graphs and is trained using prior art citations from patent office examiners as relevance signals. Using graphs as input significantly improves the computational efficiency of processing long documents, while leveraging examiner citations allows the model to learn domain-specific similarities beyond simple text-based matching. The result is a search engine that emulates how professional patent examiners identify relevant documents. We compare our approach against publicly available text embedding models and show substantial improvements in both prior art retrieval quality and computational efficiency.
- Abstract(参考訳): 新しい特許出願を提出するか、または既存の特許を無効にするかを決める際には、関連する先行技術を見つけることが不可欠である。
しかし,特許資料の多さや,新規性を決定するための曖昧な比較の必要性から,先行技術検索は困難である。
したがって、正確な検索エンジンはプロセスのスピードアップに役立ちます。
本稿では,特許検索のためのグラフトランスフォーマーを用いた高密度検索手法を提案する。
我々のモデルはこれらの発明グラフを処理し、特許庁検査官からの先行技術引用を関連信号としてトレーニングする。
グラフを入力として使用すると、長い文書の処理の計算効率が大幅に向上し、検査者による引用を利用することで、単純なテキストベースのマッチング以上のドメイン固有の類似性を学ぶことができる。
その結果、プロの特許審査官が関連文書をどう識別するかをエミュレートする検索エンジンが誕生した。
我々は,公開テキスト埋め込みモデルに対するアプローチを比較し,先行技術検索の品質と計算効率の両面で大幅に向上したことを示す。
関連論文リスト
- Enhancing patent retrieval using automated patent summarization [1.067215284497015]
本稿では,特許文書の簡潔で目的特異的な要約を生成するための,最近の抽出および抽象的な要約手法の適用について述べる。
実験の結果,要約に基づくクエリにより,先行検索の有効性が著しく向上した。
論文 参考訳(メタデータ) (2025-07-22T09:14:44Z) - In-Context Watermarks for Large Language Models [71.29952527565749]
In-Context Watermarking (ICW)は、インシデントエンジニアリングのみで生成されたテキストに透かしを埋め込む。
粒度の異なる4つのICW戦略について検討した。
本実験は,モデルに依存しない実用的な透かし手法としてのICWの実現可能性を検証するものである。
論文 参考訳(メタデータ) (2025-05-22T17:24:51Z) - A Hybrid Architecture with Efficient Fine Tuning for Abstractive Patent Document Summarization [0.0]
本研究では,特許記録の抽象要約を効率的に作成するシステムを提案する。
この手順では、LexRankグラフベースのアルゴリズムを使用して、入力された親テキストから重要な文を検索する。
論文 参考訳(メタデータ) (2025-03-13T13:30:54Z) - PatentEdits: Framing Patent Novelty as Textual Entailment [62.8514393375952]
このデータセットには105万例の修正が成功している。
我々は、文章を文単位でラベル付けするアルゴリズムを設計し、これらの編集がいかに大きな言語モデルで予測できるかを確立する。
引用引用文と起草文の文的含意を評価することは,どの発明的主張が変化しないか,あるいは先行技術に関して新規かを予測するのに特に有効であることを示す。
論文 参考訳(メタデータ) (2024-11-20T17:23:40Z) - PaECTER: Patent-level Representation Learning using Citation-informed
Transformers [0.16785092703248325]
PaECTERは、特許に特有のオープンソースドキュメントレベルのエンコーダである。
我々は,特許文書の数値表現を生成するために,受験者による引用情報付き特許用BERTを微調整する。
PaECTERは、特許ドメインで使用されている現在の最先端モデルよりも類似性タスクが優れている。
論文 参考訳(メタデータ) (2024-02-29T18:09:03Z) - A Survey on Sentence Embedding Models Performance for Patent Analysis [0.0]
本稿では,PatentSBERTaアプローチに基づく埋め込みモデルの精度を評価するための標準ライブラリとデータセットを提案する。
patentSBERTa, Bert-for-patents, and TF-IDF Weighted Word Embeddings is the most accuracy for computing sentence embeddeds at the subclass level。
論文 参考訳(メタデータ) (2022-04-28T12:04:42Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Patent Sentiment Analysis to Highlight Patent Paragraphs [0.0]
特許文書が与えられた場合、異なるセマンティックアノテーションを識別することは興味深い研究の側面である。
手動の特許分析の過程で、より読みやすくするために、段落をマークして意味情報を認識することが実際である。
この作業は、セマンティック情報を自動的に強調する特許実践者を支援し、機械学習の適性を利用して持続的で効率的な特許分析を作成するのに役立つ。
論文 参考訳(メタデータ) (2021-11-06T13:28:29Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - SmartPatch: Improving Handwritten Word Imitation with Patch
Discriminators [67.54204685189255]
本稿では,現在の最先端手法の性能を向上させる新手法であるSmartPatchを提案する。
我々は、よく知られたパッチ損失と、平行訓練された手書きテキスト認識システムから収集された情報を組み合わせる。
これにより、より強化された局所識別器が実現し、より現実的で高品質な手書き文字が生成される。
論文 参考訳(メタデータ) (2021-05-21T18:34:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。