Fugu-MT 論文翻訳(概要): PaECTER: Patent-level Representation Learning using Citation-informed Transformers

論文の概要: PaECTER: Patent-level Representation Learning using Citation-informed Transformers

arxiv url: http://arxiv.org/abs/2402.19411v1
Date: Thu, 29 Feb 2024 18:09:03 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-01 13:38:08.604674
Title: PaECTER: Patent-level Representation Learning using Citation-informed Transformers
Title（参考訳）: paecter: citation-informed transformersを用いた特許レベルの表現学習
Authors: Mainak Ghosh, Sebastian Erhardt, Michael E. Rose, Erik Buunk, Dietmar Harhoff
Abstract要約: PaECTERは、特許に特有のオープンソースドキュメントレベルのエンコーダである。我々は,特許文書の数値表現を生成するために,受験者による引用情報付き特許用BERTを微調整する。 PaECTERは、特許ドメインで使用されている現在の最先端モデルよりも類似性タスクが優れている。
参考スコア（独自算出の注目度）: 0.16785092703248325
License: http://creativecommons.org/licenses/by/4.0/
Abstract: PaECTER is a publicly available, open-source document-level encoder specific for patents. We fine-tune BERT for Patents with examiner-added citation information to generate numerical representations for patent documents. PaECTER performs better in similarity tasks than current state-of-the-art models used in the patent domain. More specifically, our model outperforms the next-best patent specific pre-trained language model (BERT for Patents) on our patent citation prediction test dataset on two different rank evaluation metrics. PaECTER predicts at least one most similar patent at a rank of 1.32 on average when compared against 25 irrelevant patents. Numerical representations generated by PaECTER from patent text can be used for downstream tasks such as classification, tracing knowledge flows, or semantic similarity search. Semantic similarity search is especially relevant in the context of prior art search for both inventors and patent examiners. PaECTER is available on Hugging Face.
Abstract（参考訳）: PaECTERは、特許に特有のオープンソースドキュメントレベルのエンコーダである。我々は,特許文書の数値表現を生成するために,受験者による引用情報付き特許用BERTを微調整する。 PaECTERは、特許ドメインで使用されている現在の最先端モデルよりも類似性タスクが優れている。より具体的には、我々のモデルは、2つの異なるランク評価指標に関する特許引用予測テストデータセットにおいて、次の最良特許特定事前訓練言語モデル(BERT for Patents)より優れている。 PaECTERは、25の非関連特許と比較した場合、平均1.32のランクで少なくとも1つの類似した特許を予測する。 PaECTERが特許文書から生成した数値表現は、分類、知識フローのトレース、意味的類似性探索などの下流タスクに利用できる。意味的類似性探索は、発明家と特許審査官の両方の先行技術探索の文脈において特に関係している。 PaECTERはHugging Faceで利用できる。

関連論文リスト

PANORAMA: A Dataset and Benchmarks Capturing Decision Trails and Rationales in Patent Examination [44.74519851862391]
PANORAMAは米国特許試験記録8,143件のデータセットである。我々は,特許専門家の特許審査プロセスをエミュレートする逐次ベンチマークにパスを分解する。我々は、LLMを含むNLPを特許領域で前進させるには、現実世界の特許審査をより深く理解する必要があると論じる。
論文参考訳（メタデータ） (2025-10-25T03:24:13Z)
Efficient Patent Searching Using Graph Transformers [1.024113475677323]
新しい特許出願を提出するか、または既存の特許を無効にするかを決める際には、関連する先行技術を見つけることが不可欠である。本稿では,各発明がグラフで表現される特許検索のためのグラフトランスフォーマーに基づく高密度検索手法を提案する。我々のモデルはこれらの発明グラフを処理し、特許庁検査官からの先行技術引用を関連信号としてトレーニングする。
論文参考訳（メタデータ） (2025-08-14T09:53:26Z)
In-Context Watermarks for Large Language Models [71.29952527565749]
In-Context Watermarking (ICW)は、インシデントエンジニアリングのみで生成されたテキストに透かしを埋め込む。粒度の異なる4つのICW戦略について検討した。本実験は,モデルに依存しない実用的な透かし手法としてのICWの実現可能性を検証するものである。
論文参考訳（メタデータ） (2025-05-22T17:24:51Z)
PatentEdits: Framing Patent Novelty as Textual Entailment [62.8514393375952]
このデータセットには105万例の修正が成功している。我々は、文章を文単位でラベル付けするアルゴリズムを設計し、これらの編集がいかに大きな言語モデルで予測できるかを確立する。引用引用文と起草文の文的含意を評価することは,どの発明的主張が変化しないか,あるいは先行技術に関して新規かを予測するのに特に有効であることを示す。
論文参考訳（メタデータ） (2024-11-20T17:23:40Z)
Pap2Pat: Towards Automated Paper-to-Patent Drafting using Chunk-based Outline-guided Generation [13.242188189150987]
PAP2PATは、文書概要を含む1.8kの特許と特許のペアの新しい挑戦的なベンチマークである。現在のオープンウェイト LLM とアウトライン誘導型ジェネレーションによる実験は,特許言語の本質的な反復性のために,論文からの情報を効果的に活用できるが,繰り返しに苦慮していることを示している。
論文参考訳（メタデータ） (2024-10-09T15:52:48Z)
A comparative analysis of embedding models for patent similarity [0.0]
本稿では,テキストに基づく特許類似性の分野に2つの貢献をする。これは、異なる種類の特許固有の事前訓練された埋め込みモデルの性能を比較する。
論文参考訳（メタデータ） (2024-03-25T11:20:23Z)
Leveraging Large Language Models to Improve REST API Testing [51.284096009803406]
RESTGPTはAPI仕様を入力として、機械解釈可能なルールを抽出し、仕様内の自然言語記述からサンプルパラメータ値を生成する。評価の結果、RESTGPTはルール抽出と値生成の両方において既存の技術よりも優れています。
論文参考訳（メタデータ） (2023-12-01T19:53:23Z)
Unveiling Black-boxes: Explainable Deep Learning Models for Patent Classification [48.5140223214582]
深部不透明ニューラルネットワーク(DNN)を利用した多ラベル特許分類のための最先端手法レイヤワイド関連伝搬(Layer-wise Relevance propagation, LRP)を導入し, 特許の詳細な分類手法を提案する。関連性スコアを考慮し、予測された特許クラスに関連する単語を視覚化して説明を生成する。
論文参考訳（メタデータ） (2023-10-31T14:11:37Z)
Adaptive Taxonomy Learning and Historical Patterns Modelling for Patent Classification [26.85734804493925]
本稿では,特許分類に関する特許に関する情報を包括的に検討する統合フレームワークを提案する。まず,その意味表現を導出するためのICC符号相関学習モジュールを提案する。最後に、IPC符号のセマンティクスを含む特許文書の文脈情報と、予測を行うために利用者のシーケンシャルな選好を割り当てる。
論文参考訳（メタデータ） (2023-08-10T07:02:24Z)
Event-based Dynamic Graph Representation Learning for Patent Application Trend Prediction [45.0907126466271]
本稿では,特許出願傾向予測のためのイベントベースのグラフ学習フレームワークを提案する。特に,当社の手法は,企業および特許分類コードの両方の記憶可能な表現に基づいて構築されている。
論文参考訳（メタデータ） (2023-08-04T05:43:32Z)
A Novel Patent Similarity Measurement Methodology: Semantic Distance and Technological Distance [0.0]
特許類似性分析は、特許侵害のリスクを評価する上で重要な役割を果たす。自然言語処理技術の最近の進歩は、このプロセスを自動化するための有望な道を提供する。本稿では,特許間の類似性を考慮し,特許の意味的類似性を考慮し,特許間の類似度を測定するハイブリッド手法を提案する。
論文参考訳（メタデータ） (2023-03-23T07:55:31Z)
A Survey on Sentence Embedding Models Performance for Patent Analysis [0.0]
本稿では,PatentSBERTaアプローチに基づく埋め込みモデルの精度を評価するための標準ライブラリとデータセットを提案する。 patentSBERTa, Bert-for-patents, and TF-IDF Weighted Word Embeddings is the most accuracy for computing sentence embeddeds at the subclass level。
論文参考訳（メタデータ） (2022-04-28T12:04:42Z)
Fast and Effective Biomedical Entity Linking Using a Dual Encoder [48.86736921025866]
文書中の複数の言及を1ショットで解決するBERTベースのデュアルエンコーダモデルを提案する。本稿では,提案モデルが既存のBERTモデルよりも複数倍高速であり,バイオメディカルエンティティリンクの精度に競争力があることを示す。
論文参考訳（メタデータ） (2021-03-08T19:32:28Z)
Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文参考訳（メタデータ） (2020-12-29T23:43:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。