論文の概要: Connecting the Dots: Inferring Patent Phrase Similarity with Retrieved Phrase Graphs
- arxiv url: http://arxiv.org/abs/2403.16265v1
- Date: Sun, 24 Mar 2024 18:59:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 16:46:40.337072
- Title: Connecting the Dots: Inferring Patent Phrase Similarity with Retrieved Phrase Graphs
- Title(参考訳): Dotsの接続: 検索したPhraseグラフと特許Phrase類似性の推定
- Authors: Zhuoyi Peng, Yi Yang,
- Abstract要約: 本稿では,2つの特許句間の意味的類似度を測定する特許フレーズ類似性推論タスクについて検討する。
本稿では,特許用語のグローバルな文脈情報を増幅するためのグラフ拡張手法を提案する。
- 参考スコア(独自算出の注目度): 18.86788223751979
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the patent phrase similarity inference task, which measures the semantic similarity between two patent phrases. As patent documents employ legal and highly technical language, existing semantic textual similarity methods that use localized contextual information do not perform satisfactorily in inferring patent phrase similarity. To address this, we introduce a graph-augmented approach to amplify the global contextual information of the patent phrases. For each patent phrase, we construct a phrase graph that links to its focal patents and a list of patents that are either cited by or cite these focal patents. The augmented phrase embedding is then derived from combining its localized contextual embedding with its global embedding within the phrase graph. We further propose a self-supervised learning objective that capitalizes on the retrieved topology to refine both the contextualized embedding and the graph parameters in an end-to-end manner. Experimental results from a unique patent phrase similarity dataset demonstrate that our approach significantly enhances the representation of patent phrases, resulting in marked improvements in similarity inference in a self-supervised fashion. Substantial improvements are also observed in the supervised setting, underscoring the potential benefits of leveraging retrieved phrase graph augmentation.
- Abstract(参考訳): 本稿では,2つの特許句間の意味的類似度を測定する特許フレーズ類似性推論タスクについて検討する。
特許文書は法律的かつ高度に専門的な言語を用いるため、局所的な文脈情報を用いた既存の意味的テキスト類似性手法は、特許句の類似性を推測しても十分には機能しない。
これを解決するために,特許フレーズのグローバルな文脈情報を増幅するグラフ拡張手法を提案する。
それぞれの特許フレーズに対して、その焦点特許にリンクするフレーズグラフと、これらの焦点特許によって引用されるか引用される特許のリストを構築します。
次に、拡張されたフレーズ埋め込みは、その局所的なコンテキスト埋め込みと、そのグローバルなフレーズグラフへの埋め込みを組み合わせたものである。
さらに,検索したトポロジを利用して,文脈的埋め込みとグラフパラメータの両方をエンドツーエンドで洗練する自己教師型学習目標を提案する。
特許語句類似度データセットによる実験結果から,本手法は特許語句の表現を著しく向上させ,自己管理方式による類似度推論の顕著な改善をもたらすことが示された。
また、教師付きセッティングにおいても実質的な改善が観察され、検索されたフレーズグラフの増大による潜在的利益を裏付けている。
関連論文リスト
- PatentEdits: Framing Patent Novelty as Textual Entailment [62.8514393375952]
このデータセットには105万例の修正が成功している。
我々は、文章を文単位でラベル付けするアルゴリズムを設計し、これらの編集がいかに大きな言語モデルで予測できるかを確立する。
引用引用文と起草文の文的含意を評価することは,どの発明的主張が変化しないか,あるいは先行技術に関して新規かを予測するのに特に有効であることを示す。
論文 参考訳(メタデータ) (2024-11-20T17:23:40Z) - A comparative analysis of embedding models for patent similarity [0.0]
本稿では,テキストに基づく特許類似性の分野に2つの貢献をする。
これは、異なる種類の特許固有の事前訓練された埋め込みモデルの性能を比較する。
論文 参考訳(メタデータ) (2024-03-25T11:20:23Z) - PaECTER: Patent-level Representation Learning using Citation-informed
Transformers [0.16785092703248325]
PaECTERは、特許に特有のオープンソースドキュメントレベルのエンコーダである。
我々は,特許文書の数値表現を生成するために,受験者による引用情報付き特許用BERTを微調整する。
PaECTERは、特許ドメインで使用されている現在の最先端モデルよりも類似性タスクが優れている。
論文 参考訳(メタデータ) (2024-02-29T18:09:03Z) - Cobra Effect in Reference-Free Image Captioning Metrics [58.438648377314436]
視覚言語事前学習モデル(VLM)を活用した参照フリー手法の普及が出現している。
本稿では,基準自由度に欠陥があるかどうかを考察する。
GPT-4Vは生成した文を評価するための評価ツールであり,提案手法がSOTA(State-of-the-art)の性能を達成することを示す。
論文 参考訳(メタデータ) (2024-02-18T12:36:23Z) - Unveiling Black-boxes: Explainable Deep Learning Models for Patent
Classification [48.5140223214582]
深部不透明ニューラルネットワーク(DNN)を利用した多ラベル特許分類のための最先端手法
レイヤワイド関連伝搬(Layer-wise Relevance propagation, LRP)を導入し, 特許の詳細な分類手法を提案する。
関連性スコアを考慮し、予測された特許クラスに関連する単語を視覚化して説明を生成する。
論文 参考訳(メタデータ) (2023-10-31T14:11:37Z) - Adaptive Taxonomy Learning and Historical Patterns Modelling for Patent Classification [26.85734804493925]
本稿では,特許分類に関する特許に関する情報を包括的に検討する統合フレームワークを提案する。
まず,その意味表現を導出するためのICC符号相関学習モジュールを提案する。
最後に、IPC符号のセマンティクスを含む特許文書の文脈情報と、予測を行うために利用者のシーケンシャルな選好を割り当てる。
論文 参考訳(メタデータ) (2023-08-10T07:02:24Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - A Novel Patent Similarity Measurement Methodology: Semantic Distance and
Technological Distance [0.0]
特許類似性分析は、特許侵害のリスクを評価する上で重要な役割を果たす。
自然言語処理技術の最近の進歩は、このプロセスを自動化するための有望な道を提供する。
本稿では,特許間の類似性を考慮し,特許の意味的類似性を考慮し,特許間の類似度を測定するハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2023-03-23T07:55:31Z) - Keywords and Instances: A Hierarchical Contrastive Learning Framework
Unifying Hybrid Granularities for Text Generation [59.01297461453444]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。
実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2022-05-26T13:26:03Z) - PatentMiner: Patent Vacancy Mining via Context-enhanced and
Knowledge-guided Graph Attention [2.9290732102216452]
我々は、リッチなセマンティック知識をマイニングし、新たな潜在的な特許を予測するために、PatentMinerという新しい特許空白予測手法を提案する。
特許知識グラフ(例えば、年)は、特許文書から名前付きエンティティ認識と関係抽出を行うことによって構築される。
構築した知識グラフにおいてリンク予測を行うために,CNM(Common Neighbor Method),GAT(Graph Attention Networks),CGAT(Context-enhanced Graph Attention Networks)を提案する。
論文 参考訳(メタデータ) (2021-07-10T17:34:57Z) - SmartPatch: Improving Handwritten Word Imitation with Patch
Discriminators [67.54204685189255]
本稿では,現在の最先端手法の性能を向上させる新手法であるSmartPatchを提案する。
我々は、よく知られたパッチ損失と、平行訓練された手書きテキスト認識システムから収集された情報を組み合わせる。
これにより、より強化された局所識別器が実現し、より現実的で高品質な手書き文字が生成される。
論文 参考訳(メタデータ) (2021-05-21T18:34:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。