論文の概要: Creating a silver standard for patent simplification
- arxiv url: http://arxiv.org/abs/2310.15689v1
- Date: Tue, 24 Oct 2023 10:00:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 19:19:40.358319
- Title: Creating a silver standard for patent simplification
- Title(参考訳): 特許簡素化のための銀標準の作成
- Authors: Silvia Casola, Alberto Lavelli, Horacio Saggion
- Abstract要約: 特許は、発明を一方的に保護し、他方で技術知識を流通させることを目的とした法的文書である。
彼らのスタイル(法的、技術的、非常に曖昧な言語)は、人間や機械へのアクセスを困難にしている。
本稿では,リフレージングにより特許文書を自動的に単純化する手法を提案する。
- 参考スコア(独自算出の注目度): 11.083371480030195
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Patents are legal documents that aim at protecting inventions on the one hand
and at making technical knowledge circulate on the other. Their complex style
-- a mix of legal, technical, and extremely vague language -- makes their
content hard to access for humans and machines and poses substantial challenges
to the information retrieval community. This paper proposes an approach to
automatically simplify patent text through rephrasing. Since no in-domain
parallel simplification data exist, we propose a method to automatically
generate a large-scale silver standard for patent sentences. To obtain
candidates, we use a general-domain paraphrasing system; however, the process
is error-prone and difficult to control. Thus, we pair it with proper filters
and construct a cleaner corpus that can successfully be used to train a
simplification system. Human evaluation of the synthetic silver corpus shows
that it is considered grammatical, adequate, and contains simple sentences.
- Abstract(参考訳): 特許は、発明を一方的に保護し、他方で技術知識を流通させることを目的とした法的文書である。
彼らの複雑なスタイル ― 法的、技術的、極めてあいまいな言語 ― は、コンテンツが人間や機械へのアクセスを困難にし、情報検索コミュニティに重大な課題をもたらす。
本稿では,リプレースにより特許文書を自動的に簡易化する手法を提案する。
ドメイン内並列化データがないため,特許文の大規模銀標準を自動的に生成する手法を提案する。
候補を得るには一般ドメインパラフレーズシステムを用いるが,このプロセスはエラーを起こしやすく,制御が困難である。
そこで,本研究では,適切なフィルタとペアリングし,簡易化システムの訓練に有効なクリーンコーパスを構築する。
合成銀コーパスの人間による評価は, 文法的, 適切であり, 簡単な文を含むことを示している。
関連論文リスト
- PatentEdits: Framing Patent Novelty as Textual Entailment [62.8514393375952]
このデータセットには105万例の修正が成功している。
我々は、文章を文単位でラベル付けするアルゴリズムを設計し、これらの編集がいかに大きな言語モデルで予測できるかを確立する。
引用引用文と起草文の文的含意を評価することは,どの発明的主張が変化しないか,あるいは先行技術に関して新規かを予測するのに特に有効であることを示す。
論文 参考訳(メタデータ) (2024-11-20T17:23:40Z) - Connecting the Dots: Inferring Patent Phrase Similarity with Retrieved Phrase Graphs [18.86788223751979]
本稿では,2つの特許句間の意味的類似度を測定する特許フレーズ類似性推論タスクについて検討する。
本稿では,特許用語のグローバルな文脈情報を増幅するためのグラフ拡張手法を提案する。
論文 参考訳(メタデータ) (2024-03-24T18:59:38Z) - LLM-based Extraction of Contradictions from Patents [0.0]
本稿では,Prompt Engineeringに基づく特許文書からTRIZの矛盾を抽出する手法を提案する。
以上の結果から,GPT-4 は既存のアプローチの真に代替するものであることが示唆された。
論文 参考訳(メタデータ) (2024-03-21T09:36:36Z) - Elaborative Simplification as Implicit Questions Under Discussion [51.17933943734872]
本稿では,QUD フレームワークのレンズによる共同作業の簡略化について考察する。
本研究は,QUDを明示的にモデル化することで,作業の単純化と,作業内容と作業内容の関連性について,重要な理解が得られていることを示す。
論文 参考訳(メタデータ) (2023-05-17T17:26:16Z) - A Novel Patent Similarity Measurement Methodology: Semantic Distance and
Technological Distance [0.0]
特許類似性分析は、特許侵害のリスクを評価する上で重要な役割を果たす。
自然言語処理技術の最近の進歩は、このプロセスを自動化するための有望な道を提供する。
本稿では,特許間の類似性を考慮し,特許の意味的類似性を考慮し,特許間の類似度を測定するハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2023-03-23T07:55:31Z) - Multi label classification of Artificial Intelligence related patents
using Modified D2SBERT and Sentence Attention mechanism [0.0]
本稿では,自然言語処理技術とディープラーニング手法を用いて,USPTOが発行する人工知能関連特許を分類する手法を提案する。
実験結果は,他の深層学習法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2023-03-03T12:27:24Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Tracing Text Provenance via Context-Aware Lexical Substitution [81.49359106648735]
文脈を考慮した語彙置換に基づく自然言語透かし方式を提案する。
主観的および主観的尺度の両面において,我々の透かし方式は原文の意味的整合性を十分に維持することができる。
論文 参考訳(メタデータ) (2021-12-15T04:27:33Z) - SmartPatch: Improving Handwritten Word Imitation with Patch
Discriminators [67.54204685189255]
本稿では,現在の最先端手法の性能を向上させる新手法であるSmartPatchを提案する。
我々は、よく知られたパッチ損失と、平行訓練された手書きテキスト認識システムから収集された情報を組み合わせる。
これにより、より強化された局所識別器が実現し、より現実的で高品質な手書き文字が生成される。
論文 参考訳(メタデータ) (2021-05-21T18:34:21Z) - Controllable Text Simplification with Explicit Paraphrasing [88.02804405275785]
テキストの単純化は、語彙パラフレーズ、削除、分割など、いくつかの書き換え変換を通じて文の可読性を向上させる。
現在の単純化システムは、主にシーケンス・ツー・シーケンスのモデルであり、これらすべての操作を同時に実行するためにエンドツーエンドで訓練されている。
そこで我々は,言語的に動機づけられた規則を用いて分割と削除を行い,それらをニューラルパラフレーズモデルと組み合わせて様々な書き直しスタイルを創出するハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2020-10-21T13:44:40Z) - Identification, Tracking and Impact: Understanding the trade secret of
catchphrases [8.343482692350094]
我々は,米国特許商標庁が付与した特許の要約から,キャッチフレーズを抽出するための教師なしの方法を提案する。
提案システムは,最先端技術に対する精度とリコールの両面で,大幅な改善を実現している。
論文 参考訳(メタデータ) (2020-07-20T06:11:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。