論文の概要: Creating a silver standard for patent simplification
- arxiv url: http://arxiv.org/abs/2310.15689v1
- Date: Tue, 24 Oct 2023 10:00:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 19:19:40.358319
- Title: Creating a silver standard for patent simplification
- Title(参考訳): 特許簡素化のための銀標準の作成
- Authors: Silvia Casola, Alberto Lavelli, Horacio Saggion
- Abstract要約: 特許は、発明を一方的に保護し、他方で技術知識を流通させることを目的とした法的文書である。
彼らのスタイル(法的、技術的、非常に曖昧な言語)は、人間や機械へのアクセスを困難にしている。
本稿では,リフレージングにより特許文書を自動的に単純化する手法を提案する。
- 参考スコア(独自算出の注目度): 11.083371480030195
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Patents are legal documents that aim at protecting inventions on the one hand
and at making technical knowledge circulate on the other. Their complex style
-- a mix of legal, technical, and extremely vague language -- makes their
content hard to access for humans and machines and poses substantial challenges
to the information retrieval community. This paper proposes an approach to
automatically simplify patent text through rephrasing. Since no in-domain
parallel simplification data exist, we propose a method to automatically
generate a large-scale silver standard for patent sentences. To obtain
candidates, we use a general-domain paraphrasing system; however, the process
is error-prone and difficult to control. Thus, we pair it with proper filters
and construct a cleaner corpus that can successfully be used to train a
simplification system. Human evaluation of the synthetic silver corpus shows
that it is considered grammatical, adequate, and contains simple sentences.
- Abstract(参考訳): 特許は、発明を一方的に保護し、他方で技術知識を流通させることを目的とした法的文書である。
彼らの複雑なスタイル ― 法的、技術的、極めてあいまいな言語 ― は、コンテンツが人間や機械へのアクセスを困難にし、情報検索コミュニティに重大な課題をもたらす。
本稿では,リプレースにより特許文書を自動的に簡易化する手法を提案する。
ドメイン内並列化データがないため,特許文の大規模銀標準を自動的に生成する手法を提案する。
候補を得るには一般ドメインパラフレーズシステムを用いるが,このプロセスはエラーを起こしやすく,制御が困難である。
そこで,本研究では,適切なフィルタとペアリングし,簡易化システムの訓練に有効なクリーンコーパスを構築する。
合成銀コーパスの人間による評価は, 文法的, 適切であり, 簡単な文を含むことを示している。
関連論文リスト
- Artificial Intelligence Exploring the Patent Field [0.0]
高度な言語処理と機械学習技術は、特許と技術知識管理の分野で大幅な効率向上を約束する。
本稿では,特許関連課題と一般的な方法論の体系的概要について述べる。
本稿では,特許と特許関連データの基本的側面を紹介する。
論文 参考訳(メタデータ) (2024-03-06T23:17:16Z) - ARTIST: ARTificial Intelligence for Simplified Text [5.095775294664102]
テキスト単純化は、テキストの言語的複雑さを減らすことを目的とした、自然言語処理の重要なタスクである。
生成人工知能(AI)の最近の進歩により、語彙レベルと構文レベルの両方で自動テキストの簡略化が可能になった。
論文 参考訳(メタデータ) (2023-08-25T16:06:06Z) - A New Dataset and Empirical Study for Sentence Simplification in Chinese [50.0624778757462]
本稿では,中国語で文の単純化を評価するための新しいデータセットであるCSSを紹介する。
我々は、人間のアノテーションから手作業による単純化を収集し、英語と中国語の文の簡易化の違いを示すデータ解析を行う。
最後に,CSS上で評価することで,大言語モデルが高品質な中国語文の簡易化システムとして機能するかどうかを考察する。
論文 参考訳(メタデータ) (2023-06-07T06:47:34Z) - Elaborative Simplification as Implicit Questions Under Discussion [51.17933943734872]
本稿では,QUD フレームワークのレンズによる共同作業の簡略化について考察する。
本研究は,QUDを明示的にモデル化することで,作業の単純化と,作業内容と作業内容の関連性について,重要な理解が得られていることを示す。
論文 参考訳(メタデータ) (2023-05-17T17:26:16Z) - A Novel Patent Similarity Measurement Methodology: Semantic Distance and
Technological Distance [0.0]
特許類似性分析は、特許侵害のリスクを評価する上で重要な役割を果たす。
自然言語処理技術の最近の進歩は、このプロセスを自動化するための有望な道を提供する。
本稿では,特許間の類似性を考慮し,特許の意味的類似性を考慮し,特許間の類似度を測定するハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2023-03-23T07:55:31Z) - Multi label classification of Artificial Intelligence related patents
using Modified D2SBERT and Sentence Attention mechanism [0.0]
本稿では,自然言語処理技術とディープラーニング手法を用いて,USPTOが発行する人工知能関連特許を分類する手法を提案する。
実験結果は,他の深層学習法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2023-03-03T12:27:24Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Tracing Text Provenance via Context-Aware Lexical Substitution [81.49359106648735]
文脈を考慮した語彙置換に基づく自然言語透かし方式を提案する。
主観的および主観的尺度の両面において,我々の透かし方式は原文の意味的整合性を十分に維持することができる。
論文 参考訳(メタデータ) (2021-12-15T04:27:33Z) - SmartPatch: Improving Handwritten Word Imitation with Patch
Discriminators [67.54204685189255]
本稿では,現在の最先端手法の性能を向上させる新手法であるSmartPatchを提案する。
我々は、よく知られたパッチ損失と、平行訓練された手書きテキスト認識システムから収集された情報を組み合わせる。
これにより、より強化された局所識別器が実現し、より現実的で高品質な手書き文字が生成される。
論文 参考訳(メタデータ) (2021-05-21T18:34:21Z) - Controllable Text Simplification with Explicit Paraphrasing [88.02804405275785]
テキストの単純化は、語彙パラフレーズ、削除、分割など、いくつかの書き換え変換を通じて文の可読性を向上させる。
現在の単純化システムは、主にシーケンス・ツー・シーケンスのモデルであり、これらすべての操作を同時に実行するためにエンドツーエンドで訓練されている。
そこで我々は,言語的に動機づけられた規則を用いて分割と削除を行い,それらをニューラルパラフレーズモデルと組み合わせて様々な書き直しスタイルを創出するハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2020-10-21T13:44:40Z) - Identification, Tracking and Impact: Understanding the trade secret of
catchphrases [8.343482692350094]
我々は,米国特許商標庁が付与した特許の要約から,キャッチフレーズを抽出するための教師なしの方法を提案する。
提案システムは,最先端技術に対する精度とリコールの両面で,大幅な改善を実現している。
論文 参考訳(メタデータ) (2020-07-20T06:11:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。