論文の概要: Clustering-based Automatic Construction of Legal Entity Knowledge Base
from Contracts
- arxiv url: http://arxiv.org/abs/2012.01942v2
- Date: Mon, 7 Dec 2020 09:49:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 03:19:03.968792
- Title: Clustering-based Automatic Construction of Legal Entity Knowledge Base
from Contracts
- Title(参考訳): クラスタリングに基づく契約からの法的実体知識ベースの自動構築
- Authors: Fuqi Song and \'Eric de la Clergerie
- Abstract要約: 本稿では,契約書から法的エンティティの信頼性の高い知識ベースを自動的に生成するクラスタリングに基づく手法を提案する。
提案手法は,OCR や NER などの前処理によって生じる様々な種類のエラーに対して頑健である。
収集した地中構造データと比較して,本手法は84%の知識を記憶することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In contract analysis and contract automation, a knowledge base (KB) of legal
entities is fundamental for performing tasks such as contract verification,
contract generation and contract analytic. However, such a KB does not always
exist nor can be produced in a short time. In this paper, we propose a
clustering-based approach to automatically generate a reliable knowledge base
of legal entities from given contracts without any supplemental references. The
proposed method is robust to different types of errors brought by
pre-processing such as Optical Character Recognition (OCR) and Named Entity
Recognition (NER), as well as editing errors such as typos. We evaluate our
method on a dataset that consists of 800 real contracts with various qualities
from 15 clients. Compared to the collected ground-truth data, our method is
able to recall 84\% of the knowledge.
- Abstract(参考訳): 契約分析と契約自動化では、契約検証、契約生成、契約分析などのタスクを実行するための法的実体の知識ベース(kb)が基本である。
しかし、このようなKBは必ずしも存在せず、短期間で生産されることもある。
本稿では,所定の契約から法的実体の信頼できる知識ベースを,補足的な参照なしに自動生成するクラスタリングに基づくアプローチを提案する。
提案手法は,オプティカル文字認識 (OCR) や名前付きエンティティ認識 (NER) などの前処理によって生じる様々なエラーに対して,タイポスなどの編集エラーに対して頑健である。
本手法は,15クライアントの様々な品質を持つ800実契約からなるデータセット上で評価する。
収集された地中データと比較すると,本手法は知識の84\%を思い出すことができる。
関連論文リスト
- Object-Centric Conformance Alignments with Synchronization (Extended
Version) [63.105872371236636]
対象中心のペトリネットが一対多の関係を捉える能力と,その同一性に基づいたオブジェクトの比較と同期を行う識別子を持つペトリネットの能力を組み合わせた,新たな形式主義を提案する。
我々は、満足度変調理論(SMT)の符号化に基づく、そのようなネットに対する適合性チェック手法を提案する。
論文 参考訳(メタデータ) (2023-12-13T21:53:32Z) - A knowledge representation approach for construction contract knowledge
modeling [1.870031206586792]
大規模言語モデル(LLM)の出現は、建設契約管理を自動化する前例のない機会である。
LLMは、ドメインの専門知識が欠如しているため、説得力のあるが不正確で誤解を招くコンテンツを生み出す可能性がある。
本稿では,ネスト構造を用いた契約知識の複雑さを捉える知識表現手法であるNested Contract Knowledge Graph (NCKG)を紹介する。
論文 参考訳(メタデータ) (2023-09-21T14:53:36Z) - Client-specific Property Inference against Secure Aggregation in
Federated Learning [52.8564467292226]
フェデレートラーニングは、さまざまな参加者の間で共通のモデルを協調的に訓練するための、広く使われているパラダイムとなっている。
多くの攻撃は、メンバーシップ、資産、または参加者データの完全な再構築のような機密情報を推測することは依然として可能であることを示した。
単純な線形モデルでは、集約されたモデル更新からクライアント固有のプロパティを効果的にキャプチャできることが示される。
論文 参考訳(メタデータ) (2023-03-07T14:11:01Z) - DecAF: Joint Decoding of Answers and Logical Forms for Question
Answering over Knowledge Bases [81.19499764899359]
本稿では,論理形式と直解の両方を共同で生成する新しいフレームワークDecAFを提案する。
DecAFはWebQSP、FreebaseQA、GrailQAベンチマークで新しい最先端の精度を実現している。
論文 参考訳(メタデータ) (2022-09-30T19:51:52Z) - Evaluating Machine Unlearning via Epistemic Uncertainty [78.27542864367821]
本研究では,不確実性に基づく機械学習アルゴリズムの評価を行う。
これは私たちの最良の知識の一般的な評価の最初の定義です。
論文 参考訳(メタデータ) (2022-08-23T09:37:31Z) - On the problem of entity matching and its application in automated
settlement of receivables [47.187609203210705]
提案手法では,アルゴリズムを事前評価に使用する設定について検討する。
基本アルゴリズムのマッチング品質を向上させるために,いくつかの新しい手法を適用した。
論文 参考訳(メタデータ) (2022-05-21T21:16:21Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - Classification of Contract-Amendment Relationships [0.0]
機械学習(ML)と自然言語処理(NLP)に基づく2つの文書間の修正関係を検出する手法を提案する。
このアルゴリズムは OCR (Optical Character Recognition) と NER (Named Entity Recognition) によって事前処理された2つのPDF文書を入力とし、各文書ペアの特徴を構築する。
論文 参考訳(メタデータ) (2021-06-08T07:57:10Z) - Learning to Check Contract Inconsistencies [26.4596456440168]
多くのシナリオにおいて、契約書は予めコンパイルされた形式で空白を埋めて書かれる。
不注意のため、同じ(または異なる)コンテンツで満たすべき2つの空白は、誤って異なる(または同じ)コンテンツで満たされる可能性がある。
本研究では,新たなCIC(Contract Inconsistency Checking)問題を策定し,Pair-wise Blank Resolution (PBR) と呼ばれるエンドツーエンドのフレームワークを設計する。
我々のPBRモデルは、意味のない空白をモデリングする難題に対処する新しいBlankCoderを含んでいる。
論文 参考訳(メタデータ) (2020-12-15T08:43:07Z) - A Benchmark for Lease Contract Review [9.249443355045969]
契約審査において重要な役割を果たす2つの異なるタイプの要素を検出する問題に取り組む。
後者は、署名当事者の1つ以上の場合、何らかの危険または潜在的に問題のある状況があることを示す用語または文である。
我々は179のリース契約書の新しいベンチマークデータセットをリリースし、それらに含まれるエンティティと赤いフラグを手動で注釈付けしました。
論文 参考訳(メタデータ) (2020-10-20T15:50:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。