論文の概要: Clustering-based Automatic Construction of Legal Entity Knowledge Base
from Contracts
- arxiv url: http://arxiv.org/abs/2012.01942v2
- Date: Mon, 7 Dec 2020 09:49:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 03:19:03.968792
- Title: Clustering-based Automatic Construction of Legal Entity Knowledge Base
from Contracts
- Title(参考訳): クラスタリングに基づく契約からの法的実体知識ベースの自動構築
- Authors: Fuqi Song and \'Eric de la Clergerie
- Abstract要約: 本稿では,契約書から法的エンティティの信頼性の高い知識ベースを自動的に生成するクラスタリングに基づく手法を提案する。
提案手法は,OCR や NER などの前処理によって生じる様々な種類のエラーに対して頑健である。
収集した地中構造データと比較して,本手法は84%の知識を記憶することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In contract analysis and contract automation, a knowledge base (KB) of legal
entities is fundamental for performing tasks such as contract verification,
contract generation and contract analytic. However, such a KB does not always
exist nor can be produced in a short time. In this paper, we propose a
clustering-based approach to automatically generate a reliable knowledge base
of legal entities from given contracts without any supplemental references. The
proposed method is robust to different types of errors brought by
pre-processing such as Optical Character Recognition (OCR) and Named Entity
Recognition (NER), as well as editing errors such as typos. We evaluate our
method on a dataset that consists of 800 real contracts with various qualities
from 15 clients. Compared to the collected ground-truth data, our method is
able to recall 84\% of the knowledge.
- Abstract(参考訳): 契約分析と契約自動化では、契約検証、契約生成、契約分析などのタスクを実行するための法的実体の知識ベース(kb)が基本である。
しかし、このようなKBは必ずしも存在せず、短期間で生産されることもある。
本稿では,所定の契約から法的実体の信頼できる知識ベースを,補足的な参照なしに自動生成するクラスタリングに基づくアプローチを提案する。
提案手法は,オプティカル文字認識 (OCR) や名前付きエンティティ認識 (NER) などの前処理によって生じる様々なエラーに対して,タイポスなどの編集エラーに対して頑健である。
本手法は,15クライアントの様々な品質を持つ800実契約からなるデータセット上で評価する。
収集された地中データと比較すると,本手法は知識の84\%を思い出すことができる。
関連論文リスト
- Localizing Factual Inconsistencies in Attributable Text Generation [91.981439746404]
本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。
まず,人間のアノテーションに対するQASemConsistency法の有効性を示す。
そこで我々は,局所的な事実の不整合を自動的に検出するいくつかの手法を実装した。
論文 参考訳(メタデータ) (2024-10-09T22:53:48Z) - Con-ReCall: Detecting Pre-training Data in LLMs via Contrastive Decoding [118.75567341513897]
既存のメソッドは通常、ターゲットテキストを分離して分析するか、非メンバーコンテキストでのみ分析する。
Con-ReCallは、メンバと非メンバのコンテキストによって誘導される非対称な分布シフトを利用する新しいアプローチである。
論文 参考訳(メタデータ) (2024-09-05T09:10:38Z) - Federated Face Forgery Detection Learning with Personalized Representation [63.90408023506508]
ディープジェネレータ技術は、区別がつかない高品質のフェイクビデオを制作し、深刻な社会的脅威をもたらす可能性がある。
従来の偽造検出手法は、データを直接集中的に訓練する。
本稿では,個人化表現を用いた新しいフェデレーション顔偽造検出学習を提案する。
論文 参考訳(メタデータ) (2024-06-17T02:20:30Z) - SparseCL: Sparse Contrastive Learning for Contradiction Retrieval [87.02936971689817]
コントラディション検索(Contradiction Search)とは、クエリの内容に明示的に異を唱える文書を識別し、抽出することである。
類似性探索やクロスエンコーダモデルといった既存の手法には、大きな制限がある。
文間の微妙で矛盾したニュアンスを保存するために特別に訓練された文埋め込みを利用するSparseCLを導入する。
論文 参考訳(メタデータ) (2024-06-15T21:57:03Z) - Improving Smart Contract Security with Contrastive Learning-based Vulnerability Detection [8.121484960948303]
スマートコントラクト脆弱性に対するコントラスト学習強化型自動認識手法であるClearを提案する。
特にClearは、契約間のきめ細かい相関情報をキャプチャするために、対照的な学習(CL)モデルを採用している。
その結果,既存のディープラーニング手法よりも9.73%-39.99%高いF1スコアが得られることがわかった。
論文 参考訳(メタデータ) (2024-04-27T09:13:25Z) - A knowledge representation approach for construction contract knowledge
modeling [1.870031206586792]
大規模言語モデル(LLM)の出現は、建設契約管理を自動化する前例のない機会である。
LLMは、ドメインの専門知識が欠如しているため、説得力のあるが不正確で誤解を招くコンテンツを生み出す可能性がある。
本稿では,ネスト構造を用いた契約知識の複雑さを捉える知識表現手法であるNested Contract Knowledge Graph (NCKG)を紹介する。
論文 参考訳(メタデータ) (2023-09-21T14:53:36Z) - On the problem of entity matching and its application in automated
settlement of receivables [47.187609203210705]
提案手法では,アルゴリズムを事前評価に使用する設定について検討する。
基本アルゴリズムのマッチング品質を向上させるために,いくつかの新しい手法を適用した。
論文 参考訳(メタデータ) (2022-05-21T21:16:21Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - Classification of Contract-Amendment Relationships [0.0]
機械学習(ML)と自然言語処理(NLP)に基づく2つの文書間の修正関係を検出する手法を提案する。
このアルゴリズムは OCR (Optical Character Recognition) と NER (Named Entity Recognition) によって事前処理された2つのPDF文書を入力とし、各文書ペアの特徴を構築する。
論文 参考訳(メタデータ) (2021-06-08T07:57:10Z) - Learning to Check Contract Inconsistencies [26.4596456440168]
多くのシナリオにおいて、契約書は予めコンパイルされた形式で空白を埋めて書かれる。
不注意のため、同じ(または異なる)コンテンツで満たすべき2つの空白は、誤って異なる(または同じ)コンテンツで満たされる可能性がある。
本研究では,新たなCIC(Contract Inconsistency Checking)問題を策定し,Pair-wise Blank Resolution (PBR) と呼ばれるエンドツーエンドのフレームワークを設計する。
我々のPBRモデルは、意味のない空白をモデリングする難題に対処する新しいBlankCoderを含んでいる。
論文 参考訳(メタデータ) (2020-12-15T08:43:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。