Fugu-MT 論文翻訳(概要): Clustering-based Automatic Construction of Legal Entity Knowledge Base from Contracts

論文の概要: Clustering-based Automatic Construction of Legal Entity Knowledge Base from Contracts

arxiv url: http://arxiv.org/abs/2012.01942v2
Date: Mon, 7 Dec 2020 09:49:26 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-24 03:19:03.968792
Title: Clustering-based Automatic Construction of Legal Entity Knowledge Base from Contracts
Title（参考訳）: クラスタリングに基づく契約からの法的実体知識ベースの自動構築
Authors: Fuqi Song and \'Eric de la Clergerie
Abstract要約: 本稿では,契約書から法的エンティティの信頼性の高い知識ベースを自動的に生成するクラスタリングに基づく手法を提案する。提案手法は,OCR や NER などの前処理によって生じる様々な種類のエラーに対して頑健である。収集した地中構造データと比較して,本手法は84%の知識を記憶することができる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: In contract analysis and contract automation, a knowledge base (KB) of legal entities is fundamental for performing tasks such as contract verification, contract generation and contract analytic. However, such a KB does not always exist nor can be produced in a short time. In this paper, we propose a clustering-based approach to automatically generate a reliable knowledge base of legal entities from given contracts without any supplemental references. The proposed method is robust to different types of errors brought by pre-processing such as Optical Character Recognition (OCR) and Named Entity Recognition (NER), as well as editing errors such as typos. We evaluate our method on a dataset that consists of 800 real contracts with various qualities from 15 clients. Compared to the collected ground-truth data, our method is able to recall 84\% of the knowledge.
Abstract（参考訳）: 契約分析と契約自動化では、契約検証、契約生成、契約分析などのタスクを実行するための法的実体の知識ベース(kb)が基本である。しかし、このようなKBは必ずしも存在せず、短期間で生産されることもある。本稿では,所定の契約から法的実体の信頼できる知識ベースを,補足的な参照なしに自動生成するクラスタリングに基づくアプローチを提案する。提案手法は,オプティカル文字認識 (OCR) や名前付きエンティティ認識 (NER) などの前処理によって生じる様々なエラーに対して,タイポスなどの編集エラーに対して頑健である。本手法は,15クライアントの様々な品質を持つ800実契約からなるデータセット上で評価する。収集された地中データと比較すると,本手法は知識の84\%を思い出すことができる。

関連論文リスト

$τ$-Knowledge: Evaluating Conversational Agents over Unstructured Knowledge [58.03692489021332]
$-Knowledgeは、外部の自然言語知識とツール出力の協調に依存する環境でエージェントを評価するための$-Benchの拡張である。我々は、$$-Knowledgeが、非構造的知識を人間対応デプロイメントに組み込むエージェントを開発するための、現実的なテストベッドを提供することを示した。
論文参考訳（メタデータ） (2026-03-04T18:34:47Z)
Reliable LLM-Based Edge-Cloud-Expert Cascades for Telecom Knowledge Systems [54.916243942641444]
大規模言語モデル(LLM)は、通信などの分野において、自動化の鍵となる存在として浮上している。本研究では,問合せパイプラインによる意思決定を支援する,エッジクラウドに精通したLLMベースの知識システムについて検討する。
論文参考訳（メタデータ） (2025-12-23T03:10:09Z)
That's Deprecated! Understanding, Detecting, and Steering Knowledge Conflicts in Language Models for Code Generation [55.78914774437411]
大規模言語モデル(LLM)は、パラメトリック知識とプロンプトに含まれる矛盾する情報との相違に直面して振る舞う。このような対立を構築・解釈するためのドメインに依存しないフレームワークを提案する。本研究では, アクティベーションレベルのステアリングが, ランダムベースライン上でのステアリング成功率を最大12.6%向上させることができることを示す。
論文参考訳（メタデータ） (2025-10-21T22:27:56Z)
Agent KB: Leveraging Cross-Domain Experience for Agentic Problem Solving [62.71545696485824]
我々は,異種エージェントフレームワーク間のシームレスな体験共有を可能にするユニバーサルメモリ基盤であるAgent KBを紹介した。 Agent KBはトラジェクトリを構造化知識ベースに集約し、軽量APIを提供する。我々は,GAIA,Humanity's Last Exam,GPQA,SWE-benchなどの主要フレームワークにまたがるエージェントを検証した。
論文参考訳（メタデータ） (2025-07-08T17:59:22Z)
Query-based Knowledge Transfer for Heterogeneous Learning Environments [50.45210784447839]
クエリベースの知識伝達(QKT)という新しいフレームワークを提案する。 QKTは、データ交換なしで特定のクライアントのニーズを満たすための、適切な知識獲得を可能にする。実験の結果,QKTは既存の協調学習方法よりも優れていた。
論文参考訳（メタデータ） (2025-04-12T13:09:39Z)
Enhanced Smart Contract Reputability Analysis using Multimodal Data Fusion on Ethereum [0.9831489366502298]
本稿では,コード機能とトランザクションデータを統合するデータ融合フレームワークを提案する。我々のフレームワークは、当初AIベースのコード分析に重点を置いており、クラス不均衡に対処するために、GAN拡張オペコード埋め込みを活用している。スマートコントラクトの振舞いの全体像を提供することにより、我々のアプローチは、信頼性を評価し、不正行為を特定し、異常パターンを予測するモデルの能力を高める。
論文参考訳（メタデータ） (2025-03-21T10:45:17Z)
Localizing Factual Inconsistencies in Attributable Text Generation [91.981439746404]
本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。まず,人間のアノテーションに対するQASemConsistency法の有効性を示す。そこで我々は,局所的な事実の不整合を自動的に検出するいくつかの手法を実装した。
論文参考訳（メタデータ） (2024-10-09T22:53:48Z)
Con-ReCall: Detecting Pre-training Data in LLMs via Contrastive Decoding [118.75567341513897]
既存のメソッドは通常、ターゲットテキストを分離して分析するか、非メンバーコンテキストでのみ分析する。 Con-ReCallは、メンバと非メンバのコンテキストによって誘導される非対称な分布シフトを利用する新しいアプローチである。
論文参考訳（メタデータ） (2024-09-05T09:10:38Z)
Federated Face Forgery Detection Learning with Personalized Representation [63.90408023506508]
ディープジェネレータ技術は、区別がつかない高品質のフェイクビデオを制作し、深刻な社会的脅威をもたらす可能性がある。従来の偽造検出手法は、データを直接集中的に訓練する。本稿では,個人化表現を用いた新しいフェデレーション顔偽造検出学習を提案する。
論文参考訳（メタデータ） (2024-06-17T02:20:30Z)
SparseCL: Sparse Contrastive Learning for Contradiction Retrieval [87.02936971689817]
コントラディション検索(Contradiction Search)とは、クエリの内容に明示的に異を唱える文書を識別し、抽出することである。類似性探索やクロスエンコーダモデルといった既存の手法には、大きな制限がある。文間の微妙で矛盾したニュアンスを保存するために特別に訓練された文埋め込みを利用するSparseCLを導入する。
論文参考訳（メタデータ） (2024-06-15T21:57:03Z)
Improving Smart Contract Security with Contrastive Learning-based Vulnerability Detection [8.121484960948303]
スマートコントラクト脆弱性に対するコントラスト学習強化型自動認識手法であるClearを提案する。特にClearは、契約間のきめ細かい相関情報をキャプチャするために、対照的な学習(CL)モデルを採用している。その結果,既存のディープラーニング手法よりも9.73%-39.99%高いF1スコアが得られることがわかった。
論文参考訳（メタデータ） (2024-04-27T09:13:25Z)
A knowledge representation approach for construction contract knowledge modeling [1.870031206586792]
大規模言語モデル(LLM)の出現は、建設契約管理を自動化する前例のない機会である。 LLMは、ドメインの専門知識が欠如しているため、説得力のあるが不正確で誤解を招くコンテンツを生み出す可能性がある。本稿では,ネスト構造を用いた契約知識の複雑さを捉える知識表現手法であるNested Contract Knowledge Graph (NCKG)を紹介する。
論文参考訳（メタデータ） (2023-09-21T14:53:36Z)
On the problem of entity matching and its application in automated settlement of receivables [47.187609203210705]
提案手法では,アルゴリズムを事前評価に使用する設定について検討する。基本アルゴリズムのマッチング品質を向上させるために,いくつかの新しい手法を適用した。
論文参考訳（メタデータ） (2022-05-21T21:16:21Z)
Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文参考訳（メタデータ） (2021-12-15T05:05:12Z)
Classification of Contract-Amendment Relationships [0.0]
機械学習(ML)と自然言語処理(NLP)に基づく2つの文書間の修正関係を検出する手法を提案する。このアルゴリズムは OCR (Optical Character Recognition) と NER (Named Entity Recognition) によって事前処理された2つのPDF文書を入力とし、各文書ペアの特徴を構築する。
論文参考訳（メタデータ） (2021-06-08T07:57:10Z)
Learning to Check Contract Inconsistencies [26.4596456440168]
多くのシナリオにおいて、契約書は予めコンパイルされた形式で空白を埋めて書かれる。不注意のため、同じ(または異なる)コンテンツで満たすべき2つの空白は、誤って異なる(または同じ)コンテンツで満たされる可能性がある。本研究では,新たなCIC(Contract Inconsistency Checking)問題を策定し,Pair-wise Blank Resolution (PBR) と呼ばれるエンドツーエンドのフレームワークを設計する。我々のPBRモデルは、意味のない空白をモデリングする難題に対処する新しいBlankCoderを含んでいる。
論文参考訳（メタデータ） (2020-12-15T08:43:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。