論文の概要: A Two-Stage Architecture for NDA Analysis: LLM-based Segmentation and Transformer-based Clause Classification
- arxiv url: http://arxiv.org/abs/2603.09990v1
- Date: Fri, 13 Feb 2026 15:55:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-15 16:38:22.533727
- Title: A Two-Stage Architecture for NDA Analysis: LLM-based Segmentation and Transformer-based Clause Classification
- Title(参考訳): NDA分析のための2段階アーキテクチャ:LLMに基づくセグメンテーションとトランスフォーマーに基づくクローズ分類
- Authors: Ana Begnini, Matheus Vicente, Leonardo Souza,
- Abstract要約: 我々は,NDA内のセグメンテーションと節分類を自動化するLLMに基づくアーキテクチャを提案する。
セグメンテーションタスクでは,ROUGE F1の0.95+/-0.0036を達成し,重み付きF1の0.85を得た。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In business-to-business relations, it is common to establish NonDisclosure Agreements (NDAs). However, these documents exhibit significant variation in format, structure, and writing style, making manual analysis slow and error-prone. We propose an architecture based on LLMs to automate the segmentation and clauses classification within these contracts. We employed two models: LLaMA-3.1-8B-Instruct for NDA segmentation (clause extraction) and a fine-tuned Legal-Roberta-Large for clause classification. In the segmentation task, we achieved a ROUGE F1 of 0.95 +/- 0.0036; for classification, we obtained a weighted F1 of 0.85, demonstrating the feasibility and precision of the approach.
- Abstract(参考訳): ビジネス・ビジネス関係においては、非開示協定(NDA)を締結することが一般的である。
しかし、これらの文書は形式、構造、書き方に大きな変化を示しており、手作業による解析が遅く、エラーが発生しやすい。
契約内のセグメンテーションと節分類を自動化するLLMに基づくアーキテクチャを提案する。
我々は2つのモデルを用いた: LLaMA-3.1-8B-Instruct for NDA segmentation (clause extract) and a fine-tuned Legal-Roberta-Large for節分類。
セグメンテーションタスクでは,ROUGE F1の0.95+/-0.0036を達成し,重み付きF1の0.85を得た。
関連論文リスト
- Large Multimodal Models as General In-Context Classifiers [73.11242790834383]
本稿では,この回答がLMMの重要な能力,すなわちコンテキスト内学習を見落としていることを論じる。
我々は、クローズドワールド分類のための多様なデータセットに関する最先端のLMMをベンチマークし、そのゼロショット性能はCLIPよりも低いが、いくつかのインコンテキスト例を持つLMMは、キャッシュベースのアダプタと対照的なVLMをマッチまたは超える可能性があることを発見した。
この分析をオープンワールド設定に拡張し,LMMの生成特性をタスクに適したものにする。
論文 参考訳(メタデータ) (2026-02-26T17:08:18Z) - Fine-Tuning Causal LLMs for Text Classification: Embedding-Based vs. Instruction-Based Approaches [0.0]
我々は、リソース制約下での下流テキスト分類のためのLLM(Large Language Models)を微調整する戦略について検討する。
1)事前訓練した因果LLMに分類ヘッドをアタッチしてタスクを微調整し,(2)分類のためのプロンプト>応答形式でLSMを指導する,という2つの手法を検討した。
論文 参考訳(メタデータ) (2025-12-14T13:02:06Z) - Beyond Isolated Dots: Benchmarking Structured Table Construction as Deep Knowledge Extraction [80.88654868264645]
Arranged and Organized extract Benchmarkは、断片化された文書を理解するための大規模言語モデルの能力を評価するために設計された。
AOEには3つの異なるドメインにまたがる11のタスクが含まれており、さまざまな入力クエリに適したコンテキスト固有のスキーマを生成するモデルが必要である。
結果は、最も先進的なモデルでさえ、かなり苦労したことを示している。
論文 参考訳(メタデータ) (2025-07-22T06:37:51Z) - SAFT: Structure-Aware Fine-Tuning of LLMs for AMR-to-Text Generation [50.277959544420455]
SAFTは、事前訓練された言語モデルにグラフトポロジーを注入する構造対応の微調整手法である。
変換されたAMRの磁気ラプラシアンから方向感応的な位置エンコーディングを計算する。
SAFTはAMR 3.0に新しい最先端を設定、ベースラインを3.5BLEU改善した。
論文 参考訳(メタデータ) (2025-07-15T18:12:57Z) - Legal Knowledge Graph Foundations, Part I: URI-Addressable Abstract Works (LRMoo F1 to schema.org) [0.0]
IFLA参照モデル(LR)に基づく法規範の時相進化のための形式的イベント中心モデルを構築した。
本稿では,セマンティックWeb上で,このモデルの基本的実体である抽象法的作業(F1)を公開する上で不可欠な第一歩について論じる。
Webネイティブの標準を形式的に読み取ることで、この作業は決定論的で信頼性の高い法的な知識グラフ(LKG)を構築するための道を開いた。
論文 参考訳(メタデータ) (2025-05-12T15:11:11Z) - Improving the Accuracy and Efficiency of Legal Document Tagging with Large Language Models and Instruction Prompts [0.6554326244334866]
Legal-LLMはLarge Language Models (LLM) の命令追従機能を利用する新しいアプローチである。
提案手法は,マイクロF1とマクロF1スコアを用いて,POSTURE50KとEURLEX57Kの2つのベンチマークデータセット上で評価する。
論文 参考訳(メタデータ) (2025-04-12T18:57:04Z) - Adaptive Pruning for Large Language Models with Structural Importance Awareness [66.2690963378878]
大規模言語モデル(LLM)は言語理解と生成能力を大幅に改善した。
LLMは、高い計算およびストレージリソース要求のため、リソース制約のあるエッジデバイスにデプロイするのは難しい。
モデル性能を維持しつつ,計算コストとメモリコストを大幅に削減する構造的適応型プルーニング(SAAP)を提案する。
論文 参考訳(メタデータ) (2024-12-19T18:08:04Z) - CSL: Class-Agnostic Structure-Constrained Learning for Segmentation
Including the Unseen [62.72636247006293]
クラス非依存構造制約学習(Class-Agnostic Structure-Constrained Learning)は、既存のメソッドと統合可能なプラグインフレームワークである。
OODオブジェクトセグメンテーションを強化するソフトアサインとマスク分割手法を提案する。
実証的な評価は、OODセグメンテーション、ZS3、DAセグメンテーションにまたがる既存のアルゴリズムの性能を向上させるCSLの進歩を示している。
論文 参考訳(メタデータ) (2023-12-09T11:06:18Z) - Classification of Contract-Amendment Relationships [0.0]
機械学習(ML)と自然言語処理(NLP)に基づく2つの文書間の修正関係を検出する手法を提案する。
このアルゴリズムは OCR (Optical Character Recognition) と NER (Named Entity Recognition) によって事前処理された2つのPDF文書を入力とし、各文書ペアの特徴を構築する。
論文 参考訳(メタデータ) (2021-06-08T07:57:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。