論文の概要: Metadata Extraction Leveraging Large Language Models
- arxiv url: http://arxiv.org/abs/2510.19334v1
- Date: Wed, 22 Oct 2025 07:56:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.330774
- Title: Metadata Extraction Leveraging Large Language Models
- Title(参考訳): 大規模言語モデルを活用したメタデータ抽出
- Authors: Cuize Han, Sesh Jalagam,
- Abstract要約: 本稿では,契約レビューのための大規模言語モデルによるメタデータ抽出の包括的実装について述べる。
法律条項の特定において高い精度を維持しつつ,契約審査に伴う時間と費用の削減を約束する。
- 参考スコア(独自算出の注目度): 0.7920932520852374
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The advent of Large Language Models has revolutionized tasks across domains, including the automation of legal document analysis, a critical component of modern contract management systems. This paper presents a comprehensive implementation of LLM-enhanced metadata extraction for contract review, focusing on the automatic detection and annotation of salient legal clauses. Leveraging both the publicly available Contract Understanding Atticus Dataset (CUAD) and proprietary contract datasets, our work demonstrates the integration of advanced LLM methodologies with practical applications. We identify three pivotal elements for optimizing metadata extraction: robust text conversion, strategic chunk selection, and advanced LLM-specific techniques, including Chain of Thought (CoT) prompting and structured tool calling. The results from our experiments highlight the substantial improvements in clause identification accuracy and efficiency. Our approach shows promise in reducing the time and cost associated with contract review while maintaining high accuracy in legal clause identification. The results suggest that carefully optimized LLM systems could serve as valuable tools for legal professionals, potentially increasing access to efficient contract review services for organizations of all sizes.
- Abstract(参考訳): 大規模言語モデルの出現は、現代の契約管理システムの重要なコンポーネントである法的文書分析の自動化を含む、ドメイン間のタスクに革命をもたらした。
本稿では,契約審査のためのLCM強化メタデータ抽出の包括的実装について述べる。
公開されているContract Understanding Atticus Dataset(CUAD)とプロプライエタリなコントラクトデータセットの両方を活用して、我々の研究は、高度なLCM方法論と実用的なアプリケーションとの統合を実証しています。
メタデータ抽出を最適化するための3つの重要な要素を同定する: 頑健なテキスト変換、戦略的なチャンク選択、および高度なLCM固有の技術、例えば、Chain of Thought(CoT)のプロンプトや構造化ツール呼び出しである。
実験の結果,節の識別精度と効率が大幅に向上したことが明らかとなった。
提案手法は,法定条項識別の精度を維持しつつ,契約審査に伴う時間とコストの削減を約束するものである。
その結果,LLMシステムは法律専門家にとって貴重なツールであり,あらゆる規模の組織を対象とした効率的な契約審査サービスへのアクセスが増加する可能性が示唆された。
関連論文リスト
- On LLM-Assisted Generation of Smart Contracts from Business Processes [0.08192907805418582]
大規模言語モデル(LLM)は、ソフトウェアの生成方法の現実を変えました。
本稿では、ビジネスプロセス記述からスマートコントラクトコードを生成するためのLCMの使用について探索的研究を行う。
以上の結果から,LLMの性能はスマートコントラクト開発に必要な信頼性に劣ることがわかった。
論文 参考訳(メタデータ) (2025-07-30T20:39:45Z) - SCAN: Structured Capability Assessment and Navigation for LLMs [54.54085382131134]
textbfSCAN (Structured Capability Assessment and Navigation) は、大規模言語モデルの詳細な特徴付けを可能にする実用的なフレームワークである。
SCANには4つの重要なコンポーネントが含まれている。
TaxBuilder – クエリから機能表示タグを抽出して階層的な分類構造を構築する。
RealMixは、各機能タグに対する十分な評価データを保証するクエリ合成とフィルタリングのメカニズムである。
PC$2$ベースのLCM-as-a-Judge法は従来のLCM-as-a-Judge法と比較して大幅に精度が向上する
論文 参考訳(メタデータ) (2025-05-10T16:52:40Z) - SynLexLM: Scaling Legal LLMs with Synthetic Data and Curriculum Learning [0.0]
法的なLLMを効率的に事前訓練するための新しいアプローチであるSynLexLMを紹介する。
本手法では, 簡単な法的テキストから複雑なクエリへ, 合成データ拡張と組み合わせて, カリキュラム学習を採用する。
予備的な作業は、法的推論を反映した合成QAペアの生成である。
論文 参考訳(メタデータ) (2025-04-26T01:42:22Z) - Training Large Recommendation Models via Graph-Language Token Alignment [53.3142545812349]
本稿では,グラフ言語トークンアライメントによる大規模推薦モデルのトレーニングを行う新しいフレームワークを提案する。
インタラクショングラフからアイテムとユーザノードを事前訓練されたLLMトークンにアライメントすることで、GLTAはLLMの推論能力を効果的に活用する。
さらに、エンドツーエンドのアイテム予測のためのトークンアライメントを最適化するために、GLLM(Graph-Language Logits Matching)を導入する。
論文 参考訳(メタデータ) (2025-02-26T02:19:10Z) - AvaTaR: Optimizing LLM Agents for Tool Usage via Contrastive Reasoning [93.96463520716759]
大規模言語モデル(LLM)エージェントは、精度と幻覚を高めるために外部ツールと知識を活用する際、印象的な能力を示した。
本稿では、LLMエージェントを最適化して提供されたツールを効果的に活用し、与えられたタスクのパフォーマンスを向上させる新しい自動化フレームワークであるAvaTaRを紹介する。
論文 参考訳(メタデータ) (2024-06-17T04:20:02Z) - CRAFT: Customizing LLMs by Creating and Retrieving from Specialized
Toolsets [75.64181719386497]
大規模言語モデル(LLM)のためのツール作成・検索フレームワークであるCRAFTを提案する。
タスク用に特別にキュレートされたツールセットを作成し、複雑なタスクを解決する能力を高めるためにこれらのセットからツールを取得するコンポーネントをLLMに装備する。
本手法はフレキシブルに設計されており,既製のLCMを細かな調整なしに未確認領域やモダリティに適応するためのプラグアンドプレイ方式を提供する。
論文 参考訳(メタデータ) (2023-09-29T17:40:26Z) - Automating construction contract review using knowledge graph-enhanced large language models [1.50580995941543]
本稿では,大規模言語モデル (LLMs) と知識グラフ (KGs) を統合することで,自動契約リスク識別の精度と解釈可能性を高めることができるかを検討する。
LLMとNested Contract Knowledge Graph(NCKG)を統合し,Graph Retrieval-Augmented Generation(GraphRAG)フレームワークを用いて,契約知識の検索と推論を行う。
国際的なEPC契約に基づいてテストし、ベースラインモデルよりも正確なリスク評価と解釈可能なリスクサマリーを実現する。
論文 参考訳(メタデータ) (2023-09-21T14:53:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。