論文の概要: Unlocking Legal Knowledge with Multi-Layered Embedding-Based Retrieval
- arxiv url: http://arxiv.org/abs/2411.07739v1
- Date: Tue, 12 Nov 2024 12:03:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-13 13:17:36.960014
- Title: Unlocking Legal Knowledge with Multi-Layered Embedding-Based Retrieval
- Title(参考訳): 多層埋め込みに基づく検索による法的知識のアンロック
- Authors: João Alberto de Oliveira Lima,
- Abstract要約: 本稿では,法的および立法的テキストに対する多層埋め込みに基づく検索手法を提案する。
提案手法は,検索型拡張生成システムに正確な応答を提供することによって,様々な情報要求を満たす。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This work addresses the challenge of capturing the complexities of legal knowledge by proposing a multi-layered embedding-based retrieval method for legal and legislative texts. Creating embeddings not only for individual articles but also for their components (paragraphs, clauses) and structural groupings (books, titles, chapters, etc), we seek to capture the subtleties of legal information through the use of dense vectors of embeddings, representing it at varying levels of granularity. Our method meets various information needs by allowing the Retrieval Augmented Generation system to provide accurate responses, whether for specific segments or entire sections, tailored to the user's query. We explore the concepts of aboutness, semantic chunking, and inherent hierarchy within legal texts, arguing that this method enhances the legal information retrieval. Despite the focus being on Brazil's legislative methods and the Brazilian Constitution, which follow a civil law tradition, our findings should in principle be applicable across different legal systems, including those adhering to common law traditions. Furthermore, the principles of the proposed method extend beyond the legal domain, offering valuable insights for organizing and retrieving information in any field characterized by information encoded in hierarchical text.
- Abstract(参考訳): 本研究は, 法的および立法的テキストに対する多層埋め込みに基づく検索手法を提案することにより, 法的知識の複雑さを捉えるという課題に対処する。
個々の記事だけでなく,その構成要素(パラグラフ,節)や構造的グループ化(書籍,タイトル,章など)のために埋め込みを作成することで,埋め込みの密接なベクトルを用いて法情報の微妙な微妙さを捉え,それを様々な粒度で表現することを目指す。
提案手法は,特定のセグメントに対して,あるいは全セクションに対して,ユーザのクエリに合わせて正確な応答を提供できるようにすることで,さまざまな情報ニーズを満たす。
本稿では,本手法が法的情報検索を促進させるとして,法文における意味,意味的チャンキング,本質的階層の概念について考察する。
市民法の伝統に従っているブラジルの立法法とブラジル憲法に焦点が当てられているにもかかわらず、我々の発見は原則として、共通の法律の伝統に忠実な人々を含む様々な法律体系に適用されるべきである。
さらに、提案手法の原理は、法域を超えて、階層的なテキストで符号化された情報によって特徴づけられるあらゆる分野における情報の整理と検索のための貴重な洞察を提供する。
関連論文リスト
- A Multi-Source Heterogeneous Knowledge Injected Prompt Learning Method for Legal Charge Prediction [3.52209555388364]
本稿では,ケース記述をモデル化するための素早い学習フレームワークに基づく手法を提案する。
我々は,法的知識ベース,会話型LLM,法的記事から多元的外部知識を活用する。
提案手法は,CAIL-2018の法定電荷予測データセットとして最大である。
論文 参考訳(メタデータ) (2024-08-05T04:53:17Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - A Deep Learning-Based System for Automatic Case Summarization [2.9141777969894966]
本稿では,効率的な自動ケース要約のためのディープラーニングに基づくシステムを提案する。
このシステムは、長い訴訟文書の簡潔かつ関連する要約を生成するための教師なしおよび教師なしの両方の方法を提供する。
今後の研究は、要約技術の改良と、我々の手法を他の種類の法的テキストに適用することに焦点を当てる。
論文 参考訳(メタデータ) (2023-12-13T01:18:10Z) - Large Language Models and Explainable Law: a Hybrid Methodology [44.99833362998488]
規則に基づく法体系のアクセシビリティ, 利用, 説明可能性を高めるため, LLMを提唱する。
ルールベースシステムによる説明を翻訳するために, LLM の利用の可能性を探るため, 提案手法を開発した。
論文 参考訳(メタデータ) (2023-11-20T14:47:20Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - Constructing a Knowledge Graph for Vietnamese Legal Cases with
Heterogeneous Graphs [5.168558598888541]
本稿では,法律事例文書と関連する法律に関する知識グラフ構築手法を提案する。
当社のアプローチは,データクローリング,情報抽出,知識グラフ展開という3つの主要なステップで構成されています。
論文 参考訳(メタデータ) (2023-09-16T18:31:47Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - Computing and Exploiting Document Structure to Improve Unsupervised
Extractive Summarization of Legal Case Decisions [7.99536002595393]
文書構造を利用するために再重み付けアルゴリズムを用いる教師なしグラフベースのランキングモデルを提案する。
カナディアン・ロー・ケース・ロー・データセットの結果,提案手法がいくつかの強い基準線より優れていることが示された。
論文 参考訳(メタデータ) (2022-11-06T22:20:42Z) - Entity Graph Extraction from Legal Acts -- a Prototype for a Use Case in
Policy Design Analysis [52.77024349608834]
本稿では,公共政策設計の定量的研究を支援するために開発されたプロトタイプについて述べる。
本システムの目的は,法律文書の収集プロセスの自動化,機関文法の注釈付け,ハイパーグラフによる重要機関間の相互関係の分析である。
論文 参考訳(メタデータ) (2022-09-02T10:57:47Z) - Legal Search in Case Law and Statute Law [12.697393184074457]
本稿では,典型的法的文書収集の文脈において,文書の相互関連性を識別する手法について述べる。
本稿では、教師あり教師なし学習を含む一般化言語モデルの使用状況について概観する。
論文 参考訳(メタデータ) (2021-08-23T12:51:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。