論文の概要: Methods for Computing Legal Document Similarity: A Comparative Study
- arxiv url: http://arxiv.org/abs/2004.12307v1
- Date: Sun, 26 Apr 2020 08:26:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 13:08:38.561531
- Title: Methods for Computing Legal Document Similarity: A Comparative Study
- Title(参考訳): 法的文書の類似性を計算する方法:比較研究
- Authors: Paheli Bhattacharya, Kripabandhu Ghosh, Arindam Pal, Saptarshi Ghosh
- Abstract要約: 同様の法的文書を見つけることは、法律情報検索分野において重要かつ困難な課題である。
本稿では,文献間の類似度を測定する方法として,先行引用ネットワークの分析と,テキスト内容の類似度測定に基づく類似度の測定の2つの方法を提案する。
これまでに検討されていない2つの新しい類似性計算手法(テキストベースとネットワーク埋め込みに基づくもの)について検討する。
- 参考スコア(独自算出の注目度): 9.007583099505954
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computing similarity between two legal documents is an important and
challenging task in the domain of Legal Information Retrieval. Finding similar
legal documents has many applications in downstream tasks, including prior-case
retrieval, recommendation of legal articles, and so on. Prior works have
proposed two broad ways of measuring similarity between legal documents -
analyzing the precedent citation network, and measuring similarity based on
textual content similarity measures. But there has not been a comprehensive
comparison of these existing methods on a common platform. In this paper, we
perform the first systematic analysis of the existing methods. In addition, we
explore two promising new similarity computation methods - one text-based and
the other based on network embeddings, which have not been considered till now.
- Abstract(参考訳): 2つの法律文書間の類似性を計算することは、法情報検索分野において重要かつ困難な課題である。
同様の法的文書を見つけるには、先行事例の検索、法的記事の推薦など、下流の業務に多くの応用がある。
先行研究は,先行引用ネットワークを解析する法律文書の類似度を測定する方法と,テキスト内容の類似度に基づく類似度を測定する方法の2つを提案している。
しかし、これらの既存の手法を共通のプラットフォームで包括的に比較した例はない。
本稿では,既存手法の最初の系統解析を行う。
さらに,これまでに検討されていない,テキストベースとネットワーク埋め込みに基づく2つの新しい類似性計算手法についても検討する。
関連論文リスト
- Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - Co-Matching: Towards Human-Machine Collaborative Legal Case Matching [69.21196368715144]
合法的なケースマッチングが成功するには、法的実践者の暗黙の知識が必要であり、機械に言語化してエンコードすることは困難である。
本稿では,協調マッチングフレームワークであるCo-Matchingを提案する。
本研究は,人間と機械の協調作業における先駆的な取り組みであり,今後の協調マッチング研究のマイルストーンとなる。
論文 参考訳(メタデータ) (2024-05-16T16:50:31Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - Analysing the Resourcefulness of the Paragraph for Precedence Retrieval [0.1761604268733064]
我々は,優先検索の性能向上のための判断の類似性を把握する上で,段落レベルの情報の資源性について分析した。
その結果,数段の相互作用で判断の類似性を捉えることができ,基本文書レベルの方法よりも識別力が向上することが判明した。
論文 参考訳(メタデータ) (2023-07-29T08:55:38Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Specialized Document Embeddings for Aspect-based Similarity of Research
Papers [4.661692753666685]
アスペクトベースの類似性は、アスペクト固有の埋め込み空間における古典的ベクトル類似性問題として扱う。
文書は単一の汎用的な埋め込みではなく、複数の専門的な埋め込みとして表現する。
当社のアプローチは、暗黙の偏見から生じる潜在的なリスクを明確化することで軽減します。
論文 参考訳(メタデータ) (2022-03-28T07:35:26Z) - PAIR: Leveraging Passage-Centric Similarity Relation for Improving Dense
Passage Retrieval [87.68667887072324]
本稿では,クエリ中心とPAssage中心のsmilarity Relations(PAIR)を併用した新しい手法を提案する。
本稿では,2種類の類似性関係の形式的定式化を導入することにより,3つの主要な技術的貢献を行う。
MSMARCOとNatural Questionsの両方のデータセットにおいて、従来の最先端モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2021-08-13T02:07:43Z) - Efficient Clustering from Distributions over Topics [0.0]
本稿では,類似度関数を計算可能な文書の小さなサブセットを識別する手段として,コレクション内の文書上のトピックモデリングアルゴリズムの結果に依存するアプローチを提案する。
このアプローチは、科学出版分野における類似文書の特定において、有望な結果を得ることが証明されている。
論文 参考訳(メタデータ) (2020-12-15T10:52:19Z) - Aspect-based Document Similarity for Research Papers [4.661692753666685]
文書分類タスクのペア化によってアスペクト情報との類似性を拡張する。
研究論文のアスペクトベースの文書類似性を評価する。
以上の結果から,SciBERTは最高の演奏システムであることがわかった。
論文 参考訳(メタデータ) (2020-10-13T13:51:21Z) - Hier-SPCNet: A Legal Statute Hierarchy-based Heterogeneous Network for
Computing Legal Case Document Similarity [9.007583099505954]
ケースドキュメンテーション間(PCNet)における先行的引用ネットワークとみなす先行的ネットワークベース類似性手法
我々は,PCNetを法規の階層構造で拡張し,ヘテロジニアスネットワークのHier-SPCNetを構築することを提案する。
インド最高裁判所の判例文書に対する実験により、提案した異種ネットワークは文書の類似性推定を著しく向上させることができることが示された。
論文 参考訳(メタデータ) (2020-07-07T06:30:46Z) - Fast(er) Reconstruction of Shredded Text Documents via Self-Supervised
Deep Asymmetric Metric Learning [62.34197797857823]
細断文書の自動復元における中心的な問題は、細断文書の相互互換性評価である。
本研究は,推定回数を線形にスケールするペアワイド互換性を測るスケーラブルな深層学習手法を提案する。
提案手法は,505個のシュレッダーを持つテストインスタンスに対して,22倍の高速化を実現した最先端技術に匹敵する精度を有する。
論文 参考訳(メタデータ) (2020-03-23T03:22:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。