論文の概要: Citation Recommendation on Scholarly Legal Articles
- arxiv url: http://arxiv.org/abs/2311.05902v1
- Date: Fri, 10 Nov 2023 07:11:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-13 15:43:00.613542
- Title: Citation Recommendation on Scholarly Legal Articles
- Title(参考訳): 学術的法律記事の引用推薦
- Authors: Do\u{g}ukan Arslan, Saadet Sena Erdo\u{g}an and G\"ul\c{s}en
Eryi\u{g}it
- Abstract要約: 引用推奨は、法的領域内で、支持する議論を特定するために使用される。
BM25は、法的な引用推奨タスクの強力なベンチマークである。
微調整により、事前訓練されたモデルの性能が大幅に向上する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Citation recommendation is the task of finding appropriate citations based on
a given piece of text. The proposed datasets for this task consist mainly of
several scientific fields, lacking some core ones, such as law. Furthermore,
citation recommendation is used within the legal domain to identify supporting
arguments, utilizing non-scholarly legal articles. In order to alleviate the
limitations of existing studies, we gather the first scholarly legal dataset
for the task of citation recommendation. Also, we conduct experiments with
state-of-the-art models and compare their performance on this dataset. The
study suggests that, while BM25 is a strong benchmark for the legal citation
recommendation task, the most effective method involves implementing a two-step
process that entails pre-fetching with BM25+, followed by re-ranking with
SciNCL, which enhances the performance of the baseline from 0.26 to 0.30
MAP@10. Moreover, fine-tuning leads to considerable performance increases in
pre-trained models, which shows the importance of including legal articles in
the training data of these models.
- Abstract(参考訳): 引用推薦は、与えられたテキストに基づいて適切な引用を見つけるタスクである。
このタスクのために提案されたデータセットは、主にいくつかの科学分野で構成され、法のような中核的な分野が欠如している。
さらに、引用勧告は法的領域内で、非学術的法的記事を利用して、支持する議論を特定するために使用される。
既存の研究の限界を緩和するために,引用推薦作業のための最初の学術的法的データセットを収集する。
また,最先端モデルを用いて実験を行い,このデータセットでの性能を比較する。
この研究は、BM25は法的引用推薦タスクの強力なベンチマークであるが、最も効果的な方法は、BM25+で事前フェッチを行う2段階のプロセスを実装し、SciNCLで再ランク付けし、ベースラインの性能を0.26から0.30 MAP@10に向上させることを示唆している。
さらに、微調整により事前学習モデルの性能が著しく向上し、これらのモデルのトレーニングデータに法的項目を含めることの重要性が示されている。
関連論文リスト
- From Words to Worth: Newborn Article Impact Prediction with LLM [69.41680520058418]
本稿は,LLMの微調整機能を活用して,新たな記事の今後の影響を予測する,有望なアプローチを提案する。
LLMを微調整するための包括的なデータセットが構築されリリースされ、対応するタイトル、抽象化、TLCSI_SPを含む12,000以上のエントリが含まれている。
論文 参考訳(メタデータ) (2024-08-07T17:52:02Z) - CLERC: A Dataset for Legal Case Retrieval and Retrieval-Augmented Analysis Generation [44.67578050648625]
我々は、大規模なオープンソース法定コーパスを、情報検索(IR)と検索拡張生成(RAG)をサポートするデータセットに変換する。
このデータセットCLERCは、(1)法的な分析のための対応する引用を見つけ、(2)これらの引用のテキストを、推論目標を支持するコジェント分析にコンパイルする能力に基づいて、モデルのトレーニングと評価のために構築される。
論文 参考訳(メタデータ) (2024-06-24T23:57:57Z) - ILCiteR: Evidence-grounded Interpretable Local Citation Recommendation [31.259805200946175]
本稿では,特定の論文を推薦するための証拠を対象とする,根拠に基づく局所引用推薦タスクを紹介する。
単にレコメンデーションを出力する過去の定式化とは異なり、ICCiteRはエビデンスのリストとレコメンデーションペーパーのペアを検索する。
本研究では,エビデンスに基づく局所的引用推薦タスクのための新しいデータセットを提供し,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-03-13T17:38:05Z) - Combining topic modelling and citation network analysis to study case
law from the European Court on Human Rights on the right to respect for
private and family life [0.0]
本論は欧州人権条約第8条における欧州人権裁判所の事例法に焦点をあてる。
第8条の事例法を見つけ,整理するために,トピックモデリングと引用ネットワークの可能性を実証し,比較する。
本研究では,Aricle 8 のケース法則を根拠として,手作業で収集・注釈付けしたデータセットに組み合わせた手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-01-19T14:30:35Z) - SCITAB: A Challenging Benchmark for Compositional Reasoning and Claim
Verification on Scientific Tables [68.76415918462418]
本報告では,1.2Kの専門的な科学的クレームからなる,挑戦的な評価データセットであるSCITABについて述べる。
広範な評価を通じて、SCITABは最先端のモデルに重大な課題をもたらすことを示した。
SCITABは,表の接地,主張のあいまいさ,構成的推論など,いくつかの独特な課題を明らかにした。
論文 参考訳(メタデータ) (2023-05-22T16:13:50Z) - Tag-Aware Document Representation for Research Paper Recommendation [68.8204255655161]
本稿では,ユーザによって割り当てられたソーシャルタグに基づいて,研究論文の深い意味表現を活用するハイブリッドアプローチを提案する。
提案手法は,評価データが極めて少ない場合でも研究論文の推薦に有効である。
論文 参考訳(メタデータ) (2022-09-08T09:13:07Z) - Yes-Yes-Yes: Donation-based Peer Reviewing Data Collection for ACL
Rolling Review and Beyond [58.71736531356398]
本稿では、ピアレビューデータについて詳細な議論を行い、ピアレビューデータ収集のための倫理的・法的デシダータの概要を述べるとともに、最初の継続的な寄付ベースのデータ収集ワークフローを提案する。
本稿では、ACL Rolling Reviewにおいて、このワークフローの現在進行中の実装について報告し、新たに収集したデータから得られた最初の洞察を提供する。
論文 参考訳(メタデータ) (2022-01-27T11:02:43Z) - Evaluating Document Representations for Content-based Legal Literature
Recommendations [6.4815284696225905]
法律レコメンデータシステムは一般に、公開ベンチマークデータセットを使わずに、小規模のユーザスタディで評価される。
テキストベース(例えば、fastText, Transformers)、引用ベース(例えば、DeepWalk, Poincar'e)、ハイブリッドメソッドを評価します。
実験の結果, 平均化したfastTextワードベクトル(法定コーパスで学習した)の文書表現が最良であることがわかった。
論文 参考訳(メタデータ) (2021-04-28T15:48:19Z) - Learning Fine-grained Fact-Article Correspondence in Legal Cases [19.606628325747938]
我々は,手作業によるファクト・パーティクル対応を用いたコーパスを作成する。
我々はランダムフォレストと前提決定対の形で記事を解析する。
我々の最良のシステムは96.3%のF1スコアに達し、実用上大きな可能性を秘めている。
論文 参考訳(メタデータ) (2021-04-21T19:06:58Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。