論文の概要: uOttawa at LegalLens-2024: Transformer-based Classification Experiments
- arxiv url: http://arxiv.org/abs/2410.21139v1
- Date: Mon, 28 Oct 2024 15:42:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:14:21.030477
- Title: uOttawa at LegalLens-2024: Transformer-based Classification Experiments
- Title(参考訳): uOttawa at LegalLens-2024: Transformer による分類実験
- Authors: Nima Meghdadi, Diana Inkpen,
- Abstract要約: 本稿では,LegalLens-2024共有タスクに使用される手法について述べる。
それは、構造化されていないテキストデータ内の法的違反を検出し、これらの違反を潜在的に影響のある個人と関連付けることに焦点を当てた。
L-NERサブタスクは86.3%,L-NLIサブタスクは88.25%であった。
- 参考スコア(独自算出の注目度): 7.710171464368831
- License:
- Abstract: This paper presents the methods used for LegalLens-2024 shared task, which focused on detecting legal violations within unstructured textual data and associating these violations with potentially affected individuals. The shared task included two subtasks: A) Legal Named Entity Recognition (L-NER) and B) Legal Natural Language Inference (L-NLI). For subtask A, we utilized the spaCy library, while for subtask B, we employed a combined model incorporating RoBERTa and CNN. Our results were 86.3% in the L-NER subtask and 88.25% in the L-NLI subtask. Overall, our paper demonstrates the effectiveness of transformer models in addressing complex tasks in the legal domain. The source code for our implementation is publicly available at https://github.com/NimaMeghdadi/uOttawa-at-LegalLens-2024-Transformer-based-Classification
- Abstract(参考訳): 本稿では,非構造化テキストデータ中の法的違反を検知し,これらの違反を潜在的に影響のある個人に関連付けることを目的とした,LegalLens-2024共有タスクの手法を提案する。
共有タスクには2つのサブタスクが含まれていた: A) 法的な名前付きエンティティ認識(L-NER) と B) 法的な自然言語推論(L-NLI)。
サブタスクAではpaCyライブラリを使用し,サブタスクBではRoBERTaとCNNを組み合わせたモデルを併用した。
L-NERサブタスクは86.3%,L-NLIサブタスクは88.25%であった。
本論文は,法域における複雑な課題に対処するトランスフォーマーモデルの有効性を概説する。
実装のソースコードはhttps://github.com/NimaMeghdadi/uOttawa-at-LegalLens-2024-Transformer-based-Classificationで公開されています。
関連論文リスト
- Bonafide at LegalLens 2024 Shared Task: Using Lightweight DeBERTa Based Encoder For Legal Violation Detection and Resolution [1.2283121128307906]
我々は、構造化されていないテキストデータ内の法的違反を検出するための2つのシステム、名前付きエンティティ解決(NER)と自然言語推論(NLI)を提案する。
どちらのシステムも軽量のDeBERTaベースのエンコーダで、LCMのベースラインを上回っている。
論文 参考訳(メタデータ) (2024-10-30T12:42:38Z) - Bayesian scaling laws for in-context learning [72.17734205418502]
In-context Learning(ICL)は、言語モデルをトレーニング更新なしで複雑なタスクを実行するための強力なテクニックである。
我々は、ICCがベイズ学習者を近似し、ICCのための新しいベイズスケーリング法則のファミリーを開発することを示す。
論文 参考訳(メタデータ) (2024-10-21T21:45:22Z) - LegalLens Shared Task 2024: Legal Violation Identification in Unstructured Text [7.839638824275218]
本稿では,2つのサブタスクにまたがって,テキスト中の法的違反を検出することに焦点を当てた。
トップパフォーマンスチームはベースラインよりもNERが7.11%改善し、NLIは5.7%改善した。
論文 参考訳(メタデータ) (2024-10-15T21:02:44Z) - Mitigating Copy Bias in In-Context Learning through Neuron Pruning [74.91243772654519]
大規模言語モデル(LLM)は、コンテキスト内学習能力に目を見張るものはほとんどない。
それらは、基礎となるパターンを学ぶ代わりに、提供された例から回答をコピーする。
このような複写バイアスを軽減するための,新しい簡易な手法を提案する。
論文 参考訳(メタデータ) (2024-10-02T07:18:16Z) - InternLM-Law: An Open Source Chinese Legal Large Language Model [72.2589401309848]
InternLM-Lawは、中国法に関する様々な法的クエリに対処するための特殊なLLMである。
われわれは、中国法域に100万以上のクエリを含むデータセットを慎重に構築する。
InternLM-LawはLawBench上で最高の平均性能を達成し、20サブタスク中13サブタスクでGPT-4を含む最先端モデルを上回っている。
論文 参考訳(メタデータ) (2024-06-21T06:19:03Z) - NeCo@ALQAC 2023: Legal Domain Knowledge Acquisition for Low-Resource
Languages through Data Enrichment [2.441072488254427]
本稿では,ベトナムのテキスト処理タスクに対するNeCo Teamのソリューションを,ALQAC 2023(Automated Legal Question Answering Competition 2023)で紹介する。
法的な文書検索タスクでは,類似度ランキングと深層学習モデルを組み合わせた手法が採用されているが,第2の課題では,異なる質問タイプを扱うための適応的手法が提案されている。
提案手法は, 競争の両課題において, 法的分野における質問応答システムの潜在的メリットと有効性を示す, 卓越した結果を達成している。
論文 参考訳(メタデータ) (2023-09-11T14:43:45Z) - SemEval 2023 Task 6: LegalEval - Understanding Legal Texts [2.172613863157655]
法律文書の処理と自動理解のためのNLPベースの技術を開発する必要がある。
Task-A (Rhetorical Roles Labeling) は、法的文書を意味的に一貫性のある単位に自動的に構造化することを目的としており、Task-B (Legal Named Entity Recognition) は、法的文書内の関連エンティティを識別する、Task-C (Court Judgement Prediction with Explanation) は、訴訟の結果を自動的に予測する可能性を探る。
それぞれのサブタスクにおいて、提案されたシステムはベースラインよりも優れているが、多くのスコープがある。
論文 参考訳(メタデータ) (2023-04-19T10:28:32Z) - Falsesum: Generating Document-level NLI Examples for Recognizing Factual
Inconsistency in Summarization [63.21819285337555]
高品質なタスク指向の例でトレーニングデータを拡張した場合,NLIモデルがこのタスクに有効であることを示す。
我々は、制御可能なテキスト生成モデルを利用して、人間の注釈付き要約を摂動させるデータ生成パイプラインであるFalsesumを紹介した。
本研究では,Falsesumを付加したNLIデータセットでトレーニングしたモデルにより,4つのベンチマークを用いて,要約における事実整合性を検出することにより,最先端のパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2022-05-12T10:43:42Z) - Visual Transformer for Task-aware Active Learning [49.903358393660724]
プールベースのアクティブラーニングのための新しいパイプラインを提案する。
提案手法は,学習中に使用可能なアンラベリング例を利用して,ラベル付き例との相関関係を推定する。
ビジュアルトランスフォーマーは、ラベル付き例と非ラベル付き例の間の非ローカルビジュアル概念依存性をモデル化する。
論文 参考訳(メタデータ) (2021-06-07T17:13:59Z) - Legal Document Classification: An Application to Law Area Prediction of
Petitions to Public Prosecution Service [6.696983725360808]
本稿では,NLPを用いたテキスト分類手法を提案する。
我々の主な目標は、各分野の法律に請願書を割り当てるプロセスを自動化することです。
最高の結果は、ドメイン固有のコーパスとリカレントニューラルネットワークアーキテクチャに基づいてトレーニングされたWord2Vecの組み合わせで得られる。
論文 参考訳(メタデータ) (2020-10-13T18:05:37Z) - Local Additivity Based Data Augmentation for Semi-supervised NER [59.90773003737093]
名前付きエンティティ認識(NER)は、深層言語理解の第1段階の1つである。
現在のNERモデルは、人間の注釈付きデータに大きく依存している。
半教師付きNERのための局所付加性に基づくデータ拡張法(LADA)を提案する。
論文 参考訳(メタデータ) (2020-10-04T20:46:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。