論文の概要: Classification on Sentence Embeddings for Legal Assistance
- arxiv url: http://arxiv.org/abs/2202.02639v1
- Date: Sat, 5 Feb 2022 20:57:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-10 11:43:03.582253
- Title: Classification on Sentence Embeddings for Legal Assistance
- Title(参考訳): 法的支援のための文埋め込みの分類
- Authors: Arka Mitra
- Abstract要約: 論文はAILA2021(Artificial Intelligence for Legal Assistance)の最初の課題を解決する。
タスクは、文書を7つの事前定義されたラベルまたは「修辞的役割」のうちの1つに意味的に分割することである。
実験により、より重み付けが最高周波数のクラスに割り当てられる場合、より重み付けが低周波数のクラスに与えられる場合よりも良い結果が得られることが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Legal proceedings take plenty of time and also cost a lot. The lawyers have
to do a lot of work in order to identify the different sections of prior cases
and statutes. The paper tries to solve the first tasks in AILA2021 (Artificial
Intelligence for Legal Assistance) that will be held in FIRE2021 (Forum for
Information Retrieval Evaluation). The task is to semantically segment the
document into different assigned one of the 7 predefined labels or "rhetorical
roles." The paper uses BERT to obtain the sentence embeddings from a sentence,
and then a linear classifier is used to output the final prediction. The
experiments show that when more weightage is assigned to the class with the
highest frequency, the results are better than those when more weightage is
given to the class with a lower frequency. In task 1, the team legalNLP
obtained a F1 score of 0.22.
- Abstract(参考訳): 法的手続きには多くの時間と費用がかかります。
弁護士は、前例と法令の異なる部分を特定するために、多くの仕事をしなければならない。
本論文は,fire2021 (forum for information retrieval evaluation) で実施される aila2021 (artificial intelligence for legal assistance) における最初の課題を解決することを試みる。
タスクは、文書を7つの事前定義されたラベルまたは「修辞的役割」のうちの1つに意味的に分割することである。
本論文は、BERTを用いて文から文章埋め込みを取得し、次いで線形分類器を用いて最終予測を出力する。
実験により,高い頻度のクラスにより多くの重み付けが割り当てられた場合,より低い頻度のクラスにより多くの重み付けが与えられる場合よりも結果が良いことが示された。
第1タスクでは、NLPはF1得点の0.22を得た。
関連論文リスト
- DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - Harnessing GPT-3.5-turbo for Rhetorical Role Prediction in Legal Cases [0.16385815610837165]
訴訟の修辞的役割予測タスクにおいて,大規模な事前学習型生成変換器(GPT-3.5-turbo)を問うための一段階適用手法の総合的研究を提案する。
実例数,ラベルの定義,(ラベル付き)テキストコンテキストの提示,およびこのコンテキストに関する特定の質問が,モデルの性能に肯定的な影響を与えることを示す。
論文 参考訳(メタデータ) (2023-10-26T14:19:48Z) - RankCSE: Unsupervised Sentence Representations Learning via Learning to
Rank [54.854714257687334]
本稿では,教師なし文表現学習のための新しい手法であるRangCSEを提案する。
コントラスト学習を伴うランキング一貫性とランキング蒸留を統一された枠組みに組み込む。
セマンティックテキスト類似性(STS)と転送タスク(TR)の両方について、広範な実験が実施されている。
論文 参考訳(メタデータ) (2023-05-26T08:27:07Z) - Joint Span Segmentation and Rhetorical Role Labeling with Data
Augmentation for Legal Documents [1.4072904523937537]
法的判断の修辞的役割ラベル付けは、検索や隣接タスクにおいて重要な役割を果たす。
我々は、同じ修辞的役割ラベルを共有する複数の連続した文のスパンを識別する作業として、スパンレベルでのタスクを再構築する。
我々は半マルコフ条件ランダム場(CRF)を用いてスパンセグメンテーションとスパンラベル割り当てを共同で学習する。
論文 参考訳(メタデータ) (2023-02-13T15:28:02Z) - Same or Different? Diff-Vectors for Authorship Analysis [78.83284164605473]
古典的な著作物分析において、特徴ベクトルは文書を表し、特徴の値は文書中の特徴の相対周波数(関数の増大)を表し、クラスラベルは文書の著者を表す。
筆者らの実験は共著者検証,著者検証,クローズドセットの著者帰属に取り組んでおり,DVは自然に第1の問題を解くのに向いているが,第2と第3の問題を解くための2つの新しい方法も提供している。
論文 参考訳(メタデータ) (2023-01-24T08:48:12Z) - Exploiting Contrastive Learning and Numerical Evidence for Confusing
Legal Judgment Prediction [46.71918729837462]
訴訟の事実記述文を考慮し、法的判断予測は、事件の告訴、法律記事、刑期を予測することを目的としている。
従来の研究では、標準的なクロスエントロピー分類損失と異なる分類誤差を区別できなかった。
本稿では,モコに基づく教師付きコントラスト学習を提案する。
さらに,事前学習した数値モデルにより符号化された抽出された犯罪量による事実記述の表現をさらに強化する。
論文 参考訳(メタデータ) (2022-11-15T15:53:56Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Important Sentence Identification in Legal Cases Using Multi-Class
Classification [0.1499944454332829]
本研究は, 訴訟における重要な文を特定するために, 多クラス分類における文埋め込みの利用について検討する。
タスク固有損失関数は、カテゴリー的クロスエントロピー損失の直接的な使用によって制限される精度を改善するために定義される。
論文 参考訳(メタデータ) (2021-11-10T14:58:29Z) - Rank over Class: The Untapped Potential of Ranking in Natural Language
Processing [8.637110868126546]
我々は、現在分類を用いて対処されている多くのタスクが、実際には分類モールドに切り替わっていると論じる。
本稿では,一対のテキストシーケンスの表現を生成するトランスフォーマーネットワークからなる新しいエンドツーエンドランキング手法を提案する。
重く歪んだ感情分析データセットの実験では、ランキング結果を分類ラベルに変換すると、最先端のテキスト分類よりも約22%改善する。
論文 参考訳(メタデータ) (2020-09-10T22:18:57Z) - Aspect Classification for Legal Depositions [0.0]
責任だけでなく、出来事、事故、身体状態、治療についても知ることが重要である。
法的規定は、先延ばしの証言の一部として議論される様々な側面から成り立っている。
本手法はF1スコアの0.83を達成している。
論文 参考訳(メタデータ) (2020-09-09T18:00:15Z) - A Study on Efficiency, Accuracy and Document Structure for Answer
Sentence Selection [112.0514737686492]
本稿では,単語関連エンコーダとともに,原語階の内在的構造を活用すれば,競争的な結果が得られることを論じる。
私たちのモデルはWikiQAデータセットでトレーニングするのに9.5秒かかります。
論文 参考訳(メタデータ) (2020-03-04T22:12:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。