論文の概要: Indian Legal Text Summarization: A Text Normalisation-based Approach
- arxiv url: http://arxiv.org/abs/2206.06238v1
- Date: Mon, 13 Jun 2022 15:16:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-14 15:46:25.053644
- Title: Indian Legal Text Summarization: A Text Normalisation-based Approach
- Title(参考訳): インド法典の要約: テキスト正規化に基づくアプローチ
- Authors: Satyajit Ghosh, Mousumi Dutta, Tanaya Das
- Abstract要約: インドの裁判所制度には4つ以上のクロア事件がある。
テキスト要約のための多くの最先端モデルが、機械学習が進むにつれて登場した。
ドメインに依存しないモデルは、法的テキストではうまくいきません。
著者らは、インドの文脈で法的テキストを正規化するための方法論を提案している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the Indian court system, pending cases have long been a problem. There are
more than 4 crore cases outstanding. Manually summarising hundreds of documents
is a time-consuming and tedious task for legal stakeholders. Many
state-of-the-art models for text summarization have emerged as machine learning
has progressed. Domain-independent models don't do well with legal texts, and
fine-tuning those models for the Indian Legal System is problematic due to a
lack of publicly available datasets. To improve the performance of
domain-independent models, the authors have proposed a methodology for
normalising legal texts in the Indian context. The authors experimented with
two state-of-the-art domain-independent models for legal text summarization,
namely BART and PEGASUS. BART and PEGASUS are put through their paces in terms
of extractive and abstractive summarization to understand the effectiveness of
the text normalisation approach. Summarised texts are evaluated by domain
experts on multiple parameters and using ROUGE metrics. It shows the proposed
text normalisation approach is effective in legal texts with domain-independent
models.
- Abstract(参考訳): インドの裁判所制度では、保留中の事件は長い間問題となっていた。
特筆すべき症例は4件以上ある。
何百もの文書を手作業で要約することは、法的利害関係者にとって時間と手間のかかる作業である。
テキスト要約のための最先端モデルの多くは、機械学習が進むにつれて登場してきた。
ドメインに依存しないモデルは法的テキストではうまく機能せず、インドの法律システムのためにこれらのモデルを微調整することは、一般公開されたデータセットの欠如によって問題となる。
ドメインに依存しないモデルの性能を向上させるため,インドの文脈における法文の正規化手法を提案した。
著者らは、法的テキスト要約のための2つの最先端のドメイン非依存モデル、すなわちBARTとPEGASUSを実験した。
BARTとPEGASUSは、テキスト正規化アプローチの有効性を理解するために、抽出的および抽象的要約の観点から、そのペースを経る。
要約されたテキストは、複数のパラメーターとROUGEメトリクスを使用してドメインの専門家によって評価される。
提案手法は,ドメインに依存しないモデルを用いた法的なテキストに有効であることを示す。
関連論文リスト
- IL-TUR: Benchmark for Indian Legal Text Understanding and Reasoning [16.12863746776168]
世界中の法制度は、事例や文書の指数的な増加と共に浸水している。
法律文書を自動的に処理し理解するためのNLPおよびML技術を開発する必要がある。
本稿では, IL-TUR: Benchmark for Indian Legal Text Understanding and Reasoningを提案する。
論文 参考訳(メタデータ) (2024-07-07T14:55:04Z) - Improving Legal Judgement Prediction in Romanian with Long Text Encoders [0.8933959485129375]
我々は,LJP(Lawal Judgment Prediction)と呼ばれる訴訟の最終判決を予測するための専門的および一般モデルについて検討する。
本研究では,Transformerをベースとしたモデルのシーケンス長に拡張する手法に着目し,法的なコーパスに存在する長いドキュメントをよりよく理解する。
論文 参考訳(メタデータ) (2024-02-29T13:52:33Z) - SLJP: Semantic Extraction based Legal Judgment Prediction [0.0]
LJP(Lawal Judgment Prediction)は、像、刑期、刑期などの法的要素を推奨する司法支援システムである。
既存のインドのモデルのほとんどは、決定に影響を及ぼす事実記述(FD)に埋め込まれた意味論に十分に集中していなかった。
提案した意味抽出に基づく LJP (SLJP) モデルは, 複雑な非構造化の判例文書理解のための事前学習型変換器の利点を提供する。
論文 参考訳(メタデータ) (2023-12-13T08:50:02Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - FlairNLP at SemEval-2023 Task 6b: Extraction of Legal Named Entities
from Legal Texts using Contextual String Embeddings [0.0]
我々は、知識抽出技術、特に訴訟判決における法的実体の命名された実体抽出技術を用いている。
法文のキュレートされたデータセットに基づいて学習したモデルを用いて,シーケンスラベリングの領域におけるアートアーキテクチャのいくつかの状態を評価する。
Flair EmbeddingsでトレーニングされたBi-LSTMモデルは、最良の結果を得る。
論文 参考訳(メタデータ) (2023-06-03T19:38:04Z) - Attentive Deep Neural Networks for Legal Document Retrieval [2.4350217735794337]
法令文書検索における注意型ニューラルネットワークを用いたテキスト表現法について検討した。
長い文や記事を表すために,2つの階層型アーキテクチャを開発し,それをAttentive CNN と Paraformer と命名する。
実験結果から,知覚的ニューラル法は,データセットや言語間での検索性能において,非神経的手法を著しく上回ることがわかった。
論文 参考訳(メタデータ) (2022-12-13T01:37:27Z) - SpaText: Spatio-Textual Representation for Controllable Image Generation [61.89548017729586]
SpaTextはオープン語彙シーン制御を用いたテキスト・ツー・イメージ生成の新しい手法である。
シーン全体を記述したグローバルテキストプロンプトに加えて、ユーザはセグメンテーションマップを提供する。
現状拡散モデルである画素ベースと潜在条件ベースでの有効性を示す。
論文 参考訳(メタデータ) (2022-11-25T18:59:10Z) - Fine-tuning GPT-3 for Russian Text Summarization [77.34726150561087]
本稿では,テキストを要約するruGPT3(ruGPT3)機能について紹介し,それに対応する人文要約を用いてロシア語ニュースのコーパスを微調整する。
得られたテキストを一連のメトリクスで評価し、アーキテクチャや損失関数に付加的な変更を加えることなく、我々のソリューションが最先端のモデルの性能を上回ることができることを示す。
論文 参考訳(メタデータ) (2021-08-07T19:01:40Z) - Abstractive Summarization of Spoken and Written Instructions with BERT [66.14755043607776]
本稿では,BERTSumモデルの最初の対話型言語への応用について述べる。
我々は多種多様な話題にまたがるナレーションビデオの抽象要約を生成する。
我々は、これをインテリジェントな仮想アシスタントの機能として統合し、要求に応じて文字と音声の両方の指導内容の要約を可能にすることを想定する。
論文 参考訳(メタデータ) (2020-08-21T20:59:34Z) - ContourNet: Taking a Further Step toward Accurate Arbitrary-shaped Scene
Text Detection [147.10751375922035]
本研究では,シーンテキストの偽陽性と大規模分散を効果的に処理するContourNetを提案する。
本手法は,両方向の応答値の高い予測を出力するだけで,これらの偽陽性を効果的に抑制する。
論文 参考訳(メタデータ) (2020-04-10T08:15:23Z) - Towards Making the Most of Context in Neural Machine Translation [112.9845226123306]
我々は、これまでの研究がグローバルな文脈をはっきりと利用しなかったと論じている。
本研究では,各文の局所的文脈を意図的にモデル化する文書レベルNMTフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T03:30:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。