論文の概要: Court Judgement Labeling on HKLII
- arxiv url: http://arxiv.org/abs/2208.04225v1
- Date: Wed, 3 Aug 2022 06:32:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-14 18:12:13.875995
- Title: Court Judgement Labeling on HKLII
- Title(参考訳): HKLIIに関する裁判所判決
- Authors: Yuchen Liu, Ben Kao, Michael MK Cheung, Tien-Hsuan Wu
- Abstract要約: HKLIIは香港で10年間、法的文書の保管所として機能してきた。
当社のチームは、NLPテクニックをWebサイトに取り入れて、よりインテリジェントにすることを目指しています。
- 参考スコア(独自算出の注目度): 17.937279252256594
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: HKLII has served as the repository of legal documents in Hong Kong for a
decade. Our team aims to incorporate NLP techniques into the website to make it
more intelligent. To achieve this goal, this individual task is to label each
court judgement by some tags. These tags are legally important to summarize the
judgement and can guide the user to similar judgements. We introduce a
heuristic system to solve the problem, which starts from Aspect-driven Topic
Modeling and uses Dependency Parsing and Constituency Parsing for phrase
generation. We also construct a legal term tree for Hong Kong and implemented a
sentence simplification module to support the system. Finally, we propose a
similar document recommendation algorithm based on the generated tags. It
enables users to find similar documents based on a few selected aspects rather
than the whole passage. Experiment results show that this system is the best
approach for this specific task. It is better than simple term extraction
method in terms of summarizing the document, and the recommendation algorithm
is more effective than full-text comparison approaches. We believe that the
system has huge potential in law as well as in other areas.
- Abstract(参考訳): HKLIIは香港で10年間、法的文書の保管所として機能してきた。
弊社のチームは、NLPの技術をWebサイトに取り入れて、よりインテリジェントにすることを目指している。
この目標を達成するために、この個々のタスクは、各裁判所の判断をいくつかのタグでラベル付けることである。
これらのタグは、判断を要約するために法的に重要であり、ユーザに同様の判断を導くことができる。
本稿では,アスペクト駆動のトピックモデリングから始まって,句生成に係り受け解析と構成構文解析を用いるヒューリスティックシステムを提案する。
また,香港の法律用語ツリーを構築し,そのシステムをサポートする文単純化モジュールを実装した。
最後に,生成タグに基づく類似文書推薦アルゴリズムを提案する。
パス全体ではなく、いくつかの選択された側面に基づいて、ユーザが類似したドキュメントを見つけることができる。
実験結果から,本システムは特定のタスクに最適であることがわかった。
文書の要約という観点からは,単純な用語抽出法よりも優れており,全文比較法よりも推奨アルゴリズムの方が有効である。
我々は、このシステムは法律だけでなく他の分野でも大きな可能性を秘めていると信じている。
関連論文リスト
- Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - DAPR: A Benchmark on Document-Aware Passage Retrieval [57.45793782107218]
我々は,このタスクemphDocument-Aware Passage Retrieval (DAPR)を提案する。
State-of-The-Art(SoTA)パスレトリバーのエラーを分析しながら、大きなエラー(53.5%)は文書コンテキストの欠如に起因する。
提案するベンチマークにより,検索システムの開発・比較を今後行うことができる。
論文 参考訳(メタデータ) (2023-05-23T10:39:57Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - Rhetorical Role Labeling of Legal Documents using Transformers and Graph
Neural Networks [1.290382979353427]
本稿では,SemEval Task 6の一部として,インドの裁判所判決における修辞的役割のラベル付け作業を行うためのアプローチについて述べる。
論文 参考訳(メタデータ) (2023-05-06T17:04:51Z) - Precise Zero-Shot Dense Retrieval without Relevance Labels [60.457378374671656]
仮説文書埋め込み(英: hypothetical Document Embeddings, HyDE)は、ゼロショット高密度検索システムである。
我々は,HyDEが最先端の非教師付き高密度検索器であるContrieverを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2022-12-20T18:09:52Z) - Text Summarization with Oracle Expectation [88.39032981994535]
抽出要約は、文書の中で最も重要な文を識別し、連結することによって要約を生成する。
ほとんどの要約データセットは、文書文が要約に値するかどうかを示す金のラベルを持っていない。
本稿では,ソフトな予測に基づく文ラベルを生成する,シンプルで効果的なラベル付けアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-26T14:10:08Z) - An Efficient Coarse-to-Fine Facet-Aware Unsupervised Summarization
Framework based on Semantic Blocks [27.895044398724664]
教師なし長文要約のためのC2F-FAR(Coarse-to-Fine Facet-Aware Ranking)フレームワークを提案する。
粗いレベルでは、文書をファセット対応のセマンティックブロックに分割し、無意味なブロックをフィルタリングする新しいセグメントアルゴリズムを提案する。
詳細な段階において,各ブロックで有能な文を選択し,選択した文から最終要約を抽出する。
論文 参考訳(メタデータ) (2022-08-17T12:18:36Z) - An Evaluation Framework for Legal Document Summarization [1.9709122688953327]
法実務者は、土地紛争、汚職など、様々な分野の実務について、多くの長い訴訟手続を経なければならない。
これらの文書を要約し、事件のカテゴリーに合致する意図のある句を含むことを保証することが重要である。
本稿では, BLEU, ROUGE-Lなどの他の自動指標と比較して, 人間の評価との整合性を示す自動意図ベース要約尺度を提案する。
論文 参考訳(メタデータ) (2022-05-17T16:42:03Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Aspect-based Document Similarity for Research Papers [4.661692753666685]
文書分類タスクのペア化によってアスペクト情報との類似性を拡張する。
研究論文のアスペクトベースの文書類似性を評価する。
以上の結果から,SciBERTは最高の演奏システムであることがわかった。
論文 参考訳(メタデータ) (2020-10-13T13:51:21Z) - Building Legal Case Retrieval Systems with Lexical Matching and
Summarization using A Pre-Trained Phrase Scoring Model [1.9275428660922076]
本研究は,2019年法律情報抽出・販売コンペティションの判例検索課題に対処する手法を提案する。
我々のアプローチは、要約が検索に重要であるという考え方に基づいている。
コンペティションのベンチマークにおけるタスクの最先端の結果を達成しました。
論文 参考訳(メタデータ) (2020-09-29T15:10:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。