論文の概要: Sentence Embeddings and High-speed Similarity Search for Fast Computer
Assisted Annotation of Legal Documents
- arxiv url: http://arxiv.org/abs/2112.11494v1
- Date: Tue, 21 Dec 2021 19:27:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 14:22:08.085189
- Title: Sentence Embeddings and High-speed Similarity Search for Fast Computer
Assisted Annotation of Legal Documents
- Title(参考訳): 高速コンピュータ支援法文書注釈のための文埋め込みと高速類似性探索
- Authors: Hannes Westermann, Jaromir Savelka, Vern R. Walker, Kevin D. Ashley,
Karim Benyekhlef
- Abstract要約: 文章を「横」にアノテートするための概念証明システムを提案する。
アプローチは、意味的に類似した文が、特定の型システムにおいて、しばしば同じラベルを持つという観察に基づいている。
- 参考スコア(独自算出の注目度): 0.5249805590164901
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human-performed annotation of sentences in legal documents is an important
prerequisite to many machine learning based systems supporting legal tasks.
Typically, the annotation is done sequentially, sentence by sentence, which is
often time consuming and, hence, expensive. In this paper, we introduce a
proof-of-concept system for annotating sentences "laterally." The approach is
based on the observation that sentences that are similar in meaning often have
the same label in terms of a particular type system. We use this observation in
allowing annotators to quickly view and annotate sentences that are
semantically similar to a given sentence, across an entire corpus of documents.
Here, we present the interface of the system and empirically evaluate the
approach. The experiments show that lateral annotation has the potential to
make the annotation process quicker and more consistent.
- Abstract(参考訳): 法的文書における文の人為的なアノテーションは、法的タスクをサポートする多くの機械学習ベースのシステムにとって重要な前提条件である。
典型的には、注釈は逐次的に、文ごとに行われ、これはしばしば時間を消費し、従って高価である。
本稿では,文を「左右」に注釈する概念実証システムを提案する。
このアプローチは、意味的に類似した文は、しばしば特定の型システムの観点から同じラベルを持つという観察に基づいている。
我々は、文書のコーパス全体にわたって、ある文にセマンティックに類似した文を、注釈者が素早く閲覧し、注釈を付けるのにこの観察を利用する。
本稿では,システムのインターフェースを示し,そのアプローチを実証的に評価する。
実験の結果,横アノテーションはアノテーション処理をより迅速かつ一貫性のあるものにする可能性が示唆された。
関連論文リスト
- RankCSE: Unsupervised Sentence Representations Learning via Learning to
Rank [54.854714257687334]
本稿では,教師なし文表現学習のための新しい手法であるRangCSEを提案する。
コントラスト学習を伴うランキング一貫性とランキング蒸留を統一された枠組みに組み込む。
セマンティックテキスト類似性(STS)と転送タスク(TR)の両方について、広範な実験が実施されている。
論文 参考訳(メタデータ) (2023-05-26T08:27:07Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - Improving Sentence Similarity Estimation for Unsupervised Extractive
Summarization [21.602394765472386]
教師なし抽出要約における文類似度推定を改善するための2つの新しい手法を提案する。
我々は、比較学習を用いて、同じ文書の文が異なる文書の文とよりよく似ているという文書レベルの目的を最適化する。
また、相互学習を用いて文類似度推定と文サリエンスランキングの関係を高める。
論文 参考訳(メタデータ) (2023-02-24T07:10:33Z) - Same or Different? Diff-Vectors for Authorship Analysis [78.83284164605473]
古典的な著作物分析において、特徴ベクトルは文書を表し、特徴の値は文書中の特徴の相対周波数(関数の増大)を表し、クラスラベルは文書の著者を表す。
筆者らの実験は共著者検証,著者検証,クローズドセットの著者帰属に取り組んでおり,DVは自然に第1の問題を解くのに向いているが,第2と第3の問題を解くための2つの新しい方法も提供している。
論文 参考訳(メタデータ) (2023-01-24T08:48:12Z) - Court Judgement Labeling on HKLII [17.937279252256594]
HKLIIは香港で10年間、法的文書の保管所として機能してきた。
当社のチームは、NLPテクニックをWebサイトに取り入れて、よりインテリジェントにすることを目指しています。
論文 参考訳(メタデータ) (2022-08-03T06:32:16Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Improving Document-Level Sentiment Classification Using Importance of
Sentences [3.007949058551534]
深層ニューラルネットワークに基づく文書レベルの文分類モデルを提案する。
映画レビュー,ホテルレビュー,レストランレビュー,音楽レビューなど,4つの異なる領域における感情データセットを用いた実験を行った。
実験の結果,文書レベルの感情分類タスクでは文の重要性を考慮すべきであることがわかった。
論文 参考訳(メタデータ) (2021-03-09T01:29:08Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - Paragraph-level Commonsense Transformers with Recurrent Memory [77.4133779538797]
物語からコヒーレントなコモンセンス推論を生成するために,段落レベルの情報を含む談話認識モデルを訓練する。
以上の結果から,PARA-COMETは文レベルのベースライン,特にコヒーレントかつ新規な推論に優れていた。
論文 参考訳(メタデータ) (2020-10-04T05:24:12Z) - Artemis: A Novel Annotation Methodology for Indicative Single Document
Summarization [27.55699431297619]
アルテミス(Artemis)は、複数のドメインから文書の指示的な要約を生成する新しい階層的アノテーションプロセスである。
なぜなら、裁判官は文の1つに重要な判断を下す際に、文書中のすべての文を見る必要がないからである。
我々は532の注釈付き文書のサンプルセットについて分析と実験結果を示す。
論文 参考訳(メタデータ) (2020-05-05T13:38:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。